全球首個大規(guī)模虐童圖像數(shù)據(jù)庫!標記15萬圖像、20類信息,自動判斷圖片是否違法?
大數(shù)據(jù)文摘作品作者:Mickey 去年3月份,韓國N號房一事被曝光,黑產(chǎn)集團用裸照威逼利誘女性、幼童,對受害者實施性剝削的產(chǎn)業(yè)鏈終于公之于大眾,在Telegram上的聊天室發(fā)布這些性剝削畫面供會員觀看并收取會費,66名與N號房事件有關(guān)人士被捕,主犯也最終被判入獄。 韓國警方所掌握線索的被害女性多達74人,其中16人為未成年人,最小年齡受害者為年僅11歲的小學生。 以N號房為代表的性侵事件涉事人數(shù)之龐大,韓國并非孤例,Telegram也絕不是窩藏黑色產(chǎn)業(yè)鏈的唯一技術(shù)平臺。每天,無數(shù)無法找到來源的虐童視頻、圖片被上傳至互聯(lián)網(wǎng),并跨國進行交易。 找到這些隱藏在照片背后的犯罪分子,除了追蹤技術(shù),還需要各國法規(guī)及定則程度的一致性。目前,由于不同國家和地區(qū)對這類敏感圖像和視頻分類的方式很不相同,不同國家查獲的內(nèi)容很難共享,存在大量重復工作,受害者也非常難以定位搜尋。
標記15萬數(shù)據(jù),英國分析師團隊建立兒童性虐圖像元數(shù)據(jù)庫
一個分析師團隊正在嘗試建立起一個兒童性虐圖像元數(shù)據(jù)庫,在不同國家共享,以打破這種僵局。 在英國劍橋郡,互聯(lián)網(wǎng)觀察基金會辦公室(Internet Watch Foundation’s office in Cambridgeshire,下稱IWF)建立起了一只21 人團隊,他們每天都會花費數(shù)小時瀏覽包含兒童性虐待的圖像和視頻。 僅去年一年,該團隊就標記出了 153,383 個帶有兒童性虐待圖像鏈接的網(wǎng)頁,一個龐大的數(shù)據(jù)庫正在逐漸建立。 而這只是第一步,IWC的最終目的是,希望這個數(shù)據(jù)庫可以在國際上共享,并在數(shù)據(jù)庫的基礎(chǔ)上訓練智能算法,自動歸類相關(guān)違禁圖片,以阻止虐童圖片的全球擴散。 為了達到目的,這個21人的團隊每天都在經(jīng)受常人無法忍受的“痛苦”。除了瀏覽大量虐待、暴力、黃色視頻和圖像,發(fā)現(xiàn)照片或視頻片段時,IWF的數(shù)據(jù)分析師還需要對其進行評估和標記。到目前為止,這些分析師主要會檢查相關(guān)音視頻材料屬于ABC三個等級中的哪一種。這些分組主要基于英國的法律和兒童性虐待的量刑指南中廣泛規(guī)定的虐待類型。例如,最嚴重的類別 A 中的圖像包括嚴重的針對兒童的犯罪,使用這些分類可以計算被判有罪的人應(yīng)被判刑多長時間。除了確定性虐待內(nèi)容是否屬于英國的三個群體之外,其分析師現(xiàn)在還在他們的報告中添加了多達 20 條不同的更詳細信息。
打破各國打擊性虐犯罪數(shù)據(jù)孤島
目前,全球性虐圖片和視頻量級仍在增加。去年,非營利性國家失蹤和受虐兒童中心收到了2140 萬份來自科技公司的虐待內(nèi)容報告,美國法律要求這些公司報告他們發(fā)現(xiàn)的內(nèi)容。這是有記錄以來最多的一年,報告包含 6540 萬張圖片、視頻和其他文件。 盡管虐待兒童材料的報告有所增加,但面臨的一大挑戰(zhàn)是世界各地不同的報告流程和標準。由于方法的不同,很難全面了解在線兒童性虐待的真實規(guī)模。總部位于美國的非營利組織國際失蹤和受虐兒童中心 2018 年的一項法律審查發(fā)現(xiàn),118 個國家/地區(qū)擁有“足夠”的兒童性虐待物質(zhì)法律,62 個國家/地區(qū)的法律不充分,16 個國家/地區(qū)沒有。一些法律不健全的國家沒有定義兒童性虐待,其他國家沒有研究技術(shù)如何用于犯罪,還有一些國家沒有將虐待內(nèi)容音視頻材料定為犯罪。
另外,由歐盟資助的國際警務(wù)組織國際刑警組織和 ECPAT International(一系列民間社會組織)進行的研究發(fā)現(xiàn),比較有關(guān)兒童性虐待內(nèi)容的信息存在“重大挑戰(zhàn)”,這阻礙了尋找犯罪嫌疑人的努力。受害者。2018 年 2 月的報告說: “這種情況因使用不同的分類方法來歸類受害者特征和受害經(jīng)歷而變得復雜,這使得研究之間無法進行有意義的比較。”
將圖像與各國法律自動匹配,判定圖片是否違法
IWF希望通過這個數(shù)據(jù)庫,來消除各國的一些差異。該組織構(gòu)建了名為 Intelligrade 的哈希軟件,以自動將圖像和視頻與澳大利亞、加拿大、新西蘭、美國和英國的規(guī)則和法律相匹配。這一變化應(yīng)該意味著減少重復的分析工作,并使科技公司更容易優(yōu)先處理嚴重的濫用圖像和視頻。
各國根據(jù)圖像中發(fā)生的情況和所涉及兒童的年齡對圖像施加不同的權(quán)重。IWF將所有照片和視頻都被賦予了一個哈希值,本質(zhì)上這是一個代碼,然后將其與世界各地的科技公司和執(zhí)法機構(gòu)共享。這些哈希值可以直接用于檢測和阻止再次上傳到網(wǎng)絡(luò)的已知虐待暴力內(nèi)容。 IWF的秘密武器是元數(shù)據(jù)。這是關(guān)于數(shù)據(jù)的數(shù)據(jù)——它可以是圖像中包含的內(nèi)容、人員、方式和時間等精細信息。 元數(shù)據(jù)是調(diào)查人員的強大工具,因為它使他們能夠發(fā)現(xiàn)人們行為中的模式并分析其更多可能。元數(shù)據(jù)的最大支持者之一是偵查,這比具體的圖片信息更有價值。 休斯說,IWF創(chuàng)建的數(shù)據(jù)庫中為每個圖像和視頻創(chuàng)建了相關(guān)的元數(shù)據(jù)量。查看的每個新圖像或視頻都可以比以往任何時候進行更詳細地進行評估。“我們決定是否會提供關(guān)于描述年齡的顆粒度、在描述圖像中發(fā)生的事情以及確認性別方面的顆粒度,”休斯說。 IWF 希望其這一數(shù)據(jù)庫和智能系統(tǒng)能夠幫助解決各國聯(lián)合打擊性虐視頻傳播的一些問題。IWF通訊主管艾瑪·哈迪說,之前的學術(shù)研究側(cè)重在法律方向的努力——各國努力制定相同的禁止兒童性虐待的法律,這是一個非常難以實現(xiàn)的政治挑戰(zhàn)。“從數(shù)據(jù)庫和技術(shù)入手,能夠填補法律協(xié)調(diào)方面的巨大空白,”哈迪說。IWF 現(xiàn)在正在研究更多國家,以推廣這一數(shù)據(jù)庫和技術(shù)工具。 “我們相信能夠更好地共享數(shù)據(jù),讓更多人以有意義的方式使用數(shù)據(jù),而不是所有人都只在自己的小孤島中工作。”
素材來源:
https://www.wired.com/story/new-system-crack-down-child-sex-abuse-images/
https://www.iwf.org.uk/?gclid=Cj0KCQjw0K-HBhDDARIsAFJ6UGjWoAKz0X6M2l-eCUbAw_PTW3Cm6JJNvrvFFOdceOw3VhxnkjHaHxUaAjkQEALw_wcB
點「在看」的人都變好看了哦!
轉(zhuǎn)載請在文章開頭和結(jié)尾顯眼處標注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
未經(jīng)授權(quán)嚴禁轉(zhuǎn)載,授權(quán)事宜請聯(lián)系作者本人,侵權(quán)必究。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
授權(quán)事宜請至數(shù)英微信公眾號(ID: digitaling) 后臺授權(quán),侵權(quán)必究。
評論
評論
推薦評論
暫無評論哦,快來評論一下吧!
全部評論(0條)