2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
在今天Face book博客上的一篇文章中,工程師們描述了一種算法-SybilEdge-來(lái)檢測(cè)假賬戶,這些假賬戶在注冊(cè)時(shí)逃避Face book的反虐過(guò)濾器,但還沒(méi)有足夠的朋友來(lái)延續(xù)虐待。 目標(biāo)是降低賬戶對(duì)其他用戶發(fā)起攻擊的能力,部分是通過(guò)比較用戶向擴(kuò)展社交網(wǎng)絡(luò)添加好友的方式。
SybilEdge能夠發(fā)現(xiàn)假的Face book賬戶不到一周,朋友的請(qǐng)求不到20個(gè),它立即申請(qǐng)平臺(tái)來(lái)處理關(guān)于流行的一波誤導(dǎo)性信息。 路透社牛津大學(xué)新聞學(xué)研究所發(fā)表的一項(xiàng)分析發(fā)現(xiàn),33%的人在Twitter、Face book和YouTube等社交網(wǎng)絡(luò)上看到了某種形式的關(guān)于的錯(cuò)誤信息。
在設(shè)計(jì)SybilEdge時(shí),開(kāi)發(fā)團(tuán)隊(duì)指出,施虐者需要連接到目標(biāo)才能發(fā)起虐待-也就是說(shuō),他們需要找到目標(biāo),向他們發(fā)送朋友請(qǐng)求,并接受請(qǐng)求。 也許不足為奇的是,F(xiàn)ace book內(nèi)部研究表明,非用戶在選擇朋友和那些朋友對(duì)朋友請(qǐng)求的回應(yīng)方面都有所不同:假帳戶的請(qǐng)求比真實(shí)用戶的請(qǐng)求更經(jīng)常被拒絕。 此外,假賬戶在選擇朋友請(qǐng)求目標(biāo)時(shí)往往很小心,這可能會(huì)最大限度地提高他們的請(qǐng)求被接受的概率。
Face book創(chuàng)建了一個(gè)語(yǔ)料庫(kù),通過(guò)將用戶分成兩組來(lái)訓(xùn)練SybilEdge:那些更有可能接受來(lái)自真實(shí)帳戶的朋友請(qǐng)求的人和那些可能接受虛假帳戶請(qǐng)求的人。 如果前者拒絕傳入的請(qǐng)求,它將發(fā)出請(qǐng)求者是合法用戶的信號(hào)。 另一方面,如果接受更多假請(qǐng)求的用戶接受請(qǐng)求,則表明請(qǐng)求者可能是假的。
西比爾邊緣分兩個(gè)階段工作。 首先,它是通過(guò)觀察上述樣本的時(shí)間來(lái)訓(xùn)練的,然后它利用Face book的行為和內(nèi)容分類(lèi)器的輸出,這些分類(lèi)器根據(jù)實(shí)際的濫用標(biāo)記帳戶。 這個(gè)訓(xùn)練階段為模型提供了所有必要的參數(shù)(即從數(shù)據(jù)中估計(jì)的配置變量,以及模型在進(jìn)行預(yù)測(cè)時(shí)所需的配置變量),以便為每個(gè)朋友的請(qǐng)求和響應(yīng)實(shí)時(shí)運(yùn)行,并更新請(qǐng)求者被假的概率。
Face book聲稱,SybilEdge在檢測(cè)假賬戶方面的準(zhǔn)確率高于90%,平均有15個(gè)或更少的朋友請(qǐng)求,在檢測(cè)5個(gè)朋友請(qǐng)求的假賬戶方面的準(zhǔn)確率高于80%。 此外,與其比較的基線不同,它的性能不會(huì)隨著更多的朋友請(qǐng)求而降低(超過(guò)45)。
“SybilEdge幫助我們快速識(shí)別施虐者,并以一種可以解釋和分析的方式。 在不久的將來(lái),我們計(jì)劃研究更多的方法,可以進(jìn)一步加快發(fā)現(xiàn)濫用帳戶,并幫助作出自信的決定,甚至比SybilEdge更快。 我們計(jì)劃通過(guò)混合基于特征和基于行為的模型來(lái)實(shí)現(xiàn)這一點(diǎn),“Face book寫(xiě)道。
Face book正向一種名為自我監(jiān)督學(xué)習(xí)的人工智能培訓(xùn)技術(shù)邁進(jìn),在這種技術(shù)中,未標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)一起使用,以提高學(xué)習(xí)精度。 Face book的深度實(shí)體分類(lèi)(DEC)機(jī)器學(xué)習(xí)框架在部署以來(lái)的兩年里導(dǎo)致平臺(tái)上濫用賬戶減少了20%。 在一個(gè)單獨(dú)的實(shí)驗(yàn)中,F(xiàn)ace book的研究人員能夠訓(xùn)練一個(gè)語(yǔ)言理解模型,該模型只有80個(gè)小時(shí)的數(shù)據(jù),而人工標(biāo)記的數(shù)據(jù)為12,000個(gè)小時(shí)。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。