首頁 > 期刊 > 人文社會科學(xué) > 社會科學(xué)II > 社會學(xué)及統(tǒng)計學(xué) > 統(tǒng)計與信息論壇 > 眾包競賽的離群點(diǎn)欺詐用戶檢測算法研究 【正文】
摘要:針對基于眾包競賽中欺詐者篩除機(jī)制的黃金標(biāo)準(zhǔn)數(shù)據(jù)方法、聚類算法的離群點(diǎn)檢測算法K means算法和DBSCAN算法,依賴于事先給定的參數(shù),不適合大規(guī)模數(shù)據(jù)集檢測的問題,提出基于樣本連通圖的離群點(diǎn)檢測算法。首先,給定參數(shù)并重復(fù)調(diào)用離群點(diǎn)檢測算法,識別數(shù)據(jù)中的離群點(diǎn)和聚類;其次,計算每兩個樣本之間的連接次數(shù)和連接強(qiáng)度,在給定連接強(qiáng)度下界δ的情況下,根據(jù)樣本的連接強(qiáng)度來構(gòu)造樣本之間的連通圖;最后,根據(jù)樣本之間的連通情況,對樣本進(jìn)行標(biāo)記,把樣本標(biāo)記為聚類節(jié)點(diǎn)和離群點(diǎn)。實(shí)驗結(jié)果表明,該算法在放寬參數(shù)設(shè)置范圍的情況下,縮小了離群點(diǎn)個數(shù)波動范圍,提升了離群點(diǎn)識別準(zhǔn)確率,優(yōu)于對比算法和經(jīng)典的黃金標(biāo)準(zhǔn)數(shù)據(jù)方法。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:陜西省教育廳;主辦單位:西安財經(jīng)大學(xué);中國統(tǒng)計教育學(xué)會高教分會