靠近北京西北四環(huán)的一棟寫字樓里,韓景維掏出手機(jī)撥出一個(gè)號(hào)碼。很快,他的號(hào)碼顯示在對(duì)方的來電提醒里。這樣一個(gè)司空見慣的場景,其實(shí)在短短數(shù)秒鐘內(nèi),就已經(jīng)經(jīng)過一系列復(fù)雜的查詢、識(shí)別和過濾。如果打來的是一個(gè)騷擾或詐騙電話,智能手機(jī)上便會(huì)出現(xiàn)相應(yīng)的標(biāo)記,看似簡單的小事,背后卻需要一個(gè)龐大的數(shù)據(jù)庫和一套完善的模型來支撐。
打算購房的人剛看完一個(gè)樓盤,便收到密集的房屋推銷電話;簽完購房合同沒幾天,各類詢問貸款需求的電話頻頻打擾;接到大學(xué)錄取通知書后,一個(gè)個(gè)假冒提供助學(xué)措施的詐騙電話緊隨而至……生活在騷擾和詐騙電話不斷來襲的當(dāng)下,我們靠什么來守住一片寧靜的空間?
大數(shù)據(jù)與科技運(yùn)算已經(jīng)提供了解決方案。多年來,騰訊手機(jī)管家安全專家韓景維和團(tuán)隊(duì)成員一直致力于此。如今,這個(gè)團(tuán)隊(duì)建立的數(shù)據(jù)庫,已經(jīng)儲(chǔ)存了1300多萬個(gè)被標(biāo)識(shí)為騷擾或詐騙等有問題的電話號(hào)碼。
“每呼叫一次,便在數(shù)據(jù)庫里經(jīng)過一次查詢,每天的查詢量在15億次,其中能查到的騷擾或詐騙電話在4000萬次左右。”韓景維介紹說。
據(jù)介紹,完成上述任務(wù)的核心是一個(gè)儲(chǔ)存有龐大問題號(hào)碼的數(shù)據(jù)庫。一部分?jǐn)?shù)據(jù)來源于手機(jī)用戶的主動(dòng)標(biāo)記行為,頻繁被標(biāo)記的問題號(hào)碼就會(huì)上報(bào)到數(shù)據(jù)庫里。
另一個(gè)重要的數(shù)據(jù)來源,則是通過騰訊手機(jī)管家團(tuán)隊(duì)建立的模型運(yùn)算出的結(jié)果。騰訊手機(jī)管家首先把一套安全系統(tǒng)部署到手機(jī)運(yùn)營商,然后對(duì)運(yùn)營商提供的海量撥號(hào)信息數(shù)據(jù)進(jìn)行格式化、標(biāo)準(zhǔn)化,通過模型的運(yùn)算精準(zhǔn)識(shí)別出哪些是有問題的號(hào)碼。
韓景維舉了這樣一個(gè)例子,公安部門在破獲一起電信詐騙案后,把查出的一批詐騙電話號(hào)碼提供出來,比如有50個(gè)詐騙號(hào)碼,騰訊的安全系統(tǒng)會(huì)對(duì)這50個(gè)號(hào)碼進(jìn)行多維度的數(shù)據(jù)運(yùn)算,機(jī)器學(xué)習(xí)模型會(huì)對(duì)GPS坐標(biāo)、通話記錄、通話頻次等號(hào)碼信息展開歸納學(xué)習(xí),摸索出這些詐騙號(hào)碼的規(guī)律后,再挖掘出尚未被查獲的其他詐騙號(hào)碼。
無論是用戶主動(dòng)上報(bào)的問題號(hào)碼,還是經(jīng)過系統(tǒng)運(yùn)算識(shí)別出的詐騙號(hào)碼,都會(huì)被儲(chǔ)存在一個(gè)數(shù)據(jù)庫里,在人們接到陌生號(hào)碼的那一刻,立即做出相應(yīng)的標(biāo)記提醒。
在為人們守護(hù)寧靜的同時(shí),用戶通話信息的隱私如何得到有效的保護(hù)?據(jù)介紹,互聯(lián)網(wǎng)公司把手機(jī)安全系統(tǒng)部署到手機(jī)運(yùn)營商,是為了識(shí)別、收集騷擾或詐騙等問題號(hào)碼,因此取回的數(shù)據(jù)不涉及正常的用戶號(hào)碼,在模型運(yùn)算中也不會(huì)涉及用戶的通話內(nèi)容等隱私信息。
另外,為了防止一些正常的號(hào)碼被惡意標(biāo)記,上述數(shù)據(jù)庫里還建立一個(gè)白名單,政府、企事業(yè)單位等部門的號(hào)碼會(huì)被納入到白名單內(nèi)。用戶的正常號(hào)碼,一旦遭惡意標(biāo)記或被誤操作標(biāo)記,在用戶申訴后,騰訊手機(jī)管家團(tuán)隊(duì)會(huì)通過數(shù)據(jù)庫進(jìn)行審核,把相應(yīng)的標(biāo)記取消。(完顏文豪、顏之宏)(新華每日電訊)