[點(diǎn)晴永久免費(fèi)OA]瀏覽器指紋技術(shù)詳解(什么是瀏覽器指紋追蹤,本文提供了JS封裝包,直接調(diào)用即可生成指紋值)
網(wǎng)頁追蹤的五種技術(shù):五種技術(shù):HTTP cookies(又稱作標(biāo)準(zhǔn)信息記錄程序)是由 Web 服務(wù)器保存在用戶瀏覽器(客戶端)上的包含有關(guān)用戶信息的小文本文件,分為第一方cookie和第三方cookie。 其中,第三方cookie是與網(wǎng)站用戶毫無關(guān)系的其他公司為了跟蹤用戶而安置在不同網(wǎng)站上的?;赾ookie在多個網(wǎng)站跟蹤得來的用戶信息,比如興趣、身體狀況甚至是政治觀點(diǎn)等等,廣告商建立用戶畫像(online profiling),識別用戶身份特征,并根據(jù)用戶特點(diǎn)推送特定廣告或者將用戶信息轉(zhuǎn)手賣給其他企業(yè)。 無論是第一方cookie還是第三方cookie,網(wǎng)絡(luò)用戶都可以選擇刪除cookies文件來避免互聯(lián)網(wǎng)公司跟蹤自己的網(wǎng)頁瀏覽記錄。Flash cookie是Adobe Flash的開發(fā)者建立在用戶電腦上用以儲存用戶信息的文件。它與HTTP cookie最顯著的不同在于,即使用戶已經(jīng)刪除,F(xiàn)lash cookies仍然能夠在不告知用戶的情況下再次生成,繼續(xù)跟蹤用戶信息。 Etags(實(shí)體標(biāo)簽),開發(fā)本意是希望通過直接保存歷史瀏覽網(wǎng)頁為用戶提供更快速的瀏覽體驗(yàn),但這種技術(shù)也被廣告商用來在用戶端儲存識別碼。 HTML5 本地儲存方式的優(yōu)點(diǎn)在于儲存時間長、容量大,在蘋果研發(fā)越來越多的脫離Flash軟件的產(chǎn)品之后,HTML5將成為Flash cookie的替代之選,使用范圍越來越廣。 The Evercookie 跟蹤機(jī)制則是融合前述幾種技術(shù),其特點(diǎn)是重復(fù)——即便用戶刪除了某個跟蹤文本,另一個追蹤文本會立刻恢復(fù)生成識別碼。 第二大類技術(shù),瀏覽器指紋識別是指服務(wù)器一端通過瀏覽器直接查詢用戶的電腦屬性,比如用戶使用哪個瀏覽器、下載了哪些字體,以此識別用戶特征。由于該活動在服務(wù)器一端進(jìn)行,所以用戶很難發(fā)現(xiàn)和阻擋。綜上,跟蹤技術(shù)從舊到新、不斷迭代,都是廣告商為了使這些跟蹤技術(shù)更難被消費(fèi)者察覺和阻擋,以更隱秘的方式剝奪網(wǎng)絡(luò)使用者面對廣告推送的選擇權(quán),從而使行為廣告成為“人們無法拒絕的offer”。 設(shè)備指紋反欺詐技術(shù) 設(shè)備指紋具備不受瀏覽器兼容性限制、用戶無法修改、不會被瀏覽器清除、可跨應(yīng)用追蹤等諸多優(yōu)點(diǎn),可謂集美貌與智慧于一身,在網(wǎng)絡(luò)營銷、反欺詐等領(lǐng)域應(yīng)用廣泛。設(shè)備指紋也有門派之分,其中主要分為主動式、被動式和混合式,其中主動式發(fā)展最早、技術(shù)門檻相對較低,因而目前應(yīng)用比被動式和混合式兩種更為廣泛。 主動式設(shè)備指紋 主動式設(shè)備指紋的應(yīng)用,需要收集諸多信息才能保證設(shè)備識別的準(zhǔn)確性,如MAC地址、設(shè)備IMEI號、廣告跟蹤ID、設(shè)備唯一序列號、地理位置等等。 此外,還要突破瀏覽器兼容性、千變?nèi)f化的設(shè)備型號、代理、軟件篡改設(shè)備信息等重重難關(guān)。 主動式設(shè)備指紋技術(shù): Step 1:準(zhǔn)備好已聯(lián)網(wǎng)的電腦一臺 Step 2:打開以下網(wǎng)站https://github.com/Valve/fingerprintjs2 Step 3:加載fingerprintjs2 Step 4:接著在頁面中加入以下代碼就可以輕松獲得設(shè)備指紋啦 主動式設(shè)備指紋技術(shù)存在的弊端: 1.存在明顯的用戶隱私侵犯,并因此可能導(dǎo)致被Google和蘋果Apple Store下架。舉個例子,金融、支付行業(yè)中有很多業(yè)務(wù)場景對于用戶隱私的保護(hù)要求很高,就無法使用主動式設(shè)備指紋做設(shè)備識別。 2.主動式指紋不能實(shí)現(xiàn)App和mobile web間,不同瀏覽器間的設(shè)備識別。主動式設(shè)備指紋對于需要跨網(wǎng)頁/應(yīng)用追蹤用戶行為的場景,比如追蹤App安裝究竟來自哪個廣告渠道,就無能為力。 3.主動式設(shè)備指紋所取特征均暴露于客戶端,欺詐者可輕易通過一些一鍵新機(jī)等工具篡改相應(yīng)特征信息,從而使指紋無效。這些場景就需要相對技術(shù)門檻更高的被動式設(shè)備指紋技術(shù)來解決了。 被動式設(shè)備指紋技術(shù) 最新的被動式設(shè)備指紋技術(shù),從數(shù)據(jù)包的OSI七層協(xié)議中,提取出這臺設(shè)備的操作系統(tǒng)、協(xié)議棧和網(wǎng)絡(luò)狀態(tài)相關(guān)的特征,并結(jié)合機(jī)器學(xué)習(xí)算法以標(biāo)識和跟蹤具體的移動設(shè)備。相比于主動式設(shè)備指紋技術(shù),被動式設(shè)備指紋技術(shù)在適用范圍和靈活性上,有著不可比擬的優(yōu)勢: 1)更大的適用范圍,由于被動式設(shè)備指紋技術(shù)完全工作在服務(wù)器側(cè),一些無法植入SDK或JS的場景也可使用; 2)跨Web/App,跨瀏覽器的識別; 3)完全不侵犯用戶隱私,避免了被AppStore下架的風(fēng)險。 混合式設(shè)備指紋技術(shù) 混合式設(shè)備指紋技術(shù)指將主動式和被動式設(shè)備指紋技術(shù)整合在同一個設(shè)備識別與跟蹤的架構(gòu)中,將主動式設(shè)備指紋技術(shù)在客戶端生成的設(shè)備標(biāo)識符,與被動式設(shè)備指紋技術(shù)在服務(wù)器端收集的、協(xié)議棧相關(guān)的特征信息對應(yīng)起來,使得所有的設(shè)備都有一個唯一的設(shè)備識別ID。 混合式設(shè)備指紋技術(shù)融合了主動式和被動式設(shè)備指紋技術(shù)各自的優(yōu)點(diǎn),在準(zhǔn)確識別設(shè)備的同時,擴(kuò)大了設(shè)備指紋技術(shù)的適用范圍。 準(zhǔn)確率進(jìn)一步提高: 主動式設(shè)備指紋技術(shù)本身已經(jīng)具有很高的準(zhǔn)確率,接近100%。在此基礎(chǔ)上,混合式設(shè)備指紋技術(shù)能夠?qū)⒅鲃邮胶捅粍邮降淖R別結(jié)果相互印證和校驗(yàn),從而使準(zhǔn)確率進(jìn)一步提高。 適用范圍更廣: 出于隱私保護(hù)的目的,純主動式設(shè)備指紋技術(shù)的使用場景越來越受限,同時其對于SDK和JS代碼的依賴,致使其無法應(yīng)用在不便于在客戶端植入代碼的場景。例如,Apple公司就嚴(yán)格限制APP中用戶與設(shè)備信息的收集行為,任何超越合理范圍的信息收集都可能被視為違規(guī)行為,而遭到APP下架的懲罰。 而混合式設(shè)備指紋技術(shù)則可根據(jù)用戶的不同場景,來靈活決定設(shè)備指紋的生成和校驗(yàn)方式。對于用戶隱私保護(hù)要求寬松的場景,可以使用主動式設(shè)備指紋技術(shù)來獲得快速、穩(wěn)定的設(shè)備標(biāo)識;而對于用戶隱私保護(hù)要求嚴(yán)格,或無法嵌入SDK和Javascript代碼的場景,則可以使用被動式設(shè)備指紋技術(shù)。 此外,在需要將同一用戶在移動Web和App中的行為關(guān)聯(lián)起來的場景中,混合式設(shè)備指紋技術(shù)也有著比主動式更大的應(yīng)用范圍。 用戶行為信息分析 在堅實(shí)的設(shè)備指紋的基礎(chǔ)上,需要在會話和賬號兩層采集和提取用戶行為信息。在會話的層面上,借助基于概率的聚類模型和模式挖掘算法(sequential pattern mining),將用戶的行為模式,比如事件發(fā)生的次序以及事件發(fā)生的間隔時間,歸為幾類。并在此基礎(chǔ)上識別出異常行為模式。 這些標(biāo)示特征為區(qū)分正常用戶和欺詐者或自動化工具提供了重要信息;更進(jìn)一步,在賬號的層面上:首先以賬號為索引,將會話層面上提取到的行為信息特征按時間串聯(lián)起來,得到賬戶層面的異常行為標(biāo)示特征。其次根據(jù)賬號相關(guān)聯(lián)的歷史行為數(shù)據(jù),提取出用戶的偏好屬性,比如是否為僵尸賬號,相鄰登錄的平均地理距離等。最后,我們將這些信息綜合起來,形成特有的用于反欺詐的用戶畫像。 當(dāng)一個賬號再次出現(xiàn)在業(yè)務(wù)中時,用戶畫像中的特征就可以幫助我們評估對應(yīng)業(yè)務(wù)事件的風(fēng)險。在實(shí)踐中,我們還發(fā)現(xiàn),由“羊毛黨”控制的賬號,通常具有某些相似性,比如所用手機(jī)號碼都來自某個號段,用戶名都由三個小寫字母,五個大寫字母和四個數(shù)字組成。據(jù)此,我們就可以定義賬號之間的相似度。這樣即使一個賬號首次出現(xiàn),我們也可以使用用戶畫像,對其風(fēng)險做一個大致的評估。 用戶畫像除了本身能直接應(yīng)用于欺詐行為的判斷外。還可作為網(wǎng)絡(luò)圖譜模型的輸入,為欺詐網(wǎng)絡(luò)的發(fā)現(xiàn)提供線索和依據(jù)。 規(guī)則引擎與機(jī)器學(xué)習(xí)模型 目前并沒有一個通用的反欺詐框架可以識別并防范所有形式的欺詐。在每一個領(lǐng)域,金融欺詐都有不同的形式和特征,比如,一個應(yīng)用于信用卡申請的反欺詐模型并不能直接應(yīng)用于保險領(lǐng)域,亦無法直接應(yīng)用于信貸領(lǐng)域。 最常用的反欺詐模型,是通過建立一個規(guī)則引擎或者機(jī)器學(xué)習(xí)模型來描述欺詐行為的特征,從而將欺詐行為從正常操作中區(qū)別開來。在反欺詐規(guī)則引擎中,這些甄別欺詐行為的規(guī)則依賴于從大量歷史案例中總結(jié)出來的“專家知識”。例如,如果一個人申請貸款所用的手機(jī)號與其常用的手機(jī)號不一致,則這筆申請的欺詐風(fēng)險就被認(rèn)定稍高一些。 反欺詐機(jī)器學(xué)習(xí)模型,它指的是采用數(shù)據(jù)挖掘方法,基于歷史數(shù)據(jù)(即,已知的欺詐申請和正常申請的數(shù)據(jù))而建立的分類模型。這類模型的訓(xùn)練往往需要大量數(shù)據(jù)。 兩者有何區(qū)別?規(guī)則引擎可以看作是一種特殊的最簡單的機(jī)器學(xué)習(xí)模型:決策樹模型。決策樹模型具有極好的可解釋性,因而,即使數(shù)據(jù)量不足,也可以通過專家知識來補(bǔ)全規(guī)則集。而廣義上的反欺詐機(jī)器學(xué)習(xí)模型往往指的是采用更復(fù)雜的算法建立的模型(如隨即森林、深度學(xué)習(xí)等)。這些模型的訓(xùn)練需要大量的歷史數(shù)據(jù)并且其結(jié)果通常很難解讀。 不論是規(guī)則引擎還是機(jī)器學(xué)習(xí)模型,都是從歷史案例中發(fā)現(xiàn)金融欺詐時重復(fù)出現(xiàn)的個體行為模式。這個方法在很多領(lǐng)域被證明為有效(例如,用于審核個人還款能力意愿的信用評分模型),然而在解決金融欺詐問題時表現(xiàn)一般,原因有兩個: 其一,金融欺詐的模式隨時間不斷演化和發(fā)展,而不僅僅是重復(fù)出現(xiàn)在歷史案例中的個體行為模式; 其二,隨著反欺詐技術(shù)的進(jìn)步,金融欺詐越來越難以由個體完成,而是需要通過團(tuán)伙有組織的進(jìn)行。 關(guān)系圖譜反欺詐 關(guān)系圖譜提供了全新的反欺詐分析角度。 關(guān)系圖譜是描述個體及個體之間關(guān)系的圖。下圖給出了一個移動支付場景的關(guān)系圖譜示例,個體類型可以包括IP地址、設(shè)備、支付賬戶、賬戶聯(lián)系人等,個體之間也可以存在不同的關(guān)系,比如IP登錄行為、設(shè)備登錄行為、聯(lián)系人登記行為等。 關(guān)系圖譜把不同的個體按照其關(guān)系連接在一起,從而提供了從“關(guān)系”的角度分析問題的能力。這更有利于從正常行為中識別出到異常的團(tuán)伙欺詐行為。
接下來,我們來討論關(guān)系圖譜在反欺詐中的應(yīng)用場景,主要分為監(jiān)督模型和無監(jiān)督模型兩種情況。所謂的監(jiān)督模型,指的是在已知“好”和“壞”標(biāo)簽的前提下,嘗試從歷史數(shù)據(jù)中,挖掘出欺詐團(tuán)伙的典型特征和行為模式,從而能夠有效的識別出金融欺詐團(tuán)伙。監(jiān)督模型雖然在預(yù)測準(zhǔn)確性上有不錯的表現(xiàn),但是,實(shí)際情況中,“好”和“壞”的標(biāo)簽往往很難得到。因此,在沒有標(biāo)簽信息時,無監(jiān)督模型分析也變得尤為重要。當(dāng)然,本文提到的分析方法只是關(guān)系圖譜在反欺詐場景中的冰山一角,更多的算法模型需要結(jié)合實(shí)際業(yè)務(wù)需求進(jìn)行設(shè)計和開發(fā)。 典型運(yùn)用一:異常檢測 異常檢測是在無監(jiān)督模型學(xué)習(xí)中比較有代表性的方法,即在數(shù)據(jù)中找出具有異常性質(zhì)的點(diǎn)或團(tuán)體。在檢測欺詐團(tuán)體的情況下,異常檢測被認(rèn)為是比較有效果的。 以貸款申請為例,許多團(tuán)伙會選擇共享一些申請信息,如提供同一個皮包公司的地址作為公司信息,或者聯(lián)系人電話重合程度高。因此,在關(guān)系網(wǎng)絡(luò)中,大多數(shù)的正常的個體應(yīng)該是獨(dú)立的節(jié)點(diǎn),或者與另一個節(jié)點(diǎn)組成規(guī)模為二的團(tuán)體(在這種情況下,多數(shù)可能為家人或親友關(guān)系)。若出現(xiàn)三個點(diǎn)以上甚至十幾個點(diǎn)關(guān)系密切時,則這些團(tuán)體可被歸為異常。 異常檢測并不能夠明確的給出一個團(tuán)體是否欺詐,但是可以通過這種方法排查出可疑的團(tuán)伙,從而進(jìn)行調(diào)查。該算法并不是基于歷史數(shù)據(jù)挖掘隱藏的欺詐模式,因而常常能夠有效地識別出新出現(xiàn)的未曾記錄的欺詐行為。 典型運(yùn)用二:團(tuán)體分群 團(tuán)體分群即是對給定網(wǎng)絡(luò)中的團(tuán)體依據(jù)以上特征進(jìn)行區(qū)分,從而挖掘有潛在欺詐風(fēng)險的團(tuán)體的方法。舉一個簡單的例子,以團(tuán)體中的男性占比和年齡差者兩個特征來對網(wǎng)絡(luò)中的團(tuán)體進(jìn)行分群。作為以家人關(guān)系而形成的團(tuán)體,一般由三人形成,多為兩男一女或兩女一男,男性占比33%或67%,并且年齡差一般為20-30歲。具有這種性質(zhì)的團(tuán)體一般為家庭團(tuán)體,因而風(fēng)險性較小。但對于人數(shù)較多,男性占比高,而且年齡差較小的團(tuán)體,則有可能是欺詐團(tuán)伙,需要進(jìn)一步調(diào)查。 以上,我們對設(shè)備指紋、用戶行為信息、規(guī)則引擎、機(jī)器學(xué)習(xí)、關(guān)系圖譜等反欺詐技術(shù)做了一個簡單的介紹。在反欺詐實(shí)踐中,這些提取出來的特征,結(jié)合多層動態(tài)模型,能有效地識別出高風(fēng)險薅羊毛行為,幫助企業(yè)打擊“羊毛黨”。 該文章在 2022/7/15 9:28:02 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |