[點晴永久免費OA]瀏覽器指紋技術詳解(什么是瀏覽器指紋追蹤,本文提供了JS封裝包,直接調用即可生成指紋值)
當前位置:點晴教程→點晴OA辦公管理信息系統
→『 經驗分享&問題答疑 』
網頁追蹤的五種技術:五種技術:HTTP cookies(又稱作標準信息記錄程序)是由 Web 服務器保存在用戶瀏覽器(客戶端)上的包含有關用戶信息的小文本文件,分為第一方cookie和第三方cookie。 其中,第三方cookie是與網站用戶毫無關系的其他公司為了跟蹤用戶而安置在不同網站上的。基于cookie在多個網站跟蹤得來的用戶信息,比如興趣、身體狀況甚至是政治觀點等等,廣告商建立用戶畫像(online profiling),識別用戶身份特征,并根據用戶特點推送特定廣告或者將用戶信息轉手賣給其他企業。 無論是第一方cookie還是第三方cookie,網絡用戶都可以選擇刪除cookies文件來避免互聯網公司跟蹤自己的網頁瀏覽記錄。Flash cookie是Adobe Flash的開發者建立在用戶電腦上用以儲存用戶信息的文件。它與HTTP cookie最顯著的不同在于,即使用戶已經刪除,Flash cookies仍然能夠在不告知用戶的情況下再次生成,繼續跟蹤用戶信息。 Etags(實體標簽),開發本意是希望通過直接保存歷史瀏覽網頁為用戶提供更快速的瀏覽體驗,但這種技術也被廣告商用來在用戶端儲存識別碼。 HTML5 本地儲存方式的優點在于儲存時間長、容量大,在蘋果研發越來越多的脫離Flash軟件的產品之后,HTML5將成為Flash cookie的替代之選,使用范圍越來越廣。 The Evercookie 跟蹤機制則是融合前述幾種技術,其特點是重復——即便用戶刪除了某個跟蹤文本,另一個追蹤文本會立刻恢復生成識別碼。 第二大類技術,瀏覽器指紋識別是指服務器一端通過瀏覽器直接查詢用戶的電腦屬性,比如用戶使用哪個瀏覽器、下載了哪些字體,以此識別用戶特征。由于該活動在服務器一端進行,所以用戶很難發現和阻擋。綜上,跟蹤技術從舊到新、不斷迭代,都是廣告商為了使這些跟蹤技術更難被消費者察覺和阻擋,以更隱秘的方式剝奪網絡使用者面對廣告推送的選擇權,從而使行為廣告成為“人們無法拒絕的offer”。 設備指紋反欺詐技術 設備指紋具備不受瀏覽器兼容性限制、用戶無法修改、不會被瀏覽器清除、可跨應用追蹤等諸多優點,可謂集美貌與智慧于一身,在網絡營銷、反欺詐等領域應用廣泛。設備指紋也有門派之分,其中主要分為主動式、被動式和混合式,其中主動式發展最早、技術門檻相對較低,因而目前應用比被動式和混合式兩種更為廣泛。 主動式設備指紋 主動式設備指紋的應用,需要收集諸多信息才能保證設備識別的準確性,如MAC地址、設備IMEI號、廣告跟蹤ID、設備唯一序列號、地理位置等等。 此外,還要突破瀏覽器兼容性、千變萬化的設備型號、代理、軟件篡改設備信息等重重難關。 主動式設備指紋技術: Step 1:準備好已聯網的電腦一臺 Step 2:打開以下網站https://github.com/Valve/fingerprintjs2 Step 3:加載fingerprintjs2 Step 4:接著在頁面中加入以下代碼就可以輕松獲得設備指紋啦 主動式設備指紋技術存在的弊端: 1.存在明顯的用戶隱私侵犯,并因此可能導致被Google和蘋果Apple Store下架。舉個例子,金融、支付行業中有很多業務場景對于用戶隱私的保護要求很高,就無法使用主動式設備指紋做設備識別。 2.主動式指紋不能實現App和mobile web間,不同瀏覽器間的設備識別。主動式設備指紋對于需要跨網頁/應用追蹤用戶行為的場景,比如追蹤App安裝究竟來自哪個廣告渠道,就無能為力。 3.主動式設備指紋所取特征均暴露于客戶端,欺詐者可輕易通過一些一鍵新機等工具篡改相應特征信息,從而使指紋無效。這些場景就需要相對技術門檻更高的被動式設備指紋技術來解決了。 被動式設備指紋技術 最新的被動式設備指紋技術,從數據包的OSI七層協議中,提取出這臺設備的操作系統、協議棧和網絡狀態相關的特征,并結合機器學習算法以標識和跟蹤具體的移動設備。相比于主動式設備指紋技術,被動式設備指紋技術在適用范圍和靈活性上,有著不可比擬的優勢: 1)更大的適用范圍,由于被動式設備指紋技術完全工作在服務器側,一些無法植入SDK或JS的場景也可使用; 2)跨Web/App,跨瀏覽器的識別; 3)完全不侵犯用戶隱私,避免了被AppStore下架的風險。 混合式設備指紋技術 混合式設備指紋技術指將主動式和被動式設備指紋技術整合在同一個設備識別與跟蹤的架構中,將主動式設備指紋技術在客戶端生成的設備標識符,與被動式設備指紋技術在服務器端收集的、協議棧相關的特征信息對應起來,使得所有的設備都有一個唯一的設備識別ID。 混合式設備指紋技術融合了主動式和被動式設備指紋技術各自的優點,在準確識別設備的同時,擴大了設備指紋技術的適用范圍。 準確率進一步提高: 主動式設備指紋技術本身已經具有很高的準確率,接近100%。在此基礎上,混合式設備指紋技術能夠將主動式和被動式的識別結果相互印證和校驗,從而使準確率進一步提高。 適用范圍更廣: 出于隱私保護的目的,純主動式設備指紋技術的使用場景越來越受限,同時其對于SDK和JS代碼的依賴,致使其無法應用在不便于在客戶端植入代碼的場景。例如,Apple公司就嚴格限制APP中用戶與設備信息的收集行為,任何超越合理范圍的信息收集都可能被視為違規行為,而遭到APP下架的懲罰。 而混合式設備指紋技術則可根據用戶的不同場景,來靈活決定設備指紋的生成和校驗方式。對于用戶隱私保護要求寬松的場景,可以使用主動式設備指紋技術來獲得快速、穩定的設備標識;而對于用戶隱私保護要求嚴格,或無法嵌入SDK和Javascript代碼的場景,則可以使用被動式設備指紋技術。 此外,在需要將同一用戶在移動Web和App中的行為關聯起來的場景中,混合式設備指紋技術也有著比主動式更大的應用范圍。 用戶行為信息分析 在堅實的設備指紋的基礎上,需要在會話和賬號兩層采集和提取用戶行為信息。在會話的層面上,借助基于概率的聚類模型和模式挖掘算法(sequential pattern mining),將用戶的行為模式,比如事件發生的次序以及事件發生的間隔時間,歸為幾類。并在此基礎上識別出異常行為模式。 這些標示特征為區分正常用戶和欺詐者或自動化工具提供了重要信息;更進一步,在賬號的層面上:首先以賬號為索引,將會話層面上提取到的行為信息特征按時間串聯起來,得到賬戶層面的異常行為標示特征。其次根據賬號相關聯的歷史行為數據,提取出用戶的偏好屬性,比如是否為僵尸賬號,相鄰登錄的平均地理距離等。最后,我們將這些信息綜合起來,形成特有的用于反欺詐的用戶畫像。 當一個賬號再次出現在業務中時,用戶畫像中的特征就可以幫助我們評估對應業務事件的風險。在實踐中,我們還發現,由“羊毛黨”控制的賬號,通常具有某些相似性,比如所用手機號碼都來自某個號段,用戶名都由三個小寫字母,五個大寫字母和四個數字組成。據此,我們就可以定義賬號之間的相似度。這樣即使一個賬號首次出現,我們也可以使用用戶畫像,對其風險做一個大致的評估。 用戶畫像除了本身能直接應用于欺詐行為的判斷外。還可作為網絡圖譜模型的輸入,為欺詐網絡的發現提供線索和依據。 規則引擎與機器學習模型 目前并沒有一個通用的反欺詐框架可以識別并防范所有形式的欺詐。在每一個領域,金融欺詐都有不同的形式和特征,比如,一個應用于信用卡申請的反欺詐模型并不能直接應用于保險領域,亦無法直接應用于信貸領域。 最常用的反欺詐模型,是通過建立一個規則引擎或者機器學習模型來描述欺詐行為的特征,從而將欺詐行為從正常操作中區別開來。在反欺詐規則引擎中,這些甄別欺詐行為的規則依賴于從大量歷史案例中總結出來的“專家知識”。例如,如果一個人申請貸款所用的手機號與其常用的手機號不一致,則這筆申請的欺詐風險就被認定稍高一些。 反欺詐機器學習模型,它指的是采用數據挖掘方法,基于歷史數據(即,已知的欺詐申請和正常申請的數據)而建立的分類模型。這類模型的訓練往往需要大量數據。 兩者有何區別?規則引擎可以看作是一種特殊的最簡單的機器學習模型:決策樹模型。決策樹模型具有極好的可解釋性,因而,即使數據量不足,也可以通過專家知識來補全規則集。而廣義上的反欺詐機器學習模型往往指的是采用更復雜的算法建立的模型(如隨即森林、深度學習等)。這些模型的訓練需要大量的歷史數據并且其結果通常很難解讀。 不論是規則引擎還是機器學習模型,都是從歷史案例中發現金融欺詐時重復出現的個體行為模式。這個方法在很多領域被證明為有效(例如,用于審核個人還款能力意愿的信用評分模型),然而在解決金融欺詐問題時表現一般,原因有兩個: 其一,金融欺詐的模式隨時間不斷演化和發展,而不僅僅是重復出現在歷史案例中的個體行為模式; 其二,隨著反欺詐技術的進步,金融欺詐越來越難以由個體完成,而是需要通過團伙有組織的進行。 關系圖譜反欺詐 關系圖譜提供了全新的反欺詐分析角度。 關系圖譜是描述個體及個體之間關系的圖。下圖給出了一個移動支付場景的關系圖譜示例,個體類型可以包括IP地址、設備、支付賬戶、賬戶聯系人等,個體之間也可以存在不同的關系,比如IP登錄行為、設備登錄行為、聯系人登記行為等。 關系圖譜把不同的個體按照其關系連接在一起,從而提供了從“關系”的角度分析問題的能力。這更有利于從正常行為中識別出到異常的團伙欺詐行為。
接下來,我們來討論關系圖譜在反欺詐中的應用場景,主要分為監督模型和無監督模型兩種情況。所謂的監督模型,指的是在已知“好”和“壞”標簽的前提下,嘗試從歷史數據中,挖掘出欺詐團伙的典型特征和行為模式,從而能夠有效的識別出金融欺詐團伙。監督模型雖然在預測準確性上有不錯的表現,但是,實際情況中,“好”和“壞”的標簽往往很難得到。因此,在沒有標簽信息時,無監督模型分析也變得尤為重要。當然,本文提到的分析方法只是關系圖譜在反欺詐場景中的冰山一角,更多的算法模型需要結合實際業務需求進行設計和開發。 典型運用一:異常檢測 異常檢測是在無監督模型學習中比較有代表性的方法,即在數據中找出具有異常性質的點或團體。在檢測欺詐團體的情況下,異常檢測被認為是比較有效果的。 以貸款申請為例,許多團伙會選擇共享一些申請信息,如提供同一個皮包公司的地址作為公司信息,或者聯系人電話重合程度高。因此,在關系網絡中,大多數的正常的個體應該是獨立的節點,或者與另一個節點組成規模為二的團體(在這種情況下,多數可能為家人或親友關系)。若出現三個點以上甚至十幾個點關系密切時,則這些團體可被歸為異常。 異常檢測并不能夠明確的給出一個團體是否欺詐,但是可以通過這種方法排查出可疑的團伙,從而進行調查。該算法并不是基于歷史數據挖掘隱藏的欺詐模式,因而常常能夠有效地識別出新出現的未曾記錄的欺詐行為。 典型運用二:團體分群 團體分群即是對給定網絡中的團體依據以上特征進行區分,從而挖掘有潛在欺詐風險的團體的方法。舉一個簡單的例子,以團體中的男性占比和年齡差者兩個特征來對網絡中的團體進行分群。作為以家人關系而形成的團體,一般由三人形成,多為兩男一女或兩女一男,男性占比33%或67%,并且年齡差一般為20-30歲。具有這種性質的團體一般為家庭團體,因而風險性較小。但對于人數較多,男性占比高,而且年齡差較小的團體,則有可能是欺詐團伙,需要進一步調查。 以上,我們對設備指紋、用戶行為信息、規則引擎、機器學習、關系圖譜等反欺詐技術做了一個簡單的介紹。在反欺詐實踐中,這些提取出來的特征,結合多層動態模型,能有效地識別出高風險薅羊毛行為,幫助企業打擊“羊毛黨”。 該文章在 2022/7/15 9:28:02 編輯過 |
關鍵字查詢
相關文章
正在查詢... |