背景
運營同事發(fā)現(xiàn)大量的拼單、淘寶和閑魚上的會員賬號租借服務(wù)、外借賬號等問題已經(jīng)影響到了公司營收。為了緩解這種問題,我們決定限制單一賬號能夠保持登陸狀態(tài)的設(shè)備數(shù)量,以此提高租借賬號的成本。要想限制設(shè)備,首先要解決的問題就是如何識別一臺設(shè)備。這可以借助FingerprintJS 來解決,然而并不是所有指紋選項都能夠投入到生產(chǎn)環(huán)境。高熵值的指紋確實可以增加設(shè)備的識別率,但卻會導(dǎo)致設(shè)備指紋頻繁變化,從而引起用戶頻繁掉線,最終影響用戶體驗。因此我需要解決的第一個問題就是在設(shè)備識別率和用戶體驗之間找到一個熵值的平衡點。我采取的方案是先在各個試點項目中接入計算指紋的邏輯,并不定期給后端發(fā)送最新指紋計算結(jié)果,后端將這些數(shù)據(jù)收集起來進行分析,最終在指紋變化頻率在可接受范圍內(nèi)找到盡可能多的指紋選項。
數(shù)據(jù)
每條記錄都包含下列字段。
指紋(由小寫字母和數(shù)字組成的32位字符串)
下列32項是從用戶瀏覽器收集到的指紋的名稱。每個名稱對應(yīng)表的一個同名字段。如果對這些指紋的計算邏輯有興趣可以看看我的這篇文章
fonts、domBlockers、fontPreferences、audio、screenFrame、osCpu、languages、colorDepth、deviceMemory、screenResolution、hardwareConcurrency、timezone、sessionStorage、localStorage、indexedDB、openDatabase、cpuClass、platform、plugins、canvas、touchSupport、vendor、vendorFlavors、cookiesEnabled、colorGamut、invertedColors、forcedColors、monochrome、contrast、reducedMotion、hdr、math
標記(由小寫字母和數(shù)字組成的32位字符串):browserMark
創(chuàng)建時間(unix):createdAt
生成單個指紋所需時間(秒):generateTime
篩選可用指紋
上述的32類指紋不一定每個都符合我們的上線指標,因此要經(jīng)過篩選。判斷一個指紋是否可用需要參考兩個指標,這兩個指標必須同時合格才能被認定是可用指紋。
「平均變化周期」指標
在這一指標中,我需要觀察單個指紋的「平均變化周期」 是否在大多數(shù)設(shè)備上都能達到可接受的水平。
后端計算
中間變量的計算規(guī)則
在計算出最終結(jié)果之前會產(chǎn)生一些中間變量,下面列出了這些變量的計算規(guī)則。這些計算規(guī)則只是為了講述清楚我希望得到什么樣的計算結(jié)果,而不是要對計算過程的寫法做出的規(guī)定。
fcc(指紋變化周期)
依據(jù)browserMark對記錄分組,同組按照createdAt升序排列。 從頭依次遍歷組內(nèi)記錄,對每條記錄還需依次遍歷其全部種類的指紋。對于每一類指紋,都應(yīng)做如下處理:
用當前記錄的指紋比對相同指紋的「上一條記錄」,判斷兩者是否一致。若不一致 則認為此指紋發(fā)生了變化。 那么指紋本次的變化周期為當前記錄的createdAt減去當前指紋的「上一條記錄」的createdAt得到的差值。同時當前記錄作為此指紋的「上一條記錄」。若一致 則認為指紋沒有變化,繼續(xù)遍歷下一條記錄。
如果上面這段描述不夠清晰,可以結(jié)合下面的偽代碼來輔助理解:
const allRecord //查詢得到的全部記錄const fccCollector = {}for (let gi = 0; gi < allRecord.groupCount; gi++) {
const lastRecordMap = {} //這里存儲了各指紋的「上一條記錄」
const group = allRecord[gi] //當前分組
for (let ri = 0; ri < group.rowCount; ri++) {
const row = group[ri]; //當前記錄(行)
for (let ci = 0; ci < row.columnCount; ci++) {
const col = row[ci]; //當前列
const fingerprintName = col.name;//指紋的名稱
const fingerprintValue = col.value;//指紋的值
const lastRecord = lastRecordMap[fingerprintName];//取出「上一條記錄」
if (lastRecord && lastRecord.value != fingerprintValue) {//此時認為指紋發(fā)生了變化
const fcc = col.createdAt - lastRecord.createdAt; //計算本次的變化周期
fccCollector[col.browserMark][fingerprintName] = fcc //將本次fcc存起來
lastRecordMap[fingerprintName] = { value: fingerprintValue, createdAt: row.createdAt };
}
else if (!lastRecord) {//此時認為是此類型指紋首次出現(xiàn)
lastRecordMap[fingerprintName] = { value: fingerprintValue, createdAt: row.createdAt };
}
}
}}123456789101112131415161718192021222324252627
上述偽代碼中fccCollector
變量的結(jié)構(gòu)如下:
fccCollector={
browserMark1:{
fonts:[123,4341,111], //單位s,每一個數(shù)組元素是一個變化周期
domBlockers:[4213],
...//依次是32個指紋
},
browserMark2:{
fonts:[123],
domBlockers:[123],
...
},
...//依次是全部的browserMark}
上述偽代碼中lastRecord
變量的結(jié)構(gòu)如下:
{
fonts:{
value:"cde2267cc4c61e7bd9ebb893e2da3193",
createdAt:1640835596
},
domBlockers:{
value:"fa2fc67cc4c61e7bd9ebb893e2da3512",
createdAt:1640835341
},
...
}
afcc(指紋平均變化周期):
全部變化周期相加的和除以變化周期的數(shù)量,對計算結(jié)果向上取整。如果沒有變化,則認為變化周期是0。但凡有變化,由于向上取整,平均變化周期必然大于等于1。偽代碼如下:
//例如計算browserMark為cde2267cc4c61e7bd9ebb893e2da3193的設(shè)備的fonts指紋的平均變化周期function calculateAfcc() {
const browserMark = "cde2267cc4c61e7bd9ebb893e2da3193"
const fontsFcc = fccCollector[browserMark].fonts;
let sum = 0
if (fontsFcc.length > 0) {
for (let i = 0; i < fontsFcc.length; i++) {
sum += fontsFcc[i]
}
return Math.ceil(sum / fontsFcc.length)
}
return 0}
最終結(jié)果的計算規(guī)則
后端計算方法允許接受兩個 參數(shù):
計算結(jié)果 如下:
計算方法的描述
根據(jù)t來篩選指定日期范圍內(nèi)的記錄,并按照browserMark分組,分組數(shù)記為c。然后計算每組內(nèi)每種指紋的「平均變化周期」,也就是說每個browserMark都會對應(yīng)32個「平均變化周期」。然后按照32種指紋將全部「平均變化周期」分成32組,每組有c條數(shù)據(jù)。遍歷這c條數(shù)據(jù)計算出值大于等于x的條目的數(shù)量,用這個數(shù)量除以c,得到p。
前端展現(xiàn)

(為保護機密,上圖使用虛擬數(shù)據(jù))
因為很難做到某個指紋在所有設(shè)備上的平均變化周期都大于等于x,因此在前端還要經(jīng)過一道篩選,來決定要放棄多少設(shè)備。
「生成時間」指標
在這一指標中,我需要觀察指紋的「生成時間」 是否在大多數(shù)設(shè)備上都能達到可接受的水平。
后端計算
中間變量的計算規(guī)則
在計算出最終結(jié)果之前會產(chǎn)生一些中間變量,下面列出了這些變量的計算規(guī)則。同樣的,這些計算規(guī)則只是為了講述清楚我希望得到什么樣的計算結(jié)果,而不是要對計算過程的寫法做出的規(guī)定。
每臺設(shè)備的某指紋的平均生成時間
依據(jù)browserMark對記錄做分組,用組內(nèi)每條記錄的createdAt相加得到的和除以組內(nèi)記錄的數(shù)量得到平均生成時間。對計算結(jié)果向上取整。
最終結(jié)果的計算規(guī)則
后端計算方法允許接受兩個 參數(shù),如下:
計算結(jié)果 如下:
計算方法的描述
根據(jù)t來篩選指定日期范圍內(nèi)的記錄,并按照browserMark分組,分組數(shù)記為c。然后計算每組內(nèi)每種指紋的「平均生成時間」,也就是說每個browserMark都會對應(yīng)32個「平均生成時間」。然后按照32種指紋將全部「平均生成時間」分成32組,每組有c條數(shù)據(jù)。遍歷這c條數(shù)據(jù)計算出值小于等于x的條目數(shù)量,用這個數(shù)量除以c,得到p。
前端展現(xiàn)
因為很難做到某個指紋在所有設(shè)備上的平均生成時間都小于等于x,因此在前端還要經(jīng)過一道篩選,來決定要放棄多少設(shè)備的使用體驗。
該文章在 2023/8/4 1:23:36 編輯過