文章目錄
問題
你可能會遇到,有些eVar/Prop,本來不應該重複出現,但卻重複出現,如Order ID,你可以看到有些Order ID出現了多次:
進一步分析時,甚至會發現,相同的Order ID是在不同的行為流裡產生,也就是真的有這麼一個人,下了這個訂單。
而係統設計的Order ID是唯一,這就有衝突,又是哪裡出了問題呢?
原因
其實這是哈希衝突導致。
Adobe Analytics的維度收集到數據時,不管它的字串是幾個字節,還是幾百個字節,為了提高性能,會將其轉為哈希值存儲,使用的是32為哈希,理論上是有232個哈希組合(約43億),但當這個維度的數據量比較多的時候,仍有可能會出現兩個不同的值,計算的哈希值是衝突。
哈希衝突會出現在Workspace和ReportBuilder裡。
解決方法
- 使用Warehouse,Warehouse不受哈希衝突影響。
- 更改時間範圍:縮短時間範圍,減少重複出現的可能
- 減少唯一值的數量,減少出現重複的可能