「Adobe Analytics」什麼是哈希衝突&如何避免?

Adobe Analytics Haran 8小时前 14次瀏覽 0條留言

文章目錄

問題

你可能會遇到,有些eVar/Prop,本來不應該重複出現,但卻重複出現,如Order ID,你可以看到有些Order ID出現了多次:

進一步分析時,甚至會發現,相同的Order ID是在不同的行為流裡產生,也就是真的有這麼一個人,下了這個訂單。

而係統設計的Order ID是唯一,這就有衝突,又是哪裡出了問題呢?

 

 

原因

其實這是哈希衝突導致。

Adobe Analytics的維度收集到數據時,不管它的字串是幾個字節,還是幾百個字節,為了提高性能,會將其轉為哈希值存儲,使用的是32為哈希,理論上是有232個哈希組合(約43億),但當這個維度的數據量比較多的時候,仍有可能會出現兩個不同的值,計算的哈希值是衝突。

哈希衝突會出現在Workspace和ReportBuilder裡。

 

解決方法

  • 使用Warehouse,Warehouse不受哈希衝突影響。
  • 更改時間範圍:縮短時間範圍,減少重複出現的可能
  • 減少唯一值的數量,減少出現重複的可能

如果您在操作上仍有任何疑問,歡迎留言交流,或加入:Google Analytics 4交流社團發問
Like (0)
發佈我的留言
取消留言
表情 贴图 加粗 删除线 居中 斜体

Hi,*为發佈留言必須填寫。

  • 顯示名稱*
  • 電子郵件地址*
  • 個人網站網址