AB_test

最新推荐文章于 2025-02-26 08:05:05 发布

原创最新推荐文章于 2025-02-26 08:05:05 发布 · 297 阅读

CC 4.0 BY-SA版权

3 篇文章

订阅专栏

为了验证一个策略的效果，同一时段内，给实验组（采取优化的策略）与对照组（采取原策略），对比看那种策略的效果的实验方法。

待补充

http://abtestguide.com/calc/
这个网站计算的指标比较完善，p值，z值和其他很多本文未介绍的指标都有。这个网站还考虑了单侧实验和双侧实验的情况。不过它的问题是不太稳定（可能和我这边的网络环境有关系）。
https://vwo.com/ab-split-test-significance-calculator/
这个网站只计算了单侧检验的p value。好处是比较稳定。
https://vwo.com/ab-split-test-duration/
数据量不够，可以用这个工具看看是否实验时间不足。

注意控制变量，除实验策略不同以外，其他场景尽量保持一致,减少外部因素干扰

AB test 帮助你在现有流量中获取更多的收益，或者在现有流量中提升ROI，或者说在现有用户基础上提升活跃度，但是在衡量对用户量增长或者获取新流量是否有帮助上，ab test或者所起作用不大。
AB test还有一个缺点，就是只能做小范围的效果比较，比如作用于同一个场景使用不同算法的效果比较；比如它不能告诉我们，A业务的推荐算法是否比B业务的推荐算法做得好；也就是说它不能衡量一个模型的迁移和泛化能力；