当前位置:网站首页>数据分析知识点搜集(纯粹的搜集)
数据分析知识点搜集(纯粹的搜集)
2022-08-03 22:53:00 【二思后行】
A/B Testing
A/B 测试是促进业务持续增长的最实用、最有效的方式。
主要是实验组和对照组的对比,观察(A/B差别的显著性)是否符合统计上的显著和业务上的显著。
产品迭代流程
产品 / 业务迭代的流程大概分为 3 步:
- 具体的业务问题催生出迭代的想法,比如出现业务问题后,团队会提出具体的迭代方案;
- 团队论证方案的可行性和效果;
- 论证完成后,具体实施迭代方案。
棣莫弗—拉普拉斯中心极限定理
棣莫弗—拉普拉斯中心极限定理(De Moivre-Laplace),即二项分布以正态分布为其极限分布定律。
中心 极限定理
不管是什么概率分布,只要样本数据量足够大,样本 统计量近似服从 正态分布
中心极限定理在A/B测试中的应用
中心极限定理是概率论中最重要的一类定理,它支撑着和置信区间相关的T检验和假设检验的计算公式和相关理论。如果没有这个定理,之后的推导公式都是不成立的。
事实上,以上对于中心极限定理的两种解读,在不同的场景下都可以对A/B测试的指标置信区间判定起到一定作用。
- 对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;
- 而对于那些不属于正态分布的数据,根据中心极限定理,在样本容量很大(>30)时,总体参数的抽样分布是趋向于正态分布的,最终都可以依据正态分布的检验公式对它进行下一步分析。
幂律分布
统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即,系统中个体的尺度相差悬殊,缺乏一个优选的规模。可以说,凡有生命的地方,有进化,有竞争的地方都会出现不同程度的无标度现象。
指标的统计属性
- 均值类的指标,比如用户的平均使用时长、平均购买金额、平均购买频率,等等。
- 概率类的指标,比如用户点击的概率(点击率)、转化的概率(转化率)、购买的概率(购买率),等等。
在数量足够大时,均值类指标服从正态分布;概率类指标本质上服从二项分布,但当数量足够大时,也服从正态分布。
假设检验
Null Hypothesis
Alternative Hypothesis
- 零假设是,实验组和对照组的点击率是相同的。
- 备择假设是,实验组和对照组的点击率是不同的。
在 A/B 测试的实践中,更推荐使用双尾检验。
T检验和Z检验
根本是,方差是否知道。
不知道,就用样本反差估计总体方差,然后用t检验,但是在现在的大数据时代,基本上只要样本量>30就可以认为Z和T检验是一样的。

第一类错误 a
假阳性概率
误诊
第二类错误 b
假阴性概率
漏诊
把握度power
1-b = 不漏的概率
P值
当零假设成立,观测到对照组和实验组不同的概率。
边栏推荐
猜你喜欢

2022-08-02 mysql/stonedb slow SQL-Q18 - memory usage surge analysis

Software testing is seriously involution, how to improve your competitiveness?

"Digital Economy Panorama White Paper" Financial Digital User Chapter released!

重发布实验报告

The principle and use of AOSP CameraLatencyHistogram

Network basic learning series four (network layer, data link layer and some other important protocols or technologies)

Another MySQL masterpiece published by Glacier (send the book at the end of the article)!!

node连接mysql数据库报错:Client does not support authentication protocol requested by server

2022-08-03 Oracle executes slow SQL-Q17 comparison

HCIP BGP实验报告
随机推荐
BMN: Boundary-Matching Network for Temporal Action Proposal Generation Reading Notes
Gains double award | know micro easily won the "2021 China digital twin solution suppliers in excellence" "made in China's smart excellent recommended products" double award!
Recognized by International Authorities | Yunzhuang Technology was selected in "RPA Global Market Pattern Report, Q3 2022"
PowerMockup 4.3.4::::Crack
HCIP BGP lab report
目标检测的国内外研究现状
Kotlin - extension functions and operator overloading
Work Subtotal QT Packing
Scala基础【正则表达式、框架式开发原则】
举一个 web worker 的例子
Live Preview | Build Business Intelligence, Quickly Embrace Financial Digital Transformation
RPA power business automation super order!
"Digital Economy Panorama White Paper" Financial Digital User Chapter released!
Embedded Systems: GPIO
Code Casual Recording Notes_Dynamic Programming_416 Segmentation and Subsetting
Storage engine written by golang, based on b+ tree, mmap
113. 授人以渔 - 如何自行查询任意 SAP UI5 控件属性的文档和技术实现细节
优化查询(工作中)
OPC UA 与IEC61499 深度融合(1)
Summary bug 】 【 Elipse garbled solution project code in Chinese!
