最近有一连串的推文和博客文章讨论了在PPC营销中使用平均值的问题。例如,Julie Bacchini认为“平均值是一个很糟糕的指标”的这个:
虽然有时平均值可能会产生误导,但上述数据集的问题在于样本中的大量人口差异和标准差。
$config[code] not found在这篇文章中,我想谈谈这里涉及的数学,并对平均值的价值进行说明,并回应一些对我最近在PPC社区中看到的平均报道的批评。
方差,标准差和方差系数
样本差异 是一种分散度量 - 数据集中的值可能与数据集的平均值有多大差异。它是通过从平均值中取每个数据点的差异平方的平均值来计算的。平衡差异可确保负偏差和正偏差不会相互抵消。
因此对于客户端1,只需计算0.5%与3.6%的平均变化之间的差异,然后将该数字平方。为每个客户执行此操作,然后获取方差的平均值:这是您的样本方差。
样本标准偏差 只是方差的平方根。
简单来说,平均而言,该数据集中的值通常比3.6%的总体平均值下降5.029%(即数字非常分散),这意味着您无法从此分布中得出很多结论。
估算标准偏差是否“过高”(假设您正在寻找正态分布)的简化方法是计算方差系数(或相对标准偏差),这只是标准偏差除以平均值。
这意味着什么,我们为什么要关心?这是关于平均报告的价值。当WordStream使用客户端数据进行研究时,我们不只是从小数据集中计算平均值并得出大的结论 - 我们关心数据的分布。如果数字到处都是,我们将它们抛弃并尝试以不同的方式(通过行业,支出等)对样本进行分段,以找到更有意义的模式,从中我们可以更自信地得出结论。
即使有意义的平均值也包括平均值以上和以下的值
反平均阵营的另一个批评是平均值并不代表整个人口。根据定义,这当然是正确的。
是的,平均值包含的数据点高于和低于平均值。但这并不是一个完全抛弃平均数的好理由。
假设正态分布,您可以预期大约68%的数据点与平均值相差+/- 1标准差,95%在+/- 2标准差内,99.7%在+/- 3标准差内,如图所示这里。
正如您所看到的,异常值确实存在,但如果您的数据集中的标准分布很紧密,那么它们就不像您想象的那么普遍。因此,如果您对数学非常谨慎,那么对于绝大多数广告客户而言,平均值仍然是非常有用的信息。
在PPC营销中,数学获胜
我们不要把洗澡水扔掉。毕竟,AdWords中几乎所有的效果指标(点击率,每次点击费用,平均排名,转换率等)都会报告为平均值。
让我们用数学的力量来判断你所看到的平均值是否有意义,而不是忽略平均值。
经许可重新发布。原来这里。
通过Shutterstock平均照片
更多内容:发布商渠道内容