我们常说的平均数或被平均,通常指统计平均数,是用于反映现象总体的一般水平,或分布的集中趋势。
在理想情况下,三个反映数据集中趋势的统计术语应该是一样的:平均数、中位数(中间位置)和众数(出现最多)。
当一组数据中,最大值远超过最小值时,比如一家企业的这级管理者和收入最低的劳动者,工资可能相差几千倍,此时平均数会高于处在正中间位置的数据(中位数)。
在这种情况下,平均数就不能真实反映数据最集中的分布区域,中位数则正适合这种场景。
在实际的宏观数据中,我们很少能得到大量的同时公布中位数与平均数的数据。
几年前,我们在苏州的人力资源市场工资价位数据中发现过类似的数据(后来没有了)。今年,我们又在大连的《2024年大连市人力资源市场部分职业(工种)工资指导价位》中,发现了336种职业的中位数与平均数数据。
有了大规模数据,我们就能知道,中位数与平均数的分布,到底是怎样的,两者会有多大的差异。
下图展示了大连2023年度336职业、以中位数为基准的平均数差异。当数据为负时,表示平均数比中位数低。其余的大多情况下,平均数要高于中位数。
数据显示,336种被调查的职业中,有18.5%的职业,中位数要高于平均数,这是一种很奇怪的统计现象。
由于作者无法获取到这超过18%中位数大于平均数的原始数据,尚不清楚其间有怎样的规律。
其余超过80%的数据,比较符合我们的一般规律:在薪酬这类数据中,平均数会大于中位数。
从分布看,22%的数据,平均数只比中位数高不到5%,即平均数基本能反映中间数据的情况。
17.6%的数据,平均数比中位数多5%到10%。高出10%到15%的数据所占比重为14.6%,高出15%到20%的数据占7.4%。
所以,只剩下大约20%的数据,平均数会比中位数高20%以上,其中仅有4.2%的数据,平均数比中位数高40%以上。
当然,一座城市某个被调查职业的收入数据,其使用范围还是很小的。这里有另一组使用范围更大的中位数与平均数数据,可供参考。
2024年度全国居民收入与消费支出中提到,全国居民人均可支配收入41314元,全国居民人均可支配收入中位数34707元。
所以,此处的平均数比中位数高19%,处在上图大约80%的区间。
泰禾优配-广州炒股配资公司排名-线上开户的证券公司-股票配资开户费用提示:文章来自网络,不代表本站观点。