箱线图怎么看
-
-
类目:知识大全
-
联系人:
-
微信号:
-
Q Q 号:
-
手机号:
-
浏览量:
304
【商户信息】
【货源详情】
1.方框中间的线是数据的中位数,代表样本数据的平均水平。
2.盒子的上限和下限分别是数据的上四分位数和下四分位数。这意味着这个盒子包含了50%的数据。所以盒子的宽度在一定程度上反映了数据的波动程度。
3.盒子的上下各有一条线。有时它代表最大值和最小值,有时一些点“蹦”出来。请不要纠结,不要纠结,不要纠结(重要的事情说三遍)。如果有东西出来,就理解为“离群值”就好了。
箱线图是针对连续变量的。解读时,重点是平均水平、波动程度、异常值。当盒子很平,或者有很多异常的时候,尝试做对数变换。当只有一个连续变量时,不适合画箱线图,直方图是比较常见的选择。使用盒图最有效的方法是用一个或多个定性数据进行比较并绘制分组盒图。
在同一个数轴上,平行排列几批数据的箱线图,几批数据的中位数、尾长、异常值、分布区间等形态信息会一目了然。在一批数据中,哪些数据点是突出的,哪些数据点是低劣的,这些数据点在同类其他组中处于什么位置,可以通过比较各个箱线图的异常值来看。每批数据的四分位数距离,正常值的分布是集中还是分散,可以通过观察每个方框和线段的长度来看。每批数据分布的偏斜度是多少,分析中位线和离群点的位置也可以估计出来。还有一些箱线图的变体,使得数据批次之间的比较更加直观清晰。