标准差的意义 什么是标准差

茎叶图是一种显示原始数据分布状况的图形,由“茎”和“叶”两部分组成 。茎叶图不仅能反映数据的分布特征,还能保留原始数据的信息 。茎叶图适用于未分组的定量数据,特别是当数据量较少时 。

标准差的意义 什么是标准差

文章插图

要绘制茎叶图,首先要把一个数字分成两部分,通常以该数据的高位数值作为树的“茎”,树的“叶”只保留该数值的最后一位数字 。例如,425分为42|5,42为“茎”,5为“叶” 。然后,按照“茎”的大小顺序排列,并把对应的“叶”列在“茎”的右边 。如果某个“茎”对应的“叶”过多,可以将该“茎”重复一次或多次,以便观察数据的细节 。

标准差的意义 什么是标准差

文章插图

下面是一个茎叶图的例子:
8| 0 10| 0 10| 123456789 11| 0123456789 11| 0123456789 12| 0123456789 12| 0123456789 12| 56789 13| 0123456789 13| 0123456789 13| 123456789 14| 0123456789 14| 0123456789 14| 0123456789 14| 56789
【标准差的意义 什么是标准差】这个茎叶图表示了一组8-20岁年龄的调研样本 。从图中可以看出,每个“茎”代表10个年龄段,每个“叶”代表一个样本 。例如,第一行表示有一个8岁的样本,第二行表示有一个10岁的样本,第三行表示有10个10岁的样本,依此类推 。

标准差的意义 什么是标准差

文章插图

从图中还可以看出,数据的分布大致呈对称形状,没有明显的极端值或异常值 。我们可以用一些统计量来描述数据的分布特征,如中位数、平均数、标准差等 。
中位数是将数据从小到大排列后位于中间位置的数值 。如果数据个数是奇数,则中位数就是中间那个数;如果数据个数是偶数,则中位数就是中间两个数的平均值 。在茎叶图中,可以通过计算每个“茎”对应的“叶”的频数来确定中位数所在的位置 。例如,在上面的例子中,共有150个样本,所以中位数应该在第75和第76个样本之间 。从图中可以看出,第75个样本是13岁,第76个样本也是13岁,所以中位数就是13岁 。
平均数是将所有数据相加后除以数据个数得到的数值 。在茎叶图中,可以通过将每个“茎”乘以主干宽度(即每个“茎”代表多少个单位),再加上每个“叶”的值来计算每个样本的具体数值 。然后将所有样本的数值相加,并除以样本个数来得到平均数 。例如,在上面的例子中,主干宽度是10,所以第一个样本的数值是80(8乘以10加上0),第二个样本的数值是100(10乘以10加上0),依此类推 。将所有样本的数值相加得到13200(80+100+101+…+145),再除以样本个数150得到平均数88(13200除以150) 。
标准差是衡量数据离散程度的一个指标,它反映了每个数据与平均数之间的偏差大小 。标准差越小,说明数据越集中在平均数附近;标准差越大,说明数据越分散在平均数两侧 。在茎叶图中,可以通过计算每个样本与平均数之间的差值(即残差)来得到标准差 。然后将所有残差平方相加,并除以样本个数减一来得到方差 。最后再开方来得到标准差 。例如,在上面的例子中,第一个样本与平均数之间的残差是-8(80-88),第二个样本与平均数之间的残差是12(100-88),依此类推 。将所有残差平方相加得到11400(-8(2+12)2+…+57^2),再除以149得到方差76.51(11400除以149) 。最后再开方得到标准差8.75(76.51开方) 。