
第五节 常用统计图
医学研究中所获得的资料常包括多个观察对象及多个观察指标,上节介绍的统计表与本节介绍的统计图是应用广泛的统计描述方法。通过统计表和统计图可以对数据进行概括、对比或做直观的表达。制作统计图表有两个基本要求:一是正确,二是简洁,以反映事物内在的规律和关联。
统计图是运用点的位置、线段的升降、直条的长短或面积的大小来表示事物某特征的数量大小或变化趋势。采用统计图描述数据简洁直观,一目了然。
一、统计图的结构与制图原则
1.图形
根据资料的性质与分析目的选择恰当的图形。
2.标题
统计图应拟简明扼要的标题,用于说明资料的内容、地点、时间。标题一般位于图的正下方。
3.坐标轴
纵轴、横轴应有标目,标明尺度并注明单位。横轴的方向应自左至右;纵轴的方向应自下而上。表示量的数轴应标注合适的原点、尺度、单位;为美观考虑,统计图的轮廓以高∶宽 = 5∶7为宜。
4.图例
用不同线条或颜色表示不同事物时,应附图例说明,图例位于图形与标题之间。
二、常见统计图类型
(一)条图
条图用等宽直条的长度来表达参与比较的指标的大小,常用的有单式与复式条图。
例4-6
我国五座名山主峰的海拔高度情况,见表4-9。
表4-9 我国五座名山主峰的海拔高度情况

(1)CHISS软件绘制单式条图:
此数据库已建立在文件夹中,文件名为:b4-4.dbf。
1) 进入数据模块:打开数据库。点击“数据”→“文件”→打开“数据库表”,找到文件名“b4-4.dbf”→“确认”。
2) 进入图形模块:作单式条图。点击“图形”→“统计图”→“常用统计图”→“选图”→“增加”→“条图”→“确定”。“坐标”→“横轴”→选择“山名1”。“坐标”→“纵轴”→选择“海拔”。“X轴标识名→选择“山名”。“标数”→属性选择“值”→“3D”。
3) 进入结果模块:查看结果,点击“结果”,见图4-29。

图4-29 我国五座名山主峰的海拔高度情况
(2)SAS软件绘制单式条图

结果如图4-30:

图4-30 我国五座名山主峰的海拔高度
(3)Stata软件绘制单式条图
*导入样例b4-4的csv文件
import delimited E:\example\b4-4.csv,encoding(GBK)clear
*绘制条图,设置坐标轴标题
graph bar 海拔,over(山名,sort(山名1))///
ytitle("海拔(m)")///
subtitle("我国五座名山主峰的海拔高度")///
blabel(bar)
结果如图4-31:

图4-31 我国五座名山主峰的海拔高度情况
(4)SPSS软件绘制单式条图:
此数据库已建立在文件夹中,文件名为:b4-4.sav。
首先,打开文件,单击“文件”→“打开”→“数据”,找到文件名“b4-4.sav”,点击“打开”。
点击“图形”→“旧对话框”→“条形图”,弹出“条形图”对话框,如图4-32所示。选择“简单”,图表中的数据为选择“个案组摘要”。点击“定义”,弹出“定义简单条形图:个案组摘要”对话框,如图4-33所示,条形表示对话框中,选择“其他统计”,变量选择“海拔”,类别轴选择“山名”,点击“确定”。

图4-32 条形图对话框

图4-33 定义简单条形图:个案组摘要对话框
在输出界面中,双击“图形”进入图表编辑器,如图4-34所示,点击“编辑”→“选择X轴”,弹出“属性”对话框,在“类别”中的“顺序”里,可以更改横轴各个山名的顺序,完成后,点击“应用”,单击选择“平均值海拔”改为“海拔(单位:m)”,点击“选项”→“脚注”,输入脚注内容“我国五座名山主峰的海拔高度”,也可以右键选择“添加脚注”,输入脚注内容“我国五座名山主峰海拔高度”,右键点击“显示数据标签”。完成后关闭图表编辑器窗口。

图4-34 图表编辑器窗口
显示结果如图4-35所示。

图4-35 我国五座名山主峰的海拔高度情况
例4-7
甲、乙两校职称情况资料,见表4-10:
表4-10 甲、乙两校职称情况

(1)CHISS软件绘制复式条图:
此数据库已建立在文件夹中,文件名为:b4-5.dbf。
1) 进入数据模块:打开数据库。点击“数据”→“文件”→打开“数据库表”找到文件名“b4-5.dbf”→“确认”。
2) 进入图形模块:作复式条图。点击“图形”→“统计图”→“常用统计图”→“选图”→“增加”→“条图”→“确定”。“坐标”→“横轴”→选择“职称号”。“坐标”→“纵轴”→选择“甲校”。“选图”→“增加”→“条图”→“确定”。“坐标”→“横轴”→选择“职称号”。“坐标”→“纵轴”→选择“乙校”,“X轴标识名”→选择“职称”,“标数”→属性选择“值”→“3D” →“存图形”。
3) 进入结果模块:查看结果,点击“结果”,见图4-36。

图4-36 CHISS软件中甲、乙两校职称情况
(2)SAS软件绘制复式条图

结果如图4-37:

图4-37 SAS软件中甲、乙两校职称情况
(3)Stata软件绘制复式条图
*导入样例b4-5的csv文件
import delimited E:\example\b4-5.csv,encoding(GBK)clear
*绘制条图,设置坐标轴标题,结果如图4-38
graph bar 甲校人数乙校人数,over(职称,sort(职称序号))///
ytitle("甲校人数,乙校人数")///
legend(label(1 "甲校")label(2 "乙校"))///
blabel(bar)

图4-38 Stata软件中甲、乙两校职称情况
(4)SPSS软件绘制复式条形图:
此数据库已建立在文件夹中,文件名为:b4-5.sav。
首先,打开文件,单击“文件”→“打开”→“数据”,找到文件名b4-5.sav,点击“打开”。
第二,点击“图形”→“旧对话框”→“条形图”,弹出“条形图”对话框如图4-39所示,选择“簇状”,图表中的数据为选择“单独变量的摘要”,点击“定义”,弹出“定义簇状条形图:单独变量的摘要”对话框,如图4-40所示,在条形表示对话框中填入“甲校人数”“乙校人数”,在类别轴将“职称”填入,点击“确定”。

图4-39 条形图对话框

图4-40 定义簇状条形图:单独变量的摘要的对话框
在输出界面中,双击“图形”进入图表编辑器,单击选择“职称”改为“职称序号”,单击选择“平均值”改为“甲校人数、乙校人数”,点击“选项”→“脚注”,输入脚注内容“统计图”,右键点击“显示数据标签”。完成后关闭图表编辑器窗口。
显示结果如图4-41所示。

图4-41 甲、乙两校职称情况
条图的数值轴(常用纵轴)尺度必须从零点起标示,否则可能对指标间的大小关系形成误导。如图4-42,纵轴从2起始,给人以4∶1的印象,与实际比例2∶1不符。
各直条宜按某一个指标的大小排列,便于比较。需要分离的直条之间的间隔要安排适当,以求全图紧凑、协调、美观。

图4-42 条图纵坐标应从零点开始
(二)直方图
直方图用于表示连续性定量变量的频数分布或频率分布。通常用横轴表示变量,用纵轴表示频数与组距的比例。在取相等组距的时候,各组段上的矩形的高与该组段的频数成正比(图4-43)。
绘制直方图也应注意纵轴要从零点起标示。横轴一般以取相等组距为宜。如果需要取不相等的组距,应按公式“矩形高 = 组段频数/组距”来调整矩形的高度。

图4-43 120名正常成年男子红细胞计数
1.CHISS软件绘制直方图
此数据库已建立在文件夹中,文件名为:b4-1.dbf。
(1)进入数据模块:
打开数据库。点击“数据”→“文件”→打开“数据库表”,找到文件名“b4-1.dbf”→“确认”。
(2)进入统计模块:
作直方图。点击“统计”→“统计描述”→“频数表”。光标选中变量“红细胞计数”,分组数为“10”、第一组下限为“3.2”、组距为“0.3”→“编制频数表”→“到结果”→“完成”。
(3)进入结果模块:
查看结果,点击“结果”,见图4-43。
2.SAS软件绘制直方图

结果见图4-44。

图4-44 SAS软件中120名正常成年男子红细胞计数
3.Stata软件绘制直方图
*导入样例b4-1的csv文件
import delimited E:\example\b4-1.csv,encoding(GBK)clear
*绘制直方图,结果如图4-45
hist 红细胞计数,freq

图4-45 Stata软件中120名正常成年男子红细胞计数
4.SPSS软件绘制直方图
此数据库已建立在文件夹中,文件名为:b4-1.sav。
首先,打开文件,单击“文件”→“打开”→“数据”,找到文件名“b4-1sav”,点击“打开”。
第二,点击“转换”→“计算变量”,弹出“计算变量”对话框,如图4-6所示,目标变量设为“分组”,函数组选择“算数”,双击TRUNC,在数字表达式输入“TRUNC((红细胞计数 − 3.20)/ 0.3) + 1”,点击“确定”。
第三,点击“分析”→“描述统计”→“频率”,弹出“频率”对话框,如图4-7所示,将“分组”填入变量中,点击“图表”,图表类型选择“直方图”,点击“继续”,选择“确定”。
结果显示如图4-9所示。
(三)饼图
饼图是用同一圆形中的扇形的弧度表示全体中各部分所占的比重。
例4-8
某学校在校学生学历情况如下表,试做适当的饼图说明医院学历的情况,见表4-11。
表4-11 某学校在校学生学历情况

1.CHISS软件绘制饼图
此数据库已建立在文件夹中,文件名为:b4-6.dbf。
(1)进入数据模块:
打开数据库。点击“数据”→“文件”→打开“数据库表”,找到文件名“b4-6.dbf”→“确认”
(2)进入图形模块:
作圆饼图。点击“图形”→“统计图”→“常用统计图”→“选图”→“增加”→“圆图”→“确定”。“坐标”→“横轴”→选择“学历号”。“坐标”→“纵轴”→选择“人数”。“X轴标识名”→选择“学历”。“标数”→属性选择“标识 + 百分比”→“3D”。
(3)进入结果模块:
查看结果,点击“结果”,见图4-46。

图4-46 CHISS软件中某学校在校学生学历构成比
2.SAS软件绘制饼图

结果如图4-47:

图4-47 SAS软件中某学校在校学生学历构成比
3.Stata软件绘制饼图
*导入样例b4-7的csv文件
import delimited E:\example\b4-6.csv,encoding(GBK)clear
*绘制圆图,结果如图4-48
graph pie 人数,over(学历)///
plabel(_all percent,color(white)

图4-48 Stata软件中某学校在校学生学历构成比
4.SPSS软件绘制饼图
此数据库已建立在文件夹中,文件名为:b4-6.sav。
首先,打开文件,单击“文件”→“打开”→“数据”,找到文件名“b4-6sav”,点击“打开”。
第二,点击“图形”→“旧对话框”→“饼图”,弹出“饼图”对话框如图4-49所示,选择“个案组摘要”,点击“定义”,弹出“定义饼图:个案组摘要”对话框,如图4-50所示,分区表示中选入“变量总和”,变量中填入“人数”,分区定义依据填入“学历”,点击“确定”。

图4-49 饼图对话框

图4-50 定义饼图:个案组摘要对话框
在输出界面中,双击“图形”进入图表编辑器,右键点击“显示数据标签”,弹出“属性”对话框,如图4-51所示,显示对话框选择“百分比”,点击“应用”。点击“选项”→“脚注”,输入脚注内容“统计图”。完成后关闭图表编辑器窗口。
显示结果如图4-52所示。

图4-51 属性对话框

图4-52 SPSS软件中某学校在校学生学历构成比
(四)线图
线图在直角坐标系中用线段的升降表达一事物的量随另一事物的量变化的趋势,或某事物的量随时间变化的过程。普通线图的纵、横坐标均为算术尺度,且不一定从0开始。
图4-53是根据表4-12数据绘制的线图。注意在同一图形内不宜包括过多的折线。
表4-12 1975—1990年某地痢疾与百日咳死亡率


图4-53 1975—1990年某地百日咳与痢疾死亡率(1/10万)
例4-9
为讨论父子身高间的线性相关程度,南方某地在应届中学毕业生花名册中随机抽取20名男生,分别测量他们和他们的父亲的身高(cm),得样本资料,见表4-13,试作图分析。
表4-13 某地中学生及其父亲身高测量数据(cm)

1.CHISS软件绘制线图
此数据库已建立在文件夹中,文件名为:b4-7.dbf。
(1)进入数据模块:
打开数据库。点击“数据”→“文件”→打开“数据库表”,找到文件名“b4-7.dbf”→“确认”
(2)进入图形模块:
作线图。点击“图形”→“统计图”→“常用统计图”→“选图”→“增加”→“线图”→“确定”。“坐标”→“横轴”→选择“父高”,“坐标”→“纵轴”→选择“子高”。
(3)进入结果模块:
查看结果,点击“结果”,见图4-54。

图4-54 CHISS软件中某地中学生及其父亲身高线图
2.SAS软件绘制线图

结果如图4-55:

图4-55 SAS软件中某地中学生及其父亲身高线图
3.Stata软件绘制线图
*导入样例b4-7的csv文件
import delimited E:\example\b4-7.csv,encoding(GBK)clear
*绘制线图,结果如图4-56
line 子高父高

图4-56 Stata软件中某地中学生及其父亲身高线图
4.SPSS软件绘制线图
此数据库已建立在文件夹中,文件名为:b4-7.sav。
首先,打开文件,单击“文件”→“打开”→“数据”,找到文件名“b4-7sav”,点击“打开”。
第二,点击“图形”→“旧对话框”→“折线图”,弹出“折线图”对话框,如图4-57所示,选择“简单”,图表中的数据为“个案组摘要”,点击“定义”,弹出“定义简单折线图:个案组摘要”对话框,如图4-58所示,折线表示选择“其他统计”,变量中填入“子高”,类别轴中填“父高”,点击“确定”。

图4-57 折线图对话框

图4-58 定义简单折线图:个案组摘要对话框
在输出界面中,双击“图形”进入图表编辑器,单击选择“平均值子高”改为“子高”,点击“选项”→“脚注”,输入脚注内容“统计图”。完成后关闭图表编辑器窗口。
显示结果如图4-59所示。

图4-59 某地中学生及其父亲身高线图
(五)散点图
散点图用点的密集程度和趋势反映两个或多个变量之间的关系。图4-60是根据例4-9的数据绘制的散点图。

图4-60 CHISS软件中某地中学生及其父亲身高散点图
1.CHISS软件绘制散点图
(1)进入数据模块:
打开数据库。点击“数据”→“文件”→打开“数据库表”,找到文件名“b4-7.dbf”→“确认”
(2)进入图形模块:
作散点图。点击“图形”→“统计图”→“常用统计图”→“选图”→“增加”→“散点图”→“确定”。“坐标”→“横轴”→选择“父高”,“坐标”→“纵轴”→选择“子高”。
(3)进入结果模块:
查看结果,点击“结果”,见图4-60。
2.SAS软件绘制散点图

结果如图4-61。

图4-61 SAS软件中某地中学生及其父亲身高散点图
3.Stata软件绘制散点图
*导入样例b4-7的csv文件
import delimited E:\example\b4-7.csv,encoding(GBK)clear
*绘制散点图,结果如图4-62
scatter 父高子高

图4-62 Stata软件中某地中学生及其父亲身高散点图
4.SPSS软件绘制散点图
此数据库已建立在文件夹中,文件名为:b4-7.sav。
首先,打开文件,单击“文件”→“打开”→“数据”,找到文件名“b4-7sav”,点击“打开”。
第二,点击“图形”→“旧对话框”→“散点图/点图”,弹出“散点图/点图”对话框,如图4-63所示,选择“简单散点图”,点击“定义”,弹出“简单散点图”对话框,如图4-64所示,Y轴填入“子高”,X轴填“父高”,点击“确定”。

图4-63 散点图/点图对话框

图4-64 简单散点图对话框
显示结果如图4-65所示。

图4-65 SPSS软件中某地中学生及其父亲身高散点图
(六)误差图
误差图是在条图或线图的基础上,在图中附上标准差或标准误的范围,从而估计其离散程度。
例4-10
甲、乙、丙三个城市人均收入见表4-14,试作图(条图加误差)表示。
表4-14 三城市人均收入

1.CHISS软件绘制误差图 此数据库已建立在文件夹中,文件名为:b4-8.dbf。
(1) 进入数据模块:打开数据库。点击“数据”→“文件”→打开“数据库表”,找到文件名“b4-8.dbf”→“确认”。
(2) 进入图形模块:作误差条图。点击“图形”→“统计图”→“常用统计图”→“选图”→“增加”→“误差条图”→“确定”。“坐标”→“横轴”→选择“编码”,“坐标”→“纵轴”→选择“月均收入”,“X轴标识名”→选择“城市”,“标准差”→选择“标准差”→“3D”。
(3) 进入结果模块:查看结果,点击“结果”,见图4-66。

图4-66 CHISS软件中三城市人均收入
2.SAS软件绘制误差图

结果如图4-67:

图4-67 SAS软件中三城市人均收入

结果如图4-68:


图4-68 SAS软件中三城市人均收入
结果如图4-69:

图4-69 SAS软件中三城市人均收入
3.Stata软件绘制误差图
*导入样例b4-8的csv文件
import delimited E:\example\b4-8.csv,encoding(GBK)clear
*绘制误差条图,结果如图4-70
gen e1 = 月均收入 + 标准差
gen e2 = 月均收入−标准差
twoway(bar 月均收入编码,barw(0.65))(rcap e1 e2 编码),///
xlabel(1 "甲" 2 "乙" 3 "丙")///
legend(off)///
ytitle("月均收入 ")

图4-70 Stata软件中三城市人均收入
4.SPSS软件能够根据原始数据绘制误差图,但无法根据已知的标准差绘制误差图。
(赛晓勇 童新元)