医用统计方法是医学科研和论文撰写的一个基本工具,但是不少医学科研及临床工作者对统计方法的正确应用缺乏足够的知识,在实际应用过程中常常出现一些不妥用法甚至误用现象。正确使用统计方法,能使研究结果具有科学性和说服力;反之,如果使用不当,不仅不能准确地反映科研结果,而且可能带来错误的结论。
1、所选统计方法脱离了资料的性质
不同的资料类型和不同的研究目的采用不同的统计方法。按照资料的性质测定指标的多少,确定资料是计数资料还是计量资料,应用单因素分析还是多因素分析。
1〃1多因素资料是对每个研究对象测量的多个指标同时进行的综合分析,其分析计算过程相对复杂。常用的有回归分析;相关分析以及判别分析、聚类分析、主成分分析和因子分 析等。多因素分析多用于计量资料。
1〃2 单因素分析应用较多,按获取资料的方法,分计数资料和计量资料。首先,计数资料主要是针对要求某现象的频率和比例,利用率或比的相应计算方法。如做不同样本问的比 较则采用计数资料的显著性检验,样本率与总体率的比较用u检验;两个样本率的比较可用u检验或四格表的x 检验,多个样本率的比较可用行乘列的卡方检验或2XC表的卡方检验。其次,计量资料要结合研究目的确定相应的统计方法。对于显著性检验通常有T检验和F检验,T检验是用于两个均数问的比较,按研究设计与比较内容的不同又分为样本均数和总体均数的比较,两个样本均数差别的检验,配对资料的显著性检验。F检验用于多个样本均数的比较,按设计类型分完全随机设计的方差分析、随机区组设计的方差分析和组内分组资料的方差分析。
2、根据研究目的选用统计分析方法
不同的统计方法说明不同的问题,同样不同的问题要应用不同的统计方法来分析和表达。研究者在做统计分析前,首先要明确资料分析的目的、意图是什么,通过分析最终达到什么样的期望,临床工作者科研通常的目的主要有:
2〃1某现象发生的频率或比例如人群中重复癌的发生率,
采用频率指标,构成指标或相对比,可计算发病、患病、感染、阳性频率或构成等。 2〃2某人群的特征值,如平均身高、体重、血压等,采用平均水平和变异的统计指标。 2 . 3 临床正常值范围如血红蛋白、血糖、尿铅含量,多采用中位数法或平均数法。
2〃4 临床诊断方法效率评价,可分别计算各种诊断方法对某病诊断的准确度和可靠度,如x线对肺癌的诊断。
2〃5 临床疗效分析比较 如几种药物疗效的比较,视资料性质作显著性检验。
2〃6 现象间关联情况分析如眼PSRT与屈光度的关系,用线形相关和回归分析。 2〃7 人群的归类、评价,可选用判别分析、聚类分析、主成分分析等。
临床研究和实践中决不能通过统计学方法去实现自己的想象。根据已确定的结果刻意去套用某种统计方法,用目的去规划统计过程,只要分析比较,就一定要求结果显著等 等现象,只能使文章更为空洞,有失科学性。
3 严格把握统计方法的适用条件
各种统计分析方法都有其适应条件,在选用统计方法时,应严格把握,充分考虑所分析的资料是否符合其适用条件。对于计量资料在计算均数或显著性检验时,其基本条件
是正态分布、方差齐性,在资料分析时要通过图示或检验看是否符合这些基本条件,若不符合则需要做相应的处理。计算集中趋势指标可使用中位数或几何均数。做统计学检验
可通过数据转换使其成为正态分布,常用的转换方式有对数转换、幂指数转换、平方根转换等,或者改非参数检验。计数资料各种方法均有其自身的适应条件,如上列举的方法其基本条件是某一事件概率不会太小,若发生概率太低,则改用小概率事件显著性检验。 4 充分理解资料样本含量的概念
统计学是对研究样本进行抽象归纳的科学,没有足够的样本量就不可能得出正确的结论,而且统计方法也有其样本量的要求。如四格表的卡方检验要求样本量大于40,方格中理论数大于5(n~>40,t>5),若不符合则用校正卡方检验或精确概率法。行x列表的卡方检验要求理论数均大于1且小于5者不超过表中数的1/5,若不符合则改用其它方法(合理合并)。 5 合理控制混杂因素的影响
任何一种现象的发生都不是单纯的,要受多种因素的影响。当分析比较不同人群某现象的发生或存在状况时,要考虑除研究因素以外比较组之间其它条件是否相同,内部构成是否一致,其它因素对研究现象的影响如何。例如,有人研究文化素质对生育水平的影响,按年龄分组,发现50岁以上年龄组比20岁以上年龄组生育水平高而文化素质低,因而结论是文化素质与生育水平呈负相关。这一结论的错误就在于做缺乏资料的综合分析认识能力和混杂因素对研究现象的影响,忽视我国计划生育政策对不同年龄妇女生育的作用。
混杂因素应在研究之前通过研究对象选择、设立对照、随机、匹配、双盲法等控制,但如果事先没有良好设计,则通过统计方法可以控制。若资料内部构成不同,存在混杂因
素,简便方法是分组比较或标化处理。若样本量不允许分组,则对计数资料可用组内分组的卡方检验、卡方值分割法、加权卡方检验法等,计量资料的比较可用协方差分析。
资料的统计处理并非是研究工作的最终目的,而是通过统计学分析为研究结论提供依据或线索,因此对统计资料做统计分析后,要正确把握统计学术语,对结论做科学的分析
和解释。拒绝检验假设,习惯上称有显著性,不应误解为差别很大或在医学上有很显著的价值,统计学亦不能回答比较样本的总体一定相等或一定不相等,因为统计推断是以一定 的概率界值为依据,说明来自同一总体可能性的大小。应用统计学分析的目的是通过研究样本推断总体,如果研究结论不能适当外延,则该项研究毫无意义。