医学研究论文写作之研究两个以上变量间的关系
1.直线相关:
医学研究中常会遇到需要研究两个变量的关系问题,如年龄与体重、血铸与发僻、体重与体表面权……。两个变量之间的关系如画在直角坐标系中,以横轴为X 变量,以纵轴为Y 变量,可以得到散点图。从散点图中可直观地分析两者的关系,如图中的点子呈直线的趋势,即可进行直线相关分析。定量地描述直线相关关系的密切程度与方向的统计指标是相关系数ToT 的取值范围是-1-+1 ;两变量如呈同增同减的关系, r 值为正值,称为正相关;如呈一增一减的关系, r值为负值,称为负相关:如看不出有直线关系, r 值接近于0 ,称为无相关或零相关。r 的绝对值越接近1 ,说明相关关系越密切。一般讲,在样本例数较大的前提下, 1 r I ~0.7 时表示密切相关, 1 r I ~O.4时表示相关程度较弱,中间者为中等程度相关。
相关系数的计算以每一对数据代人公式而得,当然也需要通过假设检验,其检验用t检验或直接查r 值界限表。
2. 直线回归:
两个存在直线相关关系的变量,如果一个变量Y 受另一个变量X 的影响(如体重与年龄、体表面积与体重) ,习惯上把X 称作自变量,把Y 称为应变量,可以由X 值估计Y值,这就是直线回归分析。
直线回归分析,是根据全部样本的结果,找到表示X 与Y 关系的直线回归方程Y=a+bX ,用来描述Y 变量随着X 变量而变化的数量关系。必要时可用X 值估计Y 值。
直线回归的假设检验,可作回归系数b 的检验。但实际上不必作,因为对于同一资料而言, t,:功,而且r 的检验简单得多。
直线回归的用途是,可定量地描述两变量间的依存关系;利用回归方程,由一个容易测量的量去推算另一个不易测得的量,如由体重推算体表面积,由发乖推算血隶等。
需注意的是,研究相互关系要有实际意义。存在相关关系的两个变量,不一定是因果关系,也可能仅是表面上的伴随关系。在利用回归方程进行预测时,一般只适用于原来观测范围而不能随意扩大,因为超范围后很可能不再是直线关系。相关关系的假设检验所得的P 值是指检验假设成立的可能性。P 值越小,越有理由拒绝检验假设而认为存在相关关系, P 值不说明相关关系密切与否。
3. 多元线性相关与回归:
在实际工作中,一个应变量Y ,只受一个因素X 影响的情况较少。多数情况下,都是多个因素Xj 共同影响某一个应变量Y 。研究一个应变量与多个自变量间的线性相关与回归的方法称为多元线性相关与回归。
多元线性回归方程的一般表达式为Y=bo+b,X, +~X2+ … +brrXm多元回归分析在医学研究中的用途很广,随着计算机技术的普及,其应用越来越多。
主要用于进行因素分析,分析某些因素的重要性,找出关键因素;或是同时调整多个混杂因素的作用,研究人们感兴趣因素的作用;再就是用于预测与预报。
多元线性回归方程的求解和每个因素的检验十分繁杂,但应用微机和统计软件(如SAS~SSPS 等) ,已将这一计算过程变得十分容易实现。以多元线性回归为例,显然直接建立Y 与全部自变量之间的线性回归模型通常是不可取的。因为不能说这些自变量对建立此模型都是必要的,因此在建立回归方程的过程中,有必要考虑筛选自变量,从许多自变量中挑选出对Y 影响显著的自变量,有利于提高回归方程的质量。一般的作法是,筛选之前先给定挑选自变量进入方程的显著性水平,然后开始将自变量逐个引人方程,按自变量对Y 有显著贡献为标准而引人。同时每引人一个新变量后,对已选人的变量要进行逐个检验,将不显著的变量剔除,直到没有变量可以引人,也没有不显著的变量可以剔除为止。这样,保证最后进入方程的所有变量都是显著的。