找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

查看: 2877|回复: 11

统计学小知识

  [复制链接]
发表于 2010-11-14 16:49 | 显示全部楼层 |阅读模式

马上注册登录,享用更多感控资源,助你轻松入门。

您需要 登录 才可以下载或查看,没有账号?注册 |

×

总体与样本

统计学研究的基本单位是观察单位,又称个体。它既可以是一个人,也可以是一个菌落形成单位,甚至是一个细菌或病毒。根据研究目的而确定的全体称为总体,更确切地说,它是同质的所有观察单位某种观察值的集合。在医学研究中,为节省人力、物力、财力和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体中抽取部分观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原则,从总体中随机抽得的部分观察单位,其实测值的集合就称为样本。如何正确地从样本结果中推测总体情况,是统计学要解决的问题。样本对总体有足够的代表性是正确的统计基础。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:50 | 显示全部楼层

变量与资料

  确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量(variable).对变量的观VII值称为变量值(value of variable)或观察值(observed value),由变量值构成资料(data).例如,以人为观察单位调查某地某年7岁正常儿童的生长发育状况,性别、身高、体重等都可视为变量,性别有男有女,身高可高可矮,体重可轻可重,不同个体不尽相同,这种个体间的差异称为变异,这些变异来源于一些已知的或未知的,甚至是某些不可控制的因素所导致的随机误差。变量的观察结果也可以是定量的,例如身高的厘米数,也可以是定性的,例如新生儿是男是女。按变量是定量或定性,可将资料分为以下几种类型:


1
.计量资料(measurement data)又称定量资料(quantitative data)或数值变量(numerical variable)资料。为观钡」每个观察单位某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型(continuous)或离散型(discrete)两类。前者可在实数范围内任意取值,如身高、体重、血压等;后者只取整数值,如某医院每年的病死人数等。


2
.计数资料(enumeration data)又称定性资料(qualitative data)或无序分类变量(unordered categorical variable)资料,亦称名义变量(nominal variable)资料,是将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。其变量值是定性的,表现为互不相容的属性或类别,如试验结果的阳性阴性,家族史的有无等等。分两种情形:


(1)二分类:如检查某小学学生大便中的蛔虫,以每个学生为观察单位,结果可报告为蛔虫卵阴性与阳性两类;如观察某药治疗某病患者的疗效,以每个患者为观察单位,结果可归纳为治愈与未愈两类。两类间相互对立,互不相容。


(2)
多分类:如观察某人群的血型处布,以人为观察单位,结果可分为A型、B型、AB型与O型,为互不相容的四个类别。

3.等级资料(ranked data)又称半定量资料(semi-quantitative data)或有序分类变量(ordinal categorical variable)资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。如观察某人群某血清反应,以人为观察单位,根据反应强度,结果可分一、±、+、++、+++、++++六级.;又如观察用某药治疗某病患者的疗效,以每名思者为观察单位,结采可分为治愈、显效、好转、无效四级等。

统计分析方法的选用,是与资料类型密切联系的。在资料分析过程中,根据需要在有关专业理论指导下,各类资料间可以互相转化,以满足不同统计分析方法的要求。例如,以人为观察单位观察某人群脉搏数(次/分钟),属计量资料;若根据医学专业理论,定义脉搏数在60-100次/分钟为正常,<60次/分钟或>100次/分钟为异常,按“正常”与“异常”两种属性分别清点人数,汇总后可转化为计数资料;若进一步定义脉搏数<60次/分钟为缓脉,>100次/分钟为速脉,按“缓脉”,“正常”与“速脉”三个等级分别清点人数,汇总后可转化为等级资料。以上的例子是先获取计量资料后向计数资料或等级资料的转化,只要能在专业理论的支持下,确定不同属性或不同等级的数量界限,这种转化是不难实现的。这提示我们在研究设计中,对于能测量的指标,尽可能设计为定量指标,这将为分析中的资料转化带来方便;另一方面,对于那些原本为计数或等级的资料,在资料分析过程户,为满足某些统计分析方法的要求(如各类回归分析的要求),有时要柱有关理论和实践的指导下设法转化为计量资料,称为资料或指标的量化。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:51 | 显示全部楼层

误差


  误差(error)泛指实测值与真值之差,按其产生原因和性质可粗分为随机误差(random error)与非随机误差(nonrandom error)两大类,后者又可分为系统误差(systematic error)与非系统误差nonsystematic error)两类。
  1
.随机误差是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。例如,在实验过程中,在同一条件下对同一对象反复进行测量,虽极力控制或消除系统误差后,每次测量结果仍会出现一些随机变化即随机测量误差(random error of measurement),以及在抽样过程中由于抽样的偶然性而出现的抽样误差(sampling error).

随机误差是不可避免的,在大量重复测量中,或在抽样过程中,它可出现或大或小或正或负的、呈一定规律性的变化。但由于造成随机误差的影响因素太多太复杂,以至于无法掌握其具体规律。随着科学的发展与社会的进步,有些随机误差可能会逐渐被认识而得以控制。随机误差呈正态分布,可用医学统计学的方法进行分析。统计分析主要是针对抽样误差而言的。
  2
.系统误差是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产先原因往往是可知的或可能掌握的。例如,可能来自于受试者抽样不均匀,分配不随机,可能来自于不同实验者个人感觉或操作上的差异,可能来自于不标准的仪器,也可能来自于外环境非实验因素的不平衡等。因而应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施加以消除或控制。

3.非系统误差在实验过程中由研究者偶然失误而造成的误差。例如,仪器失灵,抄错数字,点错小数点,写错单位等,亦称为过失误差(gross error)。这类误差应当通过认真检查核对予以清除,否则将会影响研究结果的准确性。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:51 | 显示全部楼层

频率与概率

1。频率(relative frequency)一个随机试验有几种可能结果,在重复进行试验时f个别结果看来是偶然发生的,但当重复试验次数相当大时,总有某种规律出现。例如,投掷一枚硬币,结果不外乎出现“正面”与“反面”两种,历史上有些人对此作过试验并得到如下结果:

实验者    投掷次数   出现“正面”次数   频率

Buffon    4040       2048     0.5069

K.Pearson  12000       6019     0.5016

K.Pearson  24000       12012     0.5005
可见,在相同条件下重复试验,试验结果为“正面”或“反面”虽不能事先断定,但我们知道试验的所有可能结果只有两种。在重复多次后,出现“正面(或“反面)这个结果的比例称之为频率。

2.概率(probability)概率是描述随机事件发生可能性大小的一个度量。设在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。当n逐渐增大时,频率f/n始终在一个常数左右作微小摆动,则称该常数为随机事件A的概率,可记为P(A),简记为P。在实际工作中,当概率不易求得时,只要观察次数足够多,可将频率作为概率的估计值。但在观察次数较少时,频率的波动性很大,用于估计概率是不可靠的。

随机事件概率的大小介于0与1之间,即0≤P≤1,常用小数或百分数表示。P越接近1,表示事件发生的可能性越大,P越接近0,表示事件发生的可能性越小。P=1表示事件必然发生,称为必然事件;P=0表示事件不可能发生,称为不可能事件。这两类事件具有确定性,不是随机事件,但可视为随机事件的特例。统计分析中的很多结论都基于一定可信程度下的概率推断,习惯上将P≤0.05称为小概率事件,表示在一次试验或观察中该事件发生的可能性很小,可视为可能不发生。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:52 | 显示全部楼层

医学统计工作的基本步骤

   
统计学是统计工作实践的经验总结,又对统计工作全过程起指导作用,这个全过程可分为以下四个基本步骤:

设计

    这里所称的设计(design)指统计设计,它是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。统计设计按照在研究过程中是否对研究对象施加干预分为观察性研究设计(observati而al study design)和实验性研光设计(experimental study design),后者又可根据研究对象的不同分为实验设计(experiment design)和临床试验(clinical trial)设计两类。若研究者旨在客观地描述研究总体,不对研究对象施加任何干预,例如了解某地某年某人群恶性肿瘤死亡率,某地某年学龄儿童的身体发育状况等,其目的在于摸清某-事物的水平和分布现状,属于观察性研究设计;实验研究设计以动物敛生物材料为研究对象,在研究实施过程中研究者可对研究对象施加各种干预,例如根据研究假设喂动物某种特殊膳食,以某种方式给动物染某种毒物等;临床试验设计以人为研究对象,在研究过程中也可施加干预,例如对某病患者给某种治疗药物,辅以某种治疗手段等,但这种干预必须遵从人道主义和医学伦理学(medical ethics)的原则。


统计设计的内容包括对资料收集、整理和分析全过程的设想与安排。在设计前,研究者必须博览有关文献,充分了解有关情况,对于什么是研究目的和假说?什么是研究总体,研究对象和观察单位育对研究对象是否施加干预和如何施加干预?需要收集哪些原始资料和如何获取这些资料?需要设置哪些指标来观察研究结果?如何对资料进行整理汇总和计算有关统计指标?如何控制误差和偏倚?预计会得到什么结果?需要多少经费与时间等问题都要周密考虑、统筹安排,力求科学、实用、可行。

在研究者对研究设计的构思过程中,有以下几个问题最为关键:①如何进行抽样?如何安排设计所规定的干预措施或称处理 (treatment)?②要达到研究目的应抽取多少个观察单位?③如何在诸多的影响因素中,分离出研究因素对结果的效应?即如何设置对照。这也正是实验设计的三个基本原则所要回答的问题。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:52 | 显示全部楼层

收集资料

收集资料(collection of data)指应采取措施取得准确可靠的原始数据。医疗卫生工作中的统计资料主要来自以下几个方面:①统计报表。如法定的传染病报表、职业病报表、医院工作报表等。这些报表由国家有关部门统,设计,要求各级医疗卫生机构定期逐级上报,提供居民健康状况、医疗卫生机构工作和医疗卫生事业发展的主要数据,作为制定卫生工作计划与对策,检查和考核卫生工作效果的依据。报表要做到完整、准确、及时,要加强对漏报、错报、重报等问题的督查与处理,以充分保证基础资料的质量。②经常性工作记录。如卫生监测记录、健康检查记录、门诊病历、住院病历等。要做到登记的完整准确。病历是医疗工作的重要记录,分析时应注意其局限性。③专题调查或实验研究。④统计年鉴和统计数据专辑。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:53 | 显示全部楼层

整理资料

整理资料(sorting data)是将原始数据净化、系统化和条理化,以便为下一步计算和分析打好基础的过程。所谓净化,是指对原始数据的清理、检查、核对和纠正错误等;所谓系统化和条理化,是指根据研究目的,将原始数据合理分组并归纳汇,L.等。例如,如果要分析对比某项指标的性别差异,我们必须将原始数据分男女两组归纳汇总;如果还要分析对比某项指标的年龄差异,我们必须将原始数据在按性别分组的基础上,再按不同年龄分组汇总…。分组可分质分组与量分组,或介于两者之间的等级分组等方式,分别获取相应类型的资料。

回复

使用道具 举报

 楼主| 发表于 2010-11-14 16:53 | 显示全部楼层

分析资料

分析资料(analysis of data)又称统计分析,包括有关统计指标的选择与计算,统计图表的绘制,有关统计方法的选用与SPSS, SAS, Stata等统计软件的应用等,目的是在表达数据特征的基础上,阐明事物的内在联系和规律性。统计分析包括两个方面:①统计描述(statistical description)。指选用恰当的统计指标,通常称为统计量(statistic),选用合适的统计表与统计图,对资料的数量特征及其分布规律进行测定和描述。②统计推断(statistical inference)。指如何在一定的可信程度下由样本信息推断总体特征。包括如何由样本统计指标(统计量)来推断总体相应指标(参数,parameter),称为参数估计(estimation of parameter);如何由样本差异来推断总体之间是否可能存在差异,称为假设检验(hypothesis test).

虽然人为地将统计工作分为以上四个基本步骤,但它们是紧密联系,不可分割的整体,缺少或忽视任何一步,都会影响整个研究的结果。

回复

使用道具 举报

发表于 2010-11-14 18:33 | 显示全部楼层
谢谢鬼才老师的讲座,在平时的工作中经常需要做些统计表及统计数据,有时做表时总觉得有些项目不好表达,如果能再加些实例,就更好了·。
回复

使用道具 举报

发表于 2010-11-24 10:35 | 显示全部楼层
谢谢版主的无私奉献!很好的资料,收藏学习了。
回复

使用道具 举报

发表于 2010-12-21 21:33 | 显示全部楼层
回复 1# 鬼才


    下载学习了,正好在做博士课题,太及时了,谢谢“鬼才”版主的无私奉献。
回复

使用道具 举报

发表于 2011-12-13 10:51 | 显示全部楼层
谢谢鬼才老师,也有同感,要是有实例讲解就更好啦!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

快速回复 返回顶部 返回列表