找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

查看: 4517|回复: 21

[转帖] 样本量计算公式和案例

[复制链接]
发表于 2017-8-4 09:10:35 | 显示全部楼层 |阅读模式 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 13:03 编辑

最近较忙,没时间把专题进行下去,我就先转一下大家急需的帖子吧
转自《丁香园》


2.2 样本量计算

貌似严谨一点的设计都需要在试验设计时估算样本量。
没有足够的样本量,试验可能难以得出设计的效果;得出的资料也许错误风险较大……
太大的样本量,又会增加试验的成本和难度。
因此有了样本量设计一说。这里给亲们搜集了一些常用的样本量计算。这些计算主要参考颜虹主编《医学统计学》及孙瑞元、郑青山、姚晨及刘玉秀等人的相关著述。
先提示一下:样本量计算应先给定必要的参数。没有任何给定参数的样本量,谁也算不出来呵。
这些必要的参数,一般可通过预试验或参考文献或以前的经验资料得到。
样本量的计算,在Excel中非常容易。以下的介绍中,将顺便给出需要使用的Excel函数。这些函数的意义,Excel中都有解释。希望亲们捕获鱼时更获得渔之方法(授人鱼不如授人以渔)。
当然,本小书的作者也搜集或建立了下面所述的各样本量计算公式模板,上传于丁香园医学网站,亲们可去下载:http://www.dxy.cn/bbs/topic/21117904
常用的样本量计算方法有:
A  两独立组比较(率/计数资料)
B  多独立组比较(率/计数资料)
C  两独立组比较(均数/计量资料)
D  多独立组比较(均数/计量资料)
E  两配对组比较(率/计数资料)
F  两配对组比较/单组前后比较(均值/计量资料)
G  等效性/非劣性试验:两组率/计数资料的比较
H  等效性/非劣性试验:两组计量资料的比较
I  诊断试验
J  横断面研究的样本例数(0-1变量总体概率估计)
K  横断面研究的样本例数(均值/计量资料)
好,下面逐一为亲们介绍(仍然是不讲理论和出处,只讲应用啊)。

评分

参与人数 1威望 +2 金币 +4 收起 理由
院感小哥 + 2 + 4 很给力!

查看全部评分

贡献排行榜:
 楼主| 发表于 2017-8-4 09:35:42 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:46 编辑

A  两独立组比较(率/计数资料)

【例】 某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg的改善情况(双侧检验),问两组各需要乙肝患者多少名?拟规定:乙肝患者随机分为2组,两组样本量比:甲药组/乙药组=0.55/0.45;预试验测得甲药的转阴率为60%,乙药的转阴率为75%。
公式
N={Zα/2[(2P均)(1-P?均)(Q1-1+Q2-1 )]0.5 + Zβ[P1Q1-1(1-P1)+ P2Q2-1(1-P2)]0.5}2/(P1-P22

(注:以上为双侧检验公式。单侧检验时,将Zα/2换成分Zα即可。亲若是统计初学者,不太清楚统计检验是双侧检验还是单侧检验,那就一般选择双侧检验。以后的公式若无特别提示,都仅列示双侧检验的计算结果)
参数
⑴ Zα/2:α=0.05,Zα/2=1.960  Excel计算:=NORMSINV(1-0.05/2)
⑵ Zβ:β=0.10,Zβ=1.282    Excel计算:=NORMSINV(1-0.10)
⑶ Q1、Q2:各组样本比例。本例设计Q1=0.55,Q2=0.45
⑷ P1、P2:各组的预试验所得率,本例为转阴率:P1=0.60、P2=0.75
⑸ P均:两组合并率,或两组平均率。P均= P1Q1+P2Q2=(0.55×0.6+0.45×0.75)=0.6675。
⑹ N:两组例样本总例数。(N=n1+n2)
代入可得样本总例数 N≈411。
(注:平方根计算(Excel计算,以求30的平方根:300.5 为例):=SQRT(30)或 =30^0.5
结果
比较两种药物治疗乙型肝炎后表面抗原HBsAg的转阴情况,置信水平为0.95,检验功效为0.9,两组共需要411名乙肝患者。其中甲药组需要:n1=Q1N=0.55×411=226;乙药组需要:n2=Q2N=0.45×411=185。
后面的各类样本量计算,不再写结果这段了(节省版面嘿嘿)
回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:22:04 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:47 编辑

B  多独立组比较(率/计数资料)

【例】 比较三种矫治近视眼方法的效果有无差异,问各法需观察多少例?预试验如下:采用三种方法矫治近视眼,治疗后得到A法有效率为37.78%,B法为18.75%,C法为27.78%。
公式: 多组本率比较的样本例数公式
n = 2λ/[2sin-1(Pmax0.5 )- 2sin-1(Pmin0.5 )]         
注:该公式中出现反正弦函数,以对样本率进行以弧度为单位的反正弦被换,从而解决该类资料的率向两侧偏离的偏态现象。
参数
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:设计的组数,本例中,K=3
⑷ λ:查下表得,λα,β,K-1 0.05,0.10,3-1=12.65
⑸ SIN-1:反正弦函数,若用Excel函数计算0.5的反正弦值:=ASIN(0.5)
⑹ Pmax、Pmin:分别为最大率和最小率,根据预试验或查文献来估计。本例Pmax=0.3778,Pmin=0.1875。代入计算得样本例数n≈138。

α=0.05时的λ值表
组数K
34
5 6 7 8 910
自由度v=K-1 2 3 4 5 6 7 89
β=0.29.63  
10.90 11.94 12.83 13.62 14.35 15.02 15.65
β=0.1 12.65 14.17 15.41 16.47 17.42 18.28 19.08 19.83

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:25:08 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:47 编辑

C  两独立组比较(均数/计量资料)

【例】 某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效,两组样本比例:Q1/Q2=0.5/0.5。问每组需要观察多少例?预试验如下:一个研究组将随机抽取的粒细胞减少症的病例平均分为两组,分别用黄芪和生血散治疗后测得,黄芪组平均增加粒细胞1×109 个/L,生血散组平均增加粒细胞2×109 个/L,合并标准差为σ=1.8×109 个/L。
公式:两组均数比较样本例数公式
N=[Zα/2 + Zβ] σ/δ]2(Q1-1+ Q2-1
参数
⑴ Zα/2:α=0.05,Zα=1.960  [ Excel函数计算:Zα/2=NORMSINV(1-0.05/2) ]
⑵ Zβ:β=0.20,Zβ=0.842  [ Excel函数计算:Zβ=NORMSINV(1-0.20) ]
⑶ σ: σ=1.8×109  注:合并标准差σ= [(S12+S22)/2] 0.5
  ⑷ δ:两组差值,见前述预试验,δ=(2×109)-(1×109)=1×109
⑸ Q1、Q2:见前述预试验,Q1=0.5、Q2=0.5
代入可得样本例数N≈80。

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:27:22 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:48 编辑

D  多独立组比较(均数/计量资料)

【例】 某课题的研究目的是比较三种方案治疗血红蛋白不满100g/L的婴幼儿贫血患者后,血红蛋白增的变化有无差异,问三组各需要观察多少例?预试验如下:一个研究组将随机抽取的血红蛋白不满100g/L的婴幼儿贫血患者平均分为三组,经各治疗方案治疗后血红蛋白增加的均数Xi分别为18.5g/L、13.2g/L、10.4g/L,标准差Si为11.8g/L、13.4g/L、9.3g/L。
公式:多个样本均数比较样本例数公式
n = Ψ2(∑(Si2)/K)/[∑(Xi - X2/(K-1)]
参数
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:为组数,本例题K=3。
⑷ Ψ:本例K=3,自由度V1=K-1=2;自由度V2=N-1,N未知,可取最大∞,查下表得:
Ψα,β,K-1,∞=2.52。
⑸ X均i、Si:分别为第i组的均数(X1=18.5、X2=…)和标准差(S1=11.8,S2=…)的估计值,由预试验或文献来估计。
⑹ X的确定:X=(X1+X2+X3)/K=(18.5+13.2+10.4)/3=14.0
代入便可计算求出样本例数:n≈51

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:29:00 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-7 10:48 编辑

E  两配对组比较(率/计数资料)

【例】 用A、B两种方法检查血样中的HIV,先用A法检验,再用B法检验。比较两法的差异,需要多少样本量?预试验结果如下表:A法B 法均为阳性+为a例,均为阴性-的为d例,分别为阳、阴性的为d或c例。
配对设计A法测定
阳性+阴性-
B法测定阳性+ab
阴性-cd


公式:两配对组(率/计数资料)比较公式
n=[Zα/2(2πc0.5+ Zβ(2π+-π-+)0.5]2/(π+--+2
参数
⑴ Zα/2:α=0.05,Zα/2=1.960
⑵ Zβ:β=0.10,Zβ=1.282
⑶ π+-:π+-=b/(a+b)
⑷ π-+:π-+=c/(a+c)
⑸ πc: (π+--+)/2
代入可得样本例数。

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:30:14 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:49 编辑

F  两配对组比较/单组前后比较(均值/计量资料)

【例】 某降压药临床试验,观测病人服药前后的血压值,以判断降压效果。求样本量。预试验知:病人用药前后的血压差值观测的标准差S=8.3mmHg,观测比较的阈值δ为2mmHg。
公式:
n = [(Zα/2+Zβ)S/δ]2
参数
⑴ Zα/2:α=0.05,Zα/2=1.960
⑵ Zβ:β=0.10,Zβ=1.282
⑶ S:标准差。由文献或预调查的资料来估计。本例为S=8.3。
⑷ δ:判断阈值或比较界值或容许误差,一般可考虑δ=(0.1~0.5)S,本例取2。
代入计算得:n=180。
(注:δ:判断阈值,其含义大致同下面的等效性检验中的定义。亲可这样理解:如果想比较的更精细准确一些,其比较的δ:判断阈值应该小一些,对应的样本量就大一些(δ在计算样本量的分母上)

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:33:11 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:49 编辑

G  等效性/非劣性试验:两组率/计数资料的比较

【例】 某新药进行Ⅱ期临床试验,考察其治愈率不差于经典对照药,按1/1设试验组和对照组,求样本量。预试验知:两组治愈率均约0.80。
公式:
非劣性试验:n= 2×(Uα+Uβ2×P(1-P)/δ2
等效性试验:n = 2×(Uα+Uβ/22×P(1-P)/δ2
(注:等效性试验包括高低两个方向的单侧检验,但采用Uβ/2而非Uα/2
特别地,临床常用α=0.05,β=0.20,两组例数比K=Q1/Q2=1时,亲可用下述简化公式:
非劣性试验:n= 12.365×P(1-P)/δ2
等效性试验:n = 17.127×P(1-P)/δ2
参数
⑴ α=0.05
⑵ β=0.20
⑶  P=0.80(P为两组合并率或两组平均率,约为两组率的均值或合并计算后的均值)
⑷ δ(检验界值)=0.15(一般由临床专业决定,可取两组平均率的1/3~1/10)
⑸  Q1、Q2=0.5(两组例数比0.5/0.5=1)
代入可得每组样本例数:n=12.365×0.8(1-0.8)/0.152 =88
如果:两组例数比K=Q1/Q2≠1时,则n1≈n(1+K)/2;n2≈n(1+K)/2K

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:35:45 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:49 编辑

H  等效性/非劣性试验:两组计量资料的比较

【例】 【例】 某新药进行Ⅱ期临床试验,考察其生存期不差于经典对照药,按1/1设试验组和对照组,求样本量。预试验知:两组共同标准差s=60d。
公式:
非劣性试验:n= 2×(Uα+Uβ2×(σ/δ)2
等效性试验:n = 2×(Uα+Uβ/22×(σ/δ)2
(注:等效性试验包括高低两个方向的单侧检验,但采用Uβ/2而非Uα/2
特别地,临床常用α=0.05,β=0.20,两组例数比K=Q1/Q2=1时,亲可用下述简化公式:
非劣性试验:n= 12.365×(s/δ)2
等效性试验:n = 17.127×(s/δ)2
参数
⑴ α=0.05
⑵ β=0.20
⑶ σ = 60 (合并标准差,σ= [(S12+S22)/2] 0.5。近似估算甚至可取两组标准差的几何均值(S1×S2)0.5
注:标准差S:通常指样本的标准差,Excel中表述为标准偏差SD,其函数计算:=STDEV(),其计算公式为SD=[∑(Xi-X2)/(n-1)]0.5。  亲们不要和总体的标准差弄混啊(总体的标准差公式里将n-1换作n),当然弄混也无大事,反正样本量计算就一参考值,有点误差木什么大不了。
⑷ δ(检验界值)=0.20(一般由临床专业决定,可取共同标准差的1/2~1/5,或取对照/参比组均值的1/5~1/10)
⑸  Q1、Q2 =0.5(两组例数比0.5/0.5=1)
代入可得每组样本例数:n=12.365×(60/20)2 =111
如果:两组例数比K=Q1/Q2≠1时,则n1≈n(1+K)/2;n2≈n(1+K)/2K

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:37:30 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:49 编辑

I  诊断试验

【例】 某课题的研究目的是为了解B超诊断肝硬化的临床价值,每组各需要多少例患者?预试验中:B超诊断肝硬化约为:P灵敏度=0.75;P特异度=0.55。
公式: 诊断试验的样本例数公式
n=(Uα/δ)2(1-P)P
参数
⑴ μα:α=0.05,μα=Zα/2=1.960
⑵ μβ:β=0.20,本法计算中可不涉及μβ
⑶ δ:判断界值。由研究者根据预试验或查文献来估计。可综合取预试验之灵敏度或特异度的1/5~1/10。一般定在0.05~0.10之间。本例取δ=0.08
⑷  P的确定:P灵敏度=0.75;P特异度=0.55
(一般,计算试验组的样本量时用P灵敏度,而计算对照组样本量时用P特异度
代入计算求出样本例数:
将P灵敏度=0.75代入公式后可计算得n试验≈113。
将P特异度=0.55代入公式后可计算得n对照≈149。

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:38:37 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:50 编辑

J  横断面研究的样本例数(0-1变量总体概率估计)

【例】  为了在全国作生育率的调查,根据资料已知全国妇女现阶段峰值年龄生育率估计值,按单纯随机抽样,估计峰值年龄妇女需要多少人?预调查如下:为了在全国作生育率的抽样调查,经查阅文献获得,我国妇女现阶段峰值年龄生育率P在0.3上下波动,允许误差δ为0.015,若定检验水准为0.05,试按单纯随机抽样,估计峰值年龄妇女样本例数。
公式:
    n=  Zα/22×P(1-P)/δ2
参数:
⑴ Zα/2:α=0.05,Z0.05/2=1.96。
⑵ δ:δ=P-π。δ可通过预试验、查阅文献、专家意见来确定。特别地,在很多情况下:可取δ≈0.1P,Zα/2≈2,则公式可简化为n = 400(1-P)/P。
  ⑶ P:总体概率。通过预试验或查阅文献获得。  
本例按公式计算得:样本例数n=1.962×0.3(1-0.3)/0.0152 = 3733
    若按简化公式:δ定为0.1P=0.03,则样本例数n=400×(1-0.3)/0.3=933

回复

使用道具 举报

 楼主| 发表于 2017-8-4 10:39:48 | 显示全部楼层 IP:上海
本帖最后由 御剑迎风 于 2017-8-4 10:44 编辑

K  横断面研究的样本例数(均值/计量资料)

【例】 研究某地区平均每月每位社区医生的家访次数,至少需要调查多少名医生?  预调查知:一个研究组从社区医疗机构的名单中随机抽取90名社区医生进行调查,发现他们一个月内家访平均次数为4.89次,标准差为3.48次。
公式:
n=  (Zα/2×V/ε)2
参数:
⑴ Zα:α=0.05,Z0.05/2=1.96。
⑵ ε:相对误差。由研究者根据问题的背景自行规定,例如可以取0.1、0.15、0.2等。本例取0.2。
⑶ V:变异系数。V = σ/μ(总体的标准差/总体均值),或用S/X均估计,其中参数由文献或预调查的资料来估计。本例为V=3.48/4.89=0.712。
代入公式后可得n=49。

回复

使用道具 举报

发表于 2017-8-4 11:18:05 | 显示全部楼层 IP:上海
收藏了亲~久旱逢甘霖了
回复

使用道具 举报

发表于 2017-8-4 12:13:01 | 显示全部楼层 IP:河南郑州
慕延 发表于 2017-8-4 11:18
收藏了亲~久旱逢甘霖了

这是我的心声吧

点评

普罗大众,芸芸众生的心声  发表于 2017-8-4 14:36
回复

使用道具 举报

发表于 2017-8-7 08:34:27 | 显示全部楼层 IP:天津
医学僧里数学最好的,数学里懂医学的。必须持续关注
回复

使用道具 举报

 楼主| 发表于 2017-8-7 10:46:24 | 显示全部楼层 IP:上海
ICBC 发表于 2017-8-7 08:34
医学僧里数学最好的,数学里懂医学的。必须持续关注

不敢当,我的专业背景就是流行病与统计,所以经验比较丰富
回复

使用道具 举报

发表于 2018-7-17 17:27:35 | 显示全部楼层 IP:四川自贡
先收藏,下来慢慢消化
回复

使用道具 举报

发表于 2019-2-13 11:05:35 | 显示全部楼层 IP:湖南
御剑迎风 发表于 2017-8-4 10:25
C  两独立组比较(均数/计量资料)

【例】 某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效 ...

御剑迎风老师,请问仅有两组的均数和标准差,怎么计算合并标准差呢?
回复

使用道具 举报

发表于 2019-2-13 11:26:00 | 显示全部楼层 IP:湖南
御剑迎风 发表于 2017-8-4 10:25
C  两独立组比较(均数/计量资料)

【例】 某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效 ...

老师,按照参数列如下公式,[(1.96+0.842)*(1.8*109/1*109)]2(上标)*(1/0.5+1/0.5)=(2.802*1.8)2*4=25*4=100,怎么不是80呢?我的错误在哪儿?谢谢指正。
回复

使用道具 举报

发表于 2019-3-11 17:27:40 | 显示全部楼层 IP:湖南
御剑迎风 发表于 2017-8-4 10:35
H  等效性/非劣性试验:两组计量资料的比较

【例】 【例】 某新药进行Ⅱ期临床试验,考察其生存期不差 ...

御剑迎风老师,你好。第H条,计量资料的等效性和非劣效结果,根据题中该数据和计算公式,非劣性试验:n= 2×(Uα+Uβ)2×(σ/δ)2=2(1.96+1.282)2×(8.3/2)2=2*10.51*4.152=360
最后只能得出结论,每组是180.是应该这样描述吗?请指导
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

×本站发帖友情提示
1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
2、如果存在违反国家相关法律、法规、条例的行为,我们有权在不经作者准许的情况下删除其在本论坛所发表的文章、帖子。
3、所有网友不要盗用有明确版权要求的作品,转贴请注明来源,否则文责自负。
4、本社区保护注册用户个人资料,但是在自身原因导致个人资料泄露、丢失、被盗或篡改,本论坛概不负责,也不承担相应法律责任。

关闭

站长推荐上一条 /1 下一条

快速回复 返回顶部 返回列表