- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“回归”名称的由来-――高尔顿的父子身高试验 引自汪荣伟主编的《经济应用数学》高尔顿(Frramcia Galton,1882-1911)早年在剑桥大学学习医学, 但医生的职业对他并无吸引力, 后来他接受了一笔遗产, 这使他可以放弃医生的生涯, 并与 1850-1852
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 1 of 4
高尔顿钉板
如下图中每一黑点表示钉在板上的一颗钉子,它们彼此的距离均相等,上一层的每一颗的水平位 置恰好位于下一层的两颗正中间。从入口处放进一个直径略小于两颗钉子之间的距离的小圆玻璃球, 当小圆球向下降落过程中,碰到钉子后皆以 1/2 的概率向左或向右滚下,于是又碰到下一层钉子。如 此继续下去,直到滚到底板的一个格子内为止。把许许多多同样大小的小球不断从入口处放下,只要 球的数目相当大,它们在底板将堆成近似于正态 的密度函数图形(即:中间高,两头低,呈左右对
1 2 1 2
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 4 of 4
1 2
1 2
1 2
= C0 )(k+1)-0 ( )0 k 1 ( ak+1,k+1=
1 2
ak,k=
1 2
1 2
Ck )k—k( )k k(
1 2
1 2
1 2
(k+1)—(k+1) = Ck ) ( )k+1 k( (k+1)—(k+1) 1 = Ck ) ( )k+1 k 1 (
1 2
1 2
z
数理统计
y x
用数学归纳法证明: 1.当 n=1 时,已如上证。 当 n=2 时,a2,0= a2,1= a2,2=
1 2 1 2 1 2
a1,0=( )2=C 0 )2—0( )0 2 (
1 2
1 2
1 2
1 2
a1,0+
1 2
a1,1=
1 2
=C 12 ( )2—1( )1
1 2 1 2
1 2
z
数理统计
y x
高尔顿(Galton)
“高尔顿等人关于回归分析的先驱性的工作,以及时间序列分析方面的一些工作,…是数理统计 学发展史中的重要事件.”──摘自《中国大百科全书》 (数学卷) 高尔顿是英国人类学家、生物统计学家.1822 年 2 月 6 日生于伯明翰,1911 年 1 月 17 日卒于萨 里郡黑斯尔米尔. 高尔顿是生物学家达尔文的表弟.他早年在剑桥学习数学,后到伦敦攻读医学.1860 年当选为 皇家学会会员,1909 年被封为爵士.1845—1852 年深入到非洲腹地探险、考察. 高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计 方法研究智力遗传进化问题,第一次将概率统计原理等数学方法用于生物科学,明确提出“生物统计 学”的名词.现在统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的,他是怎样产生这些 概念的呢?1870 年,高尔顿在研究人类身长的遗传时,发现下列关系:高个子父母的子女,其身高有 低于其父母身高的趋势,而矮个子父母的子女,其身高有高于其父母的趋势,即有“回归”到平均数 去的趋势,这就是统计学上最初出现“回归”时的涵义.高尔顿揭示了统计方法在生物学研究中是有用 的,引进了回归直线、相关系数的概念,创始了回归分析.开创了生物统计学研究的先河.他于 1889 年 在《自然遗传》中,应用百分位数法和四分位偏差法代替离差度量.在现在的随机过程中有以他的姓氏 命名的高尔顿─沃森过程(简称 G─W 过程). 高尔顿发表了 200 篇论文和出版了十几部专著,涉及人体测量学,实验心理学等领域,其中数学 始终起着重要作用.
— (i=0,1,2,…,n) 现对上猜想给出证明:an,i= P(i)= C in ( )n i( )i。
1 2
1 2
1 2
1 2
1 2
1 2
1 2
1 2
规定:ai,j 表示第 i 行第 j(0≤j≤n)个空球落下的概率。 由高尔顿(钉)板可知:a1,0= ,a1,1=
1 a n,0 2 a n 1,0 1 a 0,n a 0, n 1 2 1 1 a n,i 2 a n 1,i 1 2 a n 1,i
ak+1,i= =
1 2
ak,i-1+
1 2
ak,i
1 2 1 2
1 2
C ik-1 ( )k-(i-1)( )i-1+
1 2
1 2
C ik ( )k-i( )i
1 2
1 2
=( C ik-1 + C ik ) ( )k+1 = C ik 1 ( )(k+1)-i( )i ∴在 n=k 成立的条件下,n=k+1 也成立。 3.由 1,2 得,原命题成立。 由此可知:做一个小球的高尔顿(钉)板试验落入第 i 个空的概率正好满足二项分布。 由大量小球做高尔顿(钉)板试验可知道,小球在各个空格落入的数量关系满足正态分布(已有 人发布了试验的动画在此就不做说明) 。
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 2 of 4
z
数理统计
y x
称的古钟型) ,其中 n 为钉子的层数。 这是英国生物统计学家高尔顿设计的用来研究随机现象的模型,称为高尔顿钉板(或高尔顿板) 。
高尔顿(钉)板与二项分布的关系的证明
高尔顿(钉)板是在一块竖起的木板上钉上一排排互相平行、水平间 隔相等的铁钉(如图) ,并且每一排钉子数目都比上一排多一个,一排中 各个钉子下好对准上面一排两上相邻铁钉的正中央。 从入口处放入一个直 径略小于两颗钉子间隔的小球, 当小球从两钉之间的间隙下落时, 由于碰 到下一排铁钉, 它将以相等的可能性向左或向右落下, 接着小球再通过两 钉的间隙,又碰到下一排铁休。如此继续下去,小球最后落入下方条状的 格子内。 有兴趣的同学可以通过以下的问题研究高尔顿板与二项分布的关系。 1.通过高尔顿板实验课件,做 1000 个小球的高尔顿板试验,看一看 小球在格子中的分布形状是怎样的? 2.计算小球落入各个格子所有可能路线的数目。 (提示:考虑它与杨 辉三角的关系) 3.计算小球落入各个格子的概率。 ” 设(如图)高尔顿(钉)板有 n 行钉,第 n 行铁钉共有(n+2)个,两个铁钉之间一个空,则有 (n+1)个空。把这(n+1)个空由左到右依次编号为 i=0,1,2,…,n 共(n+1)个空。 观察 i=0 这个空,小球从这个空落下的条件是:小球从第一次与铁钉碰撞后必须连续向左落下, 即连续 n 次选择向左落下,所以落入第 i=0 个空的概率为 P(i=0)=C 0 )n( )0。 n( 观察 i=1 这个空,小球从这个空落下的条件是:小球从第一次与铁钉碰撞后连续 n 次碰撞落下过 程中,有且只有一次选择向右落下,其余都只能是向左落下,所以落入第 i=1 个空的概率为 P(i=1) =C 1 )n—1( )1。 n( 猜想第 i 个空,小球从这个空落下的结论是:小球从第一次与铁钉碰撞后连续 n 次碰撞落下过程 中,有 i 次选择向右落下,其余都选择向左落下,所以落入第 i 个空的概率为 P(i)= C in ( )n—i( )i。 (i=0,1,2,…,n)
1 2
1 2
(1≤i≤n-1,n≥2)
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 3 of 4
z
数Hale Waihona Puke 统计y x年期间去非洲考察,他所取得的成就使其在 1853 年获得英国皇家地理学会的金质奖章。此后他研究 过多种学科(气象学、心理学、社会学、教育学和指纹学等) ,在 1865 年后他的主要兴趣转向遗传学, 这也许是受他表兄达尔文的影响。 从 19 世纪 80 年代高尔顿就开始思考父代和子代相似,如身高、性格及其它种种特制的相似性问题。 于是他选择了父母平均身高 X 与其一子身高 Y 的关系作为研究对象。他观察了 1074 对父母及每对父 母的一个儿子,将结果描成散点图,发现趋势近乎一条直线。总的来说是父母平均身高 X 增加时,其 子的身高 Y 也倾向于增加,这是意料中的结果。但有意思的是高尔顿发现这 1074 对父母平均身高的 平均值为 68 英寸(英国计量单位,1 英寸=2.54cm)时,1074 个儿子的平均身高为 69 英寸,比父母 平均身高大 1 英寸 , 于是他推想, 当父母平均身高为 64 英寸时, 1074 个儿子的平均身高应为 64+1=65 英寸; 若父母的身高为 72 英寸时, 他们儿子的平均身高应为 72=1=73 英寸, 但观察结果确与此不符。 高尔顿发现前一种情况是儿子的平均身高为 67 英寸,高于父母平均值达 3 英寸,后者儿子的平均身 高为 71 英寸,比父母的平均身高低 1 英寸。 高尔顿对此研究后得出的解释是自然界有一种约束力,使人类身高在一定时期是相对稳定的。如果父 母身高(或矮了) ,其子女比他们更高(矮) ,则人类身材将向高、矮两个极端分化。自然界不这样做, 它让身高有一种回归到中心的作用。例如,父母平均身高 72 英寸,这超过了平均值 68 英寸,表明这 些父母属于高的一类,其儿子也倾向属于高的一类(其平均身高 71 英寸 大于子代 69 英寸) ,但不 像父母离子代那么远(71-69<72-68) 。反之,父母平均身高 64 英寸,属于矮的一类,其儿子也倾向 属于矮的一类(其平均 67 英寸,小于子代的平均数 69 英寸) ,但不像父母离中心那么远(69 -67< 68-64) 。 因此,身高有回归于中心的趋势,由于这个性质,高尔顿就把“回归”这个词引进到问题的讨论中, 这就是“回归”名称的由来,逐渐背后人沿用成习了。
1 2
a1,1=( )2= C 2 )0( )2—0 2 (
显然成立。 2.假设 n=k(k≥2)成立(即假设第 n 行每一个数据都成立) 。 即 ak,i= C ik ( )k—i( )i 当 n=k+1 时,ak+1,0=
1 2 1 2 1 2
ak,0=
1 2
1 2
C0 )k—0 ( )0 k(