统计学导论期末复习总结

  • 格式:ppt
  • 大小:325.00 KB
  • 文档页数:43

下载文档原格式

  / 43
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本:由总体的部分个体组成。
样本容量:样本中所包含的个体数。
有限总体:有限个个体组成的总体。 无限总体:无限个个体组成的总体。
第三章 四种抽样方法: 1、简单随机抽样 2、系统随机抽样
3、分层随机抽样
4、整群随机抽样 实施的步骤、每种方法的优点与缺点, 在什么情况下使用。
第三章 选择抽样方法的原则: 1、样本的代表性好,即样本在总体中分 布均匀; 2、容易实施;
第二章
概率性质的应用
利用概率性质计算一些随机事件的概 率。
第二章
ຫໍສະໝຸດ Baidu
随机变量

R
1
{ x} ((, x]) F ˆ
(, F , P) 与 (R, B, F )的联系
第二章
密度矩阵 离散型随机变量 分布函数 随机变量 密度函数 分布函数 奇异型随机变量
连续型随机变量
第二章
第三章 个体、个体的指标、总体;
样本点、样本空间。
个体的一项指标X:
映射X: →R
X: (, F, P) →(R, B, FX) 变量:X 总体分布: FX
第三章 总体参数:总体分布未知的特征指标。
统计量:不含任何参数的样本的函数。
普查:收集总体中每个个体的指标数据的过程。
抽样调查:收集总体中部分个体的指标数据的过程。
第三章 随机样本:通过随机抽样得到的观测样本.
方便样本:容易得到的观测样本.
随机抽样:使得每个个体都以确定的(大 于0)的概率被选到样本中的抽样方法. 抽样调查的必要性: 1、无限总体时不能使用普查的方法; 2、获取个体指标的过程具有破坏性; 3、成本、时效性等方面的要求。
第三章
抽样误差
误差 调查误差(测量误差)
normcdf(x,,) normrnd(,,m1,m2)
unifpdf(x,a,b)
unifcdf(x,a,b)
unifrnd(a,b,m1,m2)
unidrnd(N,m1,m2)
norminv(p,,)
Matlab
mean(x), mean(x,2),
统计函数
sum(x),
median(x),
第二章
正态分布:X~N(,2)
f ( x) 1 2
( x )2 2 2
e
, x
2
E( X ) , D( X )
背景、概率密度函数、分布函数、 均值、方差。
第二章
切比雪夫不等式:
P (| X E ( X ) | ) D( X )
pie(x),
histc(x,g):输出统计表的结果
Matlab
sqrt(x),
其他常用函数 exp(x),
统计方法的特点 有效性 局限性 可改进性
P( X k ) e


k
k!
, k 0,1,2,.
E( X )
D( X )
第二章
均匀分布:X~U(a,b)
1 a xb f ( x) b a 0 else ab (b a) 2 E( X ) , D( X ) 2 12

2
第二章
大数定律
定理2.5.2 若随机变量X的数学期望为有限 数,则 n
1 lim X k E ( X ) n n k 1
成立的概率为1,这里Xk为X的第k次重复 观测结果。
第二章
中心极限定理
定理2.5.4 设随机变量X的数学期望和方差 都为实数,并且方差大于0。若 X 1 ,, X n 为随机变量X的n次独立重复观测,则
n X n E ( X ) lim P x ( x) n D( X )
其中(x) 为标准正态分布随机变量的分布函 数, X 1 X . n
n n k 1 k
第三章 分类变量:描述个体的分类特征的变量; 数值变量:描述个体的数量特征的变量. 把分类变量的不同取值用数来表示,就可 以把分类变量看出是随机变量。 对分类变量来讲,数学期望和方差等概念 是没有意义的。
第四章
文科
理科
文科的女生比男生多,理科中男女生比例差不多, 文科中女生的比例高于理科中女生的比例.
第四章
样本数据的标准化
什么时候要对样本数据标准化?
标准得分的解释.
第五章 总体分布函数的估计:经验分布函数
参数估计方法:矩估计和极大似然估计 估计的标准:均方误差最小 无偏估计的含义
Matlab
随机变量的数字特征 1、随机变量的数学期望; 2、随机变量的方差、标准差 数学期望具有线性性 D(c)=? (1) E ( c )= c D(aX+b)=? (2) E (aX+b)=aE (X)+b (3) E (aX+bY )=aE (X)+bE (Y)
第二章
随机变量的方差
D( X ) E{[ X E ( X )]2 }
binopdf(x,n,p) binocdf(x,n,p)
常用分布的函数
binornd(n,p,m1,m2)
hygepdf(x,M,K,n) hygecdf(x,M,K,n) hygernd(M,K,n,m1,m2)
poisspdf(x,)
normpdf(x,,)
poisscdf(x,)
poissrnd(,m1,m2)
第二章
基本概念
样本空间和样本点 随机事件
样本空间上的 代数
波雷尔集 概率空间
第二章
事件的运算 事件的并、交、差、余 对偶原理
分配律
第二章
概率的性质
不可能事件的概率为0 有限可加性
可减性
单调性 P( A) 1 P( A) 加法公式
非抽样误差 不完整的抽样框引起的误差 不回答误差 数据转录误差
第三章
试验组:采用了新方法的一组;
对照组:没有采用新方法的一组。
选择试验组和对照组的原则:随机选择,
即从总体中随机地选择参加实验的样本,再从 样本中随机地选择试验组。
第三章
为什么要随机选择? 1、两个组所处的外部环境相同; 2、在实验前两组之间没有差异。 目的:如果实验的结果是两组有显著 的差异,可以解释为新方法的影响。
第三章
对人做实验时产生的问题:
1、组织问题;
2、心理学问题; 3、道德伦理问题; 4、敏感性问题。
第四章
一、统计表(频数表、频率表、列联表) 二、统计图(频率直方图、频数直方图、分组频
数条形图、条形图、饼图、点图、茎叶图、盒形 图)
三、统计量(均值、中位数、众数、极差、四分
位间距、方差、标准差、平均绝对离差、变异系 数、分位数,次序统计量)
复习总结
探索未知现象流程图
分 析 观 测 资 料
统计推断
未知现象
获 取 观 测 资 料
统计模型
了解背景知识 明确分析目的 确定获得数据方法
描述性统计 图表
观测数据 (样本)
第一章
随机现象中的随机性与规律性。
第二章
概率理论发展的几个重要阶段
概率的公理化体系的建立
随机变量的引入
随机变量的分布函数的引入
sum(x,2),
median(x,2),
range(x),
mad(x),
range(x,2),
mad(x,2),
var(x),
std(x),
var(x,2),
std(x,2)
Matlab
plot(x,y), bar(x,g),
画统计图的函数 boxplot(x), bar(g,h,’histc’),
, k 0,1,, n.
E ( X ) np, D( X ) np(1 p)
第二章
超几何分布:参数M,K,n
C C P( X k ) C
k K nk M K n M
, k 0,1,, min(n, K ).
超几何分布的均值: nK/M
Poisson分布:X~P()

标准差(或标准偏差):
D( X )
计算公式:
D( X ) E( X 2 ) [ E( X )]2
第二章
常用分布及其数字特征
两点分布:X~B(1,p)
E ( X ) p, D( X ) p(1 p)
二项分布:X~B(n,p)
P( X k ) C p (1 p)
k n k n k
第四章
分组数目的确定
log n k 1 log 2 k 1.87 (n 1)
组边界的确定
0.4
第四章
由样本计算统计量
由分组数据近似计算统计量
第四章
异常数据 什么样的数据是异常数据? 产生异常数据的原因有哪些?
第四章
主要掌握两个方面
• 不同的统计图转递给你的信息是不同的, 理解每一种图给你的主要信息是什么。 • 根据你的数据选用不同的统计图向其他人 转递你的数据里包含的信息.