SPSS的描述统计过程
- 格式:pdf
- 大小:441.17 KB
- 文档页数:83
SPSS基本操作步骤详解本文采用SPSS21.0版本,其它版本操作步骤大体相同一、基本步骤(一)检查数据在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。
例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。
1.执行次数分布表的程序Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定)2.执行描述统计量的程序Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定)(二)反项计分若是分析的预试量表中没有反向题,则此操作步骤可以省略;量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。
例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。
Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】(三)题项加总量表题项加总的目的在于便于进行观察值得高低分组。
一、统计报告l 在线分析处理报告Analyze→Reports→OLAP Cubesl 个案摘要报告Analyze→Reports→Summarize Casesl 行形式摘要报告Analyze→Reports→Report Summaries in Rowsl 列形式摘要报告Analyze→Reports→Report Summaries in Columns二、描述性统计分析1.频数分析Analyze→Descriptive Statistic→Frequencies(1)频度分布表(2)变量描述统计量的计算(3)显示频度的图形2.基本描述统计量Analyze→Descriptive Statistic→Descriptivesl 集中趋势(Central T endency)的统计量l 离散趋势(Dispersion)的统计量l 分布形态(Distribution)的统计量3.探索性分析Analyze→Descriptive Statistic→Explorel 茎叶图l 箱图l 正态分布检验Q-Q概率图l 方差齐性检验的散点-分层图4.交叉列联表分析Analyze→Descriptive Statistic→Crosstabs三、两总体均值比较l 单样本T检验Analyze→Compare Means→One-Sample T T estl 独立样本T检验Analyze→Compare Means→Independen t-Samples T T est l 配对样本T检验Analyze→Compare Means→Paired-Samples T T est四、方差分析l 单因素方差分析Analyze→Compare Means→One-way ANOV Al 多因素方差分析Analyze→General Linear Model→Univariatel 协方差分析Analyze→General Linear Model→Univariateu 假设检验的步骤1.提出原假设和备择假设对每个假设检验问题,一般可同时提出两个相反的假设:●原假设原假设又称零假设,是正待检验的假设,记为H0●备择假设备择假设是拒绝原假设后可供选择的假设,记为H1 。
二、spss 描述性统计分析&频率分析
(TB:幻影如虹数据分析)
1、首先,我们导入测试数据。
依次点击【文件】-【数据】。
TB
幻影
如虹
数据
分析
2、然后在弹出的“打开数据”对话框中点击需要导入的数据(此处注意,如图所示打开的是excel数据,需要在图示的文件类型红框内选择Excel)。
TB
幻影如虹数据分析
3、数据导进Excel后,我们依次点击【分析】-【描述统计】-【描述】。
(注意,对于连续型变量我们才进行描述性统计,计算其均值,方差,最值等信息,若为为离散型变量,如性别,年龄段,级别等进行频率分析,计算其对应频数和频率及直方图)
TB
幻影如虹数据分析
4、在弹出的“描述性”对话框内把需要描述统计的变量从左侧拖往右侧。
TB
幻影如虹数据分析
5、然后单击图示的“选项”,在弹出的“描述:选项”对话框内,勾选你需要的选项。
比如,我们勾选了“均值”、“标准差”、“最大值”、“最小值”.
5、最后点击继续,即可在输出日志里面看懂我们需要的描述统计量。
下面是频率分析对应步骤和设置:
TB
幻影如虹数据分析
TB
幻影如虹数据分析。
在教育技术研究过程中收集到大量的资料数据,但从这些杂乱无章的资料中,很难对其总体水平与分布状况做出评价判断。
因此,必须采用一些适当的方法对这些资料进行处理,使之简约化、分类化、系统化,从中发现它们的分布规律,掌握总体的特征,以便对其水平做出客观的评价。
统计描述方法,是研究简缩数据并描述这些数据的统计方法。
将搜集来的大量数据资料,加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量,如平均数、标准差、以及描述有关事物或现象的分布情况、波动范围和相关程度等,以揭示其特点和规律。
(一)数据资料的整理和表示在教育技术研究中,我们用各种方法搜集来的资料,一般是零散的,它只反映个别现象的个别特征,必须经过整理加工,使之系统化,才能计算统计指标,进行统计分析,为进一步研究提供有用的信息,首先要进行的是统计整理,它包含以下几部分内容:1.数据检查主要检查数据的完整性与正确性。
统计资料完整性的检查,就是要根据调查项目检查是否填写齐全,避免遗漏,删去重复。
正确性检查,就是检查搜集的资料是否真实可靠。
特别是统计数字的真实性是统计工作的生命,统计资料的检查整理必须抓紧这一环。
数据检查可分为逻辑检查和计算检查两种方法。
逻辑检查,是从理论和一般常识上来检查资料内容是否合理,指标之间是否矛盾。
计算检查是检查统计数字在计算方法和计算结果上有否错误。
2.数据分类数据分类就是把搜集来的数据进行分组归类。
数据分类要做到既不重复、不遗漏,又不混淆,一般又可分为品质分类和数量分类。
品质分类:是按事物性质划分为不同的组别、种类。
如以性别为标志可分为男与女;按“理解能力”、“学习态度”等为标志,又可分为好、较好、一般、差等几种水平,每种水平可看成类,每一类可给以相当的数量。
可以通过各类所包含的数据再进行数量化的比较和分析。
数量分类:是按数量的属性分类。
有顺序排列法、等级排列法和次数分布法等。
⒊数据的排序数据排序:将各数据从大到小或从小到大进行排列。
第二节常用的数据描述统计本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。
1.数据这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。
图2-2:数据输入格式示例1.Frequencies语句(1)操作打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。
图2-3:Frequencies定义窗口把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求显示频数分布表)。
如果您只要求得到一个频数分布表,那么就可以点OK按钮了。
如果您想同时获得一些统计量,及统计图表,还需要进一步设置。
①Statistics选项单击Statistics按钮,打开对话框,请按图2-4自行设置。
有关说明如下:(ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有:●Quartiles四分位数,即显示25%、50%、75%的百分位数。
●Cut points equal 把数据平均分为几份。
如本例中要求平均分为3份。
●Percentile显示用户指定的百分位数,可重复多次操作。
本例中要求15%、50%、85%的百分位数。
(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有:●Mean 算术平均数●Median 中数●Mode 众数●Sum 算术和(ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有:●Std. Deviation 标准差●Variance 方差●Range 全距●Minimum 最小值●Maximum 最大值●S.E. mean 平均数的标准误(ⅳ)描述数据分布(Distribution)的统计量●Skewness 偏度,非对称分布指数。
复合材料按其结构特点可分为那些?答:①纤维增强复合材料。
是将各种纤维增强体置于基体材料内复合而成。
②层状复合材料。
是由性质不同的表面材料和下部材料层间组合而成。
通常有夹层复合和衬层复合两种。
③细粒复合材料。
是将硬质细粒均匀分布于基体中。
④混杂复合材料。
由两种或两种以上增强相材料混杂于一种基体相材料中构成。
2. 树脂基复合材料的性能特点为那些?答:①各向异性;②非连续性;③粘弹性;④依数性;⑤对工艺的依赖性。
3.树脂基复合材料的优点为那些?答:(1)密度小。
(2)抗疲劳性好;(3)减震性好;(4)过载安全性好;(5)具有多种耐烧蚀性、耐摩擦性、电绝缘性、耐腐蚀性、有特殊的光学、电学、磁学性能等功能;(6)成型工艺简单;(7)材料结构、性能具有可设计性。
4.复合材料的复合效应为那些?答:平均效应;平行效应;相补效应;相抵效应;相乘效应;诱导效应;共振效应。
5.树脂胶液触变结构的主要特点是那些?答:①从有网络结构到无网络结构,或从网络结构的拆散作用到网络结构的恢复作用是一个等温可逆转换过程;②体系结构的这种反复转换与时间有关,即结构的破坏和结构的恢复过程是时问的函数。
③结构的机械强度变化也与时间有关。
6.热固性树脂的固化交联过程可以详细的分为那几个阶段?答:①诱导引发阶段;②微粒凝胶阶段;③过渡阶段;④大凝胶阶段;⑤后凝胶阶段;⑥固相反应阶段。
7.热固性树脂消除固化收缩应力的途径有哪些?答:①降低反应体系中官能团的浓度;②加入高分子增韧剂。
③加入无机粉状填料。
④热处理固化。
⑤利用膨胀单体共聚。
⑥时效后处理。
8. 复合材料的界面效应有哪些?答:①传递效应。
②阻断效应。
③不连续效应。
④散射和吸收效应。
⑤诱导效应。
⑥耗能效应。
9. 颗粒级配理论设计配合比的方法是什么?答:通过将各种不同粒度的材料,按一定比例搭配起来,使得颗粒之间的空隙由不同粒径的颗粒填充,以达到较高的堆积效率,从而得到工作性能较好的复合材料。
SPSS描述性分析统计操作步骤SPSS是一个非常强大的数据处理和统计分析软件,它广泛应用于社会科学、医学、生物、商业等领域。
描述性分析是SPSS中常用的数据分析方法之一,具体涉及的操作步骤可以分为如下几个部分:一、数据录入和数据检查在运行SPSS前,需要先进行数据录入,将现场采集的数据输入到计算机中。
在录入数据之后,需要对数据进行检查,确认数据的完整性、正确性和一致性。
具体包括以下几个方面:1.检查数据是否按照规定的格式录入,比如数值型数据是否为数字,字符型数据是否为字符等;2.检查数据是否有重复、缺失、异常等情况,并针对这些情况进行相应处理;3.检查变量的名称、标签是否与实际意义一致,需要根据实际情况进行修改。
二、数据分布分析1.单变量分析单变量分析是指针对单个变量进行分析,主要关注该变量的基本统计信息和分布情况。
常用的描述性统计指标包括均值、中位数、众数、标准差、方差、最大值、最小值等。
如需对单个变量作更加细致的分析,可以生成直方图、箱线图、概率密度图等图形。
在SPSS 中,可以通过点和菜单或者语法来进行单变量分析。
三、数据检验1.正态性检验正态性检验是指检验变量是否符合正态分布,通常采用Kolmogorov-Smirnov检验、Shapiro-Wilk检验、Anderson-Darling检验等方法。
在SPSS中,可以通过点和菜单或者语法来进行正态性检验。
2.均值比较均值比较是指比较两个或多个组的均值是否存在显著差异,通常采用t检验和方差分析等方法。
在SPSS中,可以通过点和菜单或者语法来进行均值比较。
四、分组分析分组分析是指将数据按照某一变量进行分组,比较不同组之间的差异。
常用的分组变量包括性别、年龄、学历、职业等。
在SPSS中,可以通过点和菜单或者语法来进行分组分析。
以上就是SPSS描述性分析统计操作步骤的一些基本内容,因为需要考虑数据的来源、数据类型、研究目的等多方面的因素,所以具体操作步骤可能会有所不同。
SPSS数据统计分析与实践第五章:SPSS的描述统计过程主讲:周涛副教授2007-10-9教学网站:/Courses/SPSS本章内容:一、数值型数据的基本统计量二、SPSS的描述统计过程z频度分析(FREQUENCES)z描述统计(DESCRIPTIVES)z考查样本(EXPLORE)一、数值型数据的基本统计量Summary Measures Central TendencyMeanMedianModeQuartileSummary MeasuresVariationVarianceStandard DeviationCoefficient ofVariationRangeMeasures of Central TendencyCentral Tendency集中趋势MeanMedian Mode n x n i i∑=1Midrange (中列数)The Mean (均值)(Arithmetic Average)•It is the Arithmetic Average of data values:•The Most Common Measure of Central Tendency •Affected by Extreme Values (Outliers 异常值)n x n 1i i∑=nx x x n 2i +•••++=0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14Mean = 5Mean = 6=x Sample MeanThe Median(中位数)•Important Measure of Central Tendency•In an ordered array, the median is the“middle”number.•If n is odd, the median is the middle number.•If n is even, the median is the average of the2 middle numbers.•Not Affected by Extreme Values0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14Median = 5Median = 5The Mode (众数)0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode = 9•A Measure of Central Tendency •Value that Occurs Most Often •Not Affected by Extreme Values •There May Not be a Mode •There May be Several Modes•Used for Either Numerical or Categorical Data 0 1 2 3 4 5 6No ModeMidrange(中列数)•A Measure of Central Tendency •Average of Smallest and Largest Observation:•Affected by Extreme Value2x x smallestest l +=arg Midrange 0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10Midrange = 5Midrange = 5!SPSS 不提供该统计量Quartiles (四分位数)zNot a Measure of Central Tendency z Split Ordered Data into 4 Quartersz Position of i-th Quartile: position of point 25%25%25%25%Q 1Q 2Q 3Q i(n+1)i=4Data in Ordered Array: 11 12 13 16 1617 18 21 22Position of Q 1 = 2.50 Q 1=12.5=1•(9 + 1)4Summary MeasuresCentral TendencyMeanMedian ModeMidrangeQuartile n x n i i∑=1Summary Measures Variation Variance Standard DeviationCoefficient of Variation Range ()1n x x s 2i 2−∑−=Measures of VariationVariationVariance Standard Deviation Coefficient ofVariationPopulation Variance Sample Variance Population Standard Deviation Sample Standard DeviationRangeInterquartile Range (四分位数间距)100%⋅⎟⎠⎞⎜⎝⎛=XSCV•Measure of Variation•Difference Between Largest & Smallest Observations:Range =•Ignores How Data Are Distributed:The Range (极差)Smallest rgest La x x −7 8 9 10 11 12Range = 12 -7 = 57 8 9 10 11 12Range = 12 -7 = 5•Measure of Variation•Also Known as Midspread:Spread in the Middle 50%•Difference Between Third & FirstQuartiles:Interquartile Range =•Not Affected by Extreme ValuesInterquartile Range (四分位数间距)13Q Q −Data in Ordered Array: 11 12 13 16 1617 1718 2113Q Q −= 17.5 -12.5 = 5•Important Measure of Variation •Shows Variation About the Mean:•For the Population:•For the Sample:Variance (方差)()NX i ∑−=22µσ()122−∑−=n X X s i For the Population:use N in thedenominator.For the Sample : use n -1in the denominator.•Most Important Measure of Variation •Shows Variation About the Mean:•For the Population:•For the Sample:Standard Deviation (标准差)()NX i ∑−=2µσ()12−∑−=n XX s i For the Population:use N in thedenominator.For the Sample :use n -1in the denominator.Sample Standard Deviation(样本标准差)()12−∑−=n X X i For the Sample : use n -1in the denominator.Data:10 12 14 15 17 18 1824s = n = 8 Mean =161816241618161716151614161216102222222−−+−+−+−+−+−+−)()()()()()()(= 4.2426s :X iComparing Standard Deviations ()12−∑−n X X i s = = 4.2426()N X i ∑−=2µσ= 3.9686Value for the Standard Deviation is larger for data considered as a Sample .Data :10 12 14 15 17 18 1824:X i N= 8 Mean =16Comparing Standard DeviationsMean = 15.5s = 3.33811 12 13 14 15 16 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21Data BData AMean = 15.5s =.925811 12 13 14 15 16 17 18 19 20 21Mean = 15.5s =4.57Data CCoefficient of Variation (变异系数)z Measure of Relative Variation z Always a %z Shows Variation Relative to Mean z Used to Compare 2 or More Groups z Formula ( for Sample):100%⋅⎟⎠⎞⎜⎝⎛=X S CVComparing Coefficient of Variation zStock A:Average Price last year =$50Standard Deviation =$5z Stock B:Average Price last year =$100Standard Deviation =$5100%⋅⎟⎠⎞⎜⎝⎛=X S CV Coefficient of Variation:Stock A:CV = 10%Stock B:CV = 5%ShapezDescribes How Data Are Distributed zMeasures of Shape:z Symmetric or skewedRight-Skewed Left-SkewedSymmetric Mean = Median = Mode Mean Median Mode Median MeanModeSPSS实例-数值型数据的基本统计量Box-and-Whisker Plot (盒须图,箱图)z Graphical Display of Data Using5-Number SummaryMedian 4681012Q 3Q 1X largest X smallestDistribution Shape &Box-and-Whisker PlotsRight-Skewed Left-Skewed SymmetricQ1Median Q3Q1Median Q3Q1Median Q3SPSS盒须图实例Explore过程缺省输出二、SPSS的描述统计过程SPSS提供的描述统计过程z频度分析(FREQUENCES)z描述统计(DESCRIPTIVES)z考查样本(EXPLORE)频度分析过程(FREQUENCES)频度分析过程:FREQUENCES 频度分析过程的功能:计算单个变量的频数、百分数,某些描述统计量,产生频数表,绘制条形图和直方图。