《谁说菜鸟不会数据分析》中关于数据分析方法的总结(1)
- 格式:ppt
- 大小:1.57 MB
- 文档页数:28
1.明确分析思路:首先要明确分析目的:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。
这点有比较深的体会,在公司里做过关于搜索和新手的产品数据分析,自己对分析目的没考虑太多,靠的是前人留下的上期数据分析结果,倘若让我从零开始做,估计会很盲目。
然后确定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
最后还要确保分析框架的体系化,使分析结果具有说服力:营销方面的理论模型有4P、用户使用行为、ST P理论、SWOT等;管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART等。
在上周一个汇报上使用了SWOT分析方法,对这些营销或管理的模型还都很陌生。
2.数据收集:一般数据来源于以下几种方式:数据库、公开出版物(统计年鉴或报告)、互联网、市场调查。
3.数据处理:数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。
导师提过在做数据处理时,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。
4.数据分析:数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
与数据挖掘的关系是数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
5.数据展现:一般情况下,数据是通过表格和图形的方式来呈现的。
常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。
进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
在一般情况下,能用图说明问题的就不用表格,能用表说明问题的就不用文字。
6.报告撰写:一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
谁说菜鸟不会数据分析(一)一、数据分析六步曲: 1.明确分析目的和内容 2.数据收集 3.数据处理4.数据分析5.数据展现:能用图说明问题的,就不用表格,能用表格说明问题的,就不用文字。
6.报告撰写几个常用指标或术语:1. 平均数:我们在日常生活中提到的平均数,一般是指算术平均数,就是一组数据的算术平均值,即全部数据累加后除以数据个数。
它的特点是将总体内各单位的数量差异抽象化。
2. 绝对数与相对数:绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也可以表现为在一定时间、地点条件下数量的增减变化。
相对数是指由两个有联系的指标对比计算而得到的数值,它是用以反映客观现象之间数量联系程度的综合性指标。
相对数=比较数值(比数)/基础数值(基数)分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
3. 百分比与百分点:百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度。
4. 频数与频率:频数是指一组数据中个别数据重复出现的次数。
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
所以频数是绝对数,频率是相对数。
5. 比例与比率:比例与比率都属于相对数。
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
6. 倍数与番数:倍数与番数同样属于相对数,但使用时容易混淆。
倍数是一个数除以另一个数所得的商。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
番数是指原来数量的2的N次方倍。
7. 同比与环比:同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况,例如2021年12月与2021年12月相比。
谁说菜鸟不会数据分析(入门篇)5.1数据分析方法数据分析作用与对应的分析方法数据分析作用 基本方法 数据分析方法现状分析 对比 对比分析平均分析综合评价分析 ……原因分析 细分 分组分析结构分析交叉分析杜邦分析漏斗图分析 矩阵关联分析 聚类分析 ……预测分析 预测 回归分析 时间分析 决策树 神经网络 ……一、定义• 对比分析法 – 将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。
• 对比分析法的特点:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是对少。
二、分类分为静态比较和动态比较★ 静态比较 – 在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较,也叫横向比较,简称横比。
★ 动态比较 – 在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。
三、实践运用1. 与目标对比实际完成值与目标进行对比,属于横比。
例如将公司目前的业绩与全年的业绩目标进行对比,看是否完成目标。
2. 不同时期对比选择不同时期的指标数值作为对比标准,属于纵比。
例如将公司目前的业绩与自身的去年同期及上个月完成情况进行对比。
• 同比 - 与去年同期对比。
• 环比 - 与上个月完成情况对比。
3. 同级部门、单位、地区对比与同级部门、单位、地区对比属于横比。
4. 行业内对比与行业中的标杆企业、竞争对手或行业的平均水平进行对比,属于横比。
5. 活动效果对比对某项营销活动开展前后进行对比,属于纵比。
对活动的开展状况进行分组对比,属于横比。
四、注意事项1. 指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准取衡量。
2. 对比的对象要有可比性。
3. 对比的指标类型必须一致。
• 分组分析法 – 根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
谁说菜鸟不会数据分析(入门篇)
4.2.1重复数据的处理
例:对“编号”中的重复数据进行处理
找出重复数据 - 函数法(COUNTIF 函数)
Step01. 选中B2单元格,输入公式:=COUNTIF(A:A,A2)
(计算整个A 列中,A2单元格中的值出现的次数)
然后将公式复制到B3: B11单元格(或按住右下角的小十字向下拖动到B11单元格)
Step02. 选中C2单元格,输入公式:=COUNTIF(A$2:A2,A2)
(计算从A 列2行(固定)单元格开始到A 列2行单元格中,A2单元格中的值出现的次数) 其中:$表示绝对引用。
然后将公式复制到C3: C11单元格(或按住右下角的小十字向下拖动到C11单元格)
另:若要显示公式,则在原公式的前面加一个’即可,如:'=COUNTIF(A$2:A8,A8)
B 列中的结果代表每个编号出现的次数,所以B 列中大于1的单元格所对应的编号即为重复的编号。
C 列中的结果代表每个编号出现了第几次,所以C 列中等于1的单元格所对应的编号即为第一次出现的编号,将它们筛选出即为所要的最终结果。
第 章数据分析那些事儿数据分析是“神马”数据分析六步曲几个常用指标或术语1>> 12谁说菜鸟不会数据分析出场人物:牛董,关键词:私企董事长、要求严格、为人苛刻;小白,关键词:应届毕业生,刚入职场的伪白骨精(白领+骨干+精英)、牛董助手、爱臆想;Mr.林,关键词:小白同事、数据分析达人、成熟男士、乐于助人、做事严谨。
话说小白过五关斩六将,通过严格的面试,最终从众多优秀毕业生中脱颖而出,成为公司的一员。
在报到的第一天,公司HR向小白介绍了她的职位——公司牛董的助理,负责文秘工作,可能需要做一些数据分析之类的活儿。
小白一听到数据分析这个词,就感觉头皮发麻,这时,她的脑子里幻想出一些穿白大褂的科研人员在实验室的计算机前不断忙碌的场景。
虽然在上大学时也使用过Excel,但是如果要做数据分析工作,她还真的有些不知如何下手。
无数个问号涌到她的脑海中:数据分析到底要做什么呢?我要怎么做数据分析?老板想要看什么样的结果呢?……唉,只好边走边干了。
HR看出小白的心事,说道:关于数据分析你不用太担心,如果遇到难题,你可以请教我们公司的Mr.林,他在这方面可是专家喔!小白一听有救星,立马兴奋起来,好像抓到救命稻草一样,想赶紧找到这位大师级人物,然后一股脑把疑问全倒出来。
HR:小白,你跟我来吧,我给你引荐下Mr.林。
小白:好的。
说着小白跟HR来到了Mr.林的办公桌旁,HR说道:Mr.林,这是我们公司新来的同事,叫小白,现担任牛董助理,她的部分工作涉及数据分析,到时候有问题还要麻烦您多多指点了。
小白紧跟着说道:Mr.林,您好,请多多指教。
Mr.林:呵呵,太客气了,有问题直接来找我就可以了。
小白趁机说道:我现在就有问题,您现在是否有时间帮我解答下?数据分析是干什么的,具体要怎么做?Mr.林听完后,笑了起来:你还真是不客气呀,好吧,你刚进公司,我就先给你做个简单的培训,带你入个门吧,以后的修行可就靠你自己努力了。
小白用力点着头,HR见这“师徒”二人颇有一见如故之感,大致交代一番后,就离开了。
谁说菜鸟不会数据分析(入门篇)4.3数据加工4.3.1数据抽取数据抽取:保留原数据表中某些字段的部分信息,组合成一个新字段。
① 截取某一字段的部分信息 – 字段分列;② 将某几个字段合并成为一个新字段 – 字段合并;③ 将原数据表没有但其它数据表中有的字段,有效地匹配过来 – 字段匹配。
二、字段合并字段合并:将文字和数字合并成一个单元格。
利用CONCATENATE函数和“&”(逻辑与)运算符。
数值格式字符(#, 0, %, E, e, 逗点和句点)(0) 数字占位符。
显示一位数字或是零。
如果表达式在格式字符串中 0 的位置上有一位数字存在,那么就显示出来;否则,就以零显示。
如果数值的位数少于格式表达式中零的位数(无论是小数点的左方或右方),那么就把前面或后面的零补足。
如果数值的小数点右方位数多于格式表达式中小数点右面零的位数,那么就四舍五入到有零的位数的最后一位。
如果数值的小数点左方位数多于格式表达式中小数点左面零的位数,那么多出的部分都要不加修饰地显示出来。
(#) 数字占位符。
显示一位数字或什么都不显示。
如果表达式在格式字符串中“#”的位置上有数字存在,那么就显示出来;否则,该位置就什么都不显示。
此符号的工作原理和“0”数字占位符大致相同,不同之处只有在当表达式中数值的位数少于“#”的位数(无论是小数点左方或右方)时,不会把前面或后面的零显示出来。
(.) 小数点占位符。
在一些国别是用逗号来当小数点的。
小数点占位符用来决定在小数点左右可显示多少位数。
如果格式表达式在此符号左边只有正负号,那么小于 1 的数字将以小数点为开头。
如想在小数前有“0”的话,那么请在小数点占位符前加上“0”这个数字占位符。
小数点占位符的实际字符在格式输出时要看系统的数字格式而定。
(%) 百分比符号占位符。
表达式乘以 100。
而百分比字符 (%) 会插入到格式字符串中出现的位置上。
(,) 千分位符号占位符。
在一些国别,是用句点来当千位符号。
常用数据分析方法论——摘自《谁说菜鸟不会数据分析》数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标?数据分析方法论主要有以下几个作用:●理顺分析思路,确保数据分析结构体系化●把问题分解成相关联的部分,并显示它们之间的关系●为后续数据分析的开展指引方向●确保分析结果的有效性及正确性常用的数据分析理论模型营销方面管理方面4P用户使用行为STP理论SWOT……PEST5W2H 时间管理生命周期逻辑树金字塔SMART原则……PEST分析法PEST分析理论主要用于行业分析PEST分析法用于对宏观环境的分析。
宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。
对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治、经济、技术、社会,这四大类影响企业的主要外部环境因素进行分析。
以下以中国互联网行业分析为例。
此处仅为方法是用实力,并不代表互联网行业分析只需要作这几方面的分析,还可根据实际情况进一步调整和细化相关分析指标:5W2H分析法5W2H分析理论的用途广泛,可用于用户行为分析、业务问题专题分析等。
利用5W2H分析法列出对用户购买行为的分析:(这里的例子并不代表用户购买行为只有以下所示,要做到具体问题具体分析)逻辑树分析法逻辑树分析理论课用于业务问题专题分析逻辑树又称问题树、演绎树或分解树等。
逻辑树是分析问题最常使用的工具之一,它将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。
把一个已知问题当成树干,然后开始考虑这个问题和哪些相关问题有关。
(缺点:逻辑树分析法涉及的相关问题可能有遗漏。
)逻辑树分析法在利润分析中的应用:4P营销理论4P分析理论主要用于公司整体经营情况分析4P营销理论在公司业务分析中的应用:用户行为理论用户行为理论的用途较单一,就是用于用户行为研究分析用户使用行为:认知--熟悉--试用--使用--忠诚利用用户行为理论,梳理网站分析的各关键指标之间的逻辑关系,构建符合公司实际业务的网站分析指标体系:。