旅游市场大数据研究分析方案(旅游目的地大数据分析思路方法)

  • 格式:pdf
  • 大小:3.06 MB
  • 文档页数:57

下载文档原格式

  / 57
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究角度
人的行为路径; 人的心理活动; 人的选择动机; 人的出行规律; 人的媒体接触等。
重点研究的数据模型
游客
分析
到达方式
游客信息 来源
游客 消费
43
项目实施方案
分析方法
28
项目实施方案
数据采集
29
数据采集:通过四种途径进行数据采集和整理



游 客 位
动 点
到 达






客 行
属 性

百度LBS
媒 体 接 触 游 客 兴 趣
预 订 方 式 目 的 地 诉 求
百度大搜
游 客 兴 趣
旅 游 收 入



息来









调研
邮 轮
机 票
酒 店
旅 游 产 品
18
数据模型:游客信息来源
亲朋好友
游客信息来源
来皖游客从什么渠道了解到安徽旅游信息
传统媒体
电视广告 报刊杂志 地铁硬广 路牌广告
旅行社 交通广告
……
新媒体平台
资讯网软文 网络推广广告 微博网友分享 微信网友分享 其他社交媒体
分享 搜索引擎
百科 论坛 OTA 旅游攻略 ……
19
数据模型:游客达到方式
GFK
国内
入境
数据采集方式采用新型互联网和物联技术结合传统调研方式进行。
30
数据采集:百度LBS
遥感测绘
步行采集
机载激光雷达
机载数码摄影
车辆采集
广泛的数据资源获得方式确保了数据覆盖范围和及时更新
•中国最全面、精确的地图数据库 •数据覆盖13亿人口,400多个城市、500万公里道路 •完全自主知识产权的采集平台
GFK平台全渠道消费者预订轨迹与消费者固定样组(提供更全面的行为、态度与属性信息)融合
3rd party data sources & market extrapolation 市场推总 ※ 第三方数

Live channel forward bookings
实时预订信息来源及 渠道
Civil Aviation Authority
旅游学包含 一,旅游经济学理论; 二,旅游社会学理论; 三,旅游人类学理论; 四,旅游心理学理论; 五,旅游地理学理论; 六,旅游生态学理论;
旅游人次和收入
游客消费情况
重点研究的数据模型
40
理论应用:社会学
社会学使用各种研究方法进行实证调查和批判分析,以发展及完善一套有关人类社会结构及活动的知识体系,并会以运用这些知识 去寻求或改善社会福利为目标。
游客到达方式
地市
自驾 高铁 航空 骑行 徒步 ……
景区
自驾 高铁 航空 骑行 徒步 ……
20
数据模型:消费情况
美食
住宿
消费情况 来皖游客在安徽省主要消费比例
交通
游览
购物
娱乐
21
项目实施方案
1. 数据来源; 2. 数据采集; 3. 运算模型 4. 理论应用; 5. 分析方法; 6. 技术支撑 7. 数据可视化; 8. 工作计划。
16
数据模型:主要客源地筛选
主要客源地
国内客源地
主要客源地省份 主要客源地城市
入境游客源地
主要客源地国家 主要客源地省份
17
数据模型:游客分析
性别
男性 女性
游客分析
年龄
19岁以下 20-29岁 30-39岁 40-49岁 50岁及以上
职业
学生 白领
IT 娱乐工作者 影视从业 高层管理 教授专家 文艺工作者
数据本身
专业技能
5
安徽大数据的价值
拥有更多数据量,应该释放更大数据价值
6
安徽省2013年国庆景区接待游客数量庞大
2013年国庆日,11个重点景区单日接待突破40万人
7
安徽省2013年国庆收入同比增加很大
旅游收入突破160亿元
8
游客在安徽省可以体验的旅游项目数量155603个
列别 美食 住宿 游览 购物 娱乐 总计
31
数据采集:百度大搜索
Spider 是百度搜索引擎的一个自动程序。它的作用是访问互联网上的 蜘 html网页(当然动态页面也可以抓取),建立索引数据库,使用户 蛛 能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。
中国是全球仅有的4个拥有搜索引擎核心技术的国家之一,而百度搜索引擎是开创者和领先者。
10
安徽省旅游大数据的价值开发潜力十足
安徽省旅游大数据价值有 待开发
挖掘游客、消费和行为数据将 有助于安徽省在发展方向、营 销决策、旅游规划、交通设施 等方面提供依据。
游客接待量
40万
游客基本信息数据 游客来源地数据
旅游收入
160 亿
游客消费数据; 游客兴趣数据;
活动点
155603
游客行为数据; 景区热度等;
交通
数量 61926 24694 5900 36666 26417 155603
17.4万公里
旅游体验项目 155603个
9
安徽省旅游大数据的潜力巨大
日游客接待量
Hale Waihona Puke Baidu
旅游收入
40万
160 亿
游客基本信息数据 游客来源地数据
游客消费数据; 游客兴趣数据;
活动点
155603
游客行为数据; 景区热度等;
数据间交叉分析有指数级别的量级
6. 旅游服务
7. 旅游景区
游客
8. 游客来源
信息 来源
……
39
理论应用:旅游学
旅游学以研究人类的旅游活动为主线,以探究旅游活动三要素(旅游主体、旅游客体、旅游媒介)及其相互关系为核心,通过探讨旅游现象 的历史演进,总结旅游发展的基本规律,阐述旅游活动和旅游业的构成要素以及它们之间的关系,分析旅游活动对社会、经济、环境的影 响,介绍发展旅游的政策和法规,从而展示旅游学科基础理论框架。
15
数据模型:旅游人次和收入
旅游人次和收入
同比
与去年同期相比
环比
上阶段相比
全国旅游业对比
1. 与全国旅游 业整体旅游 人次和收入 占比;
2. 与全国所有 省份旅游人 次和收入的 对比;
与中部省份对比
河南省(豫)、 山西省(晋)、 湖北省(鄂)、 安徽省(皖)、 湖南省(湘)、 江西省(赣)。 旅游人次和收入 对比和排序
3 信息收集
x5
4预
重34
测 y5 复
36
项目实施方案
理论应用
37
我们拥有强大的人才队伍,博
士人才不低于数十人,在旅游
学、社会学、统计学、传播学、
行为学等方面均有研究和论文
发表。
在数据研究和分析方面均可以提供理论结合 实际的全面分析。
旅游学
组织行为学
理论应用
社会学
体系
大众传播学
统计学
38
理论应用:统计学
理论应 用
分析方 法
安徽旅游宏观经济数据 安徽旅游游客信息数据 安徽旅游客源地数据


安徽游客消费行为数据
整合多渠道的数据类型,结合传统数据和新兴媒体数据形成大数据服务平台模型,经过数据清理、过滤、 筛选和整理,开展分析环节,结合多重分析方法以理论为基础,为安徽省全面分析国内和入境旅游。 50
策划设计
互联网
蜘蛛控制 网络蜘蛛
URL数据库 URL提取
文本索引 索引数据库
网页数据库
查询服务器
链接信息提取 链接数据库
网页评级
用户
32
数据采集:综合调研
界定阶段
数据采集对象 确定数据采集类型 确定研究目的
设计阶段
设计调查方案 辨别信息类型及可能来源 确定信息获得方法 设计数据获得工具 设计抽样方案,确定样本
24
数据来源:搜索引擎 搜索引擎
国内
入境
25
数据来源:垂直旅游 垂直旅游
26
数据来源:新媒体和移动 新媒体和移动
国内
入境
27
数据来源:旅游局和社会公开数据 旅游局和社会公开数据
为了保证数据报告的科学性,最大化与安徽省旅游实际情况相吻合。 旅游局、景区在必要时需提供往年或目前的旅游相关数据,例如,2014年未开展大数据服务前的各地市收 入数据,该数据在互联网中不可查询等与此类似的数据。
22
项目实施方案
数据来源
23
数据来源:国内和入境
以往数据记录 游客体验、评价和消费
旅游信息、交易和预订 来源、行为路径、到达方式
游客基本信息、基本诉求
旅游局和社会公开数据 新媒体和移动 垂直旅游
百度LBS和GFK
搜索引擎
数据来源渠道以互联网 和移动互联网技术为主。 例如搜索引擎、lbs、社 交媒体等;以旅游局和 社会公开数据为补充渠 道。
安徽旅游市场大数据分析
1 黄山
大数据背景
2
大数据已在过去五年得到飞速发展
中国政府在美国提出《大数据研究和发展计划》的2012年也批复了“十二五国家政务信息化建设工程规 划”,总投资额估计在几百亿,专门有人口、法人、空间、宏观经济和文化等五大资源库的五大建设工程。
我国的开放、共享和智能的大数据的时代已经来临!
社会学研究对象 包括历史、政治、经济、社 会结构、人口变动、民族、 城市、乡村、社区、婚姻、 家庭与性、信仰与宗教、旅 行、现代化等领域。
重点研究的数据模型
游客 分析
到达方式
主要客源 地
游客 消费
41
理论应用:大众传播学
传播组织通过现代的传播媒介对及其广泛的受众所进行的信息传播活动
研究角度 游客自我传播; 游客群体传播; 游客组织传播; 游客大众传播。
实施阶段
现场实施--数据收集 现场实施--数据初步审核
数据整理阶段
数据复核 大数据平台录入
调研采集方式:
个别访谈 集体访谈 文献法 试点调查法 (线上线下)问卷调查法
数据采集对象:省地市旅游局从业人员、安徽省旅游境内游客
33
数据采集:GFK数据采集平台
GfK Consumer Insights 消费者洞察
Operators
AOG flight database
IPS data
Travel Agents Airlines & LCC
OTA
Passenger Shipping Association
Cruise
Financial Reports
Hotel
Expertise Segments 细分领域
Package 包团
Cruise 游轮
Accomodation 住宿
Flight 航空
Ancillary 其他配套
34
项目实施方案
运算模型
35
运算模型 基于大规模机器学习的时间序列模型 —— 动态分析模型(SSG)
1 数据准备
各种因素
旅游人数
2 模型参数训练
yt Ct xt t t ~ N 0, Rt xt At xt1 t t ~ N 0,Qt
重点研究的数据模型 游客信息来源
游客分析
42
理论应用:组织行为学
组织行为学是研究在组织中以及组织与环境相互作用,人们从事工作的心理活动和行为反应规律性的科学。它采用系统分析的方法, 综合运用心理学、社会学、人类学、生理学、生物学、经济学和政治学等知识,研究一定组织中人的心理和行为的规律性,从而提 高各级领导者和管理者对人的行为预测和引导能力,以便更有效地实现组织预定的目标。
3
大数据发展过程中,其价值链形成3大构成单元
数据本身 专业技能 数据思维
基于数据的公 司
这些拥有大量数据或者至少可以 收集大量数据,却不一定有从数 据中提取价值或者用数据催生创 新思想的技能。例如推特,是将 数据转让或者授权别人使用。
基于技能的公 司
通常是咨询公司、技术供应商或 者分析公司。他们掌握了一些数 据或者提出数据创新性用途的才 能。比如沃尔玛或者麦肯锡这样 的公司。
统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量 的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
可应用的研究对象:
重点研究的数据模型
1. 旅游经济
客源

2. 旅游人次
3. 旅游消费
4. 旅游行为
5. 旅游对象
数据模型设计
旅游人次和收入; 主要客源地筛选; 游客分析; 游客信息来源; 游客到达方式; 消费情况;
14
数据模型设计
旅游人次和收入
主要客源地筛选
国内和入境数据模型需求类 似,在满足招标要求最根本
消费情况
的需求下,进行分析和总结。
详细模型层




游客分析






游客到达方式
游客信息来源
数据模型阐述
个体户 事业单位 餐饮行业
……
兴趣
音乐 书籍 运动 登山 篮球 户外 商务 美食 绘画 旅行 创意 设计 高尔夫 ……
收入
1000以下 1000-2000元 2000-4000元 4000-6000元 6000-8000元 8000-10000元 1万-1.5万元 1.5万-2万元
2万以上
目的
出行动机
基于思维的公 司
具有数据思维会利用数据辅助自 己活得价值的人或公司,例如网 友通过分析微博年轻网友分享的 旅游目的地的图片和美食来制定
旅游目的地从而牟利,这是一种 数据本身
创新思维,拥有挖掘数据的新价 值
数据思维
专业技能
摘自《大数据时代》p160 维克托 迈尔 舍恩伯格 4
数据思维
专业技能型角色
更注重数据带来的使用价值
11
服务构思
服务构思框架
12
服务构思框架
传统基础统计数据
旅游统计数据 运营商数据 酒店数据
交通数据 OTA数据 旅行社数据
网络数据及其他社会化数据)
百度LBS数据 垂直媒体数据
综合媒体数据 搜索数据
网站数据 移动应用数据
社交网络数据 其他
大数据 服务平台
清 理 、 整 理
过 滤 、 筛 选 、
国 内