中山大学数据科学与计算机学院移动信息工程专业-人工智能

格式：pdf
大小：491.00 KB
文档页数：9

下载文档原格式

/ 9

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中山大学数据科学与计算机学院

移动信息工程专业-人工智能

本科生实验报告

（2017-2018学年秋季学期）

教学班级15M2专业（方向）互联网

学号15352218姓名林燕娜

一、实验题目

利用BP神经网络实现回归

二、实验内容

1.算法原理

BP神经网络：

在之前，我们学到的几种算法里面，很多种都是线性不可分的。可比说PLA，而BP神经网络，通过隐藏层的设计，使得达到多元可分的情况。

神经网络分为两个过程，一个是正向传递过程，一个是反向传递过程。

正向传递过程：经过一定的计算，可以得到最后的预测结果。

反向传递过程：根据预测到的最终结果与实际结果的误差，反作用于输入层的系数W1和隐藏层的系数W2，进行一定的更新。

对于返向传递过程：

在本次实验中，利用的是matlab工具，鉴于之前ta课上说的利用for循环和直接用矩阵运算的时间成本差距非常大。所以自行进行了公式的推导，将最后的矩阵运算更新W公式算了出来。

假设：

->原来训练集的标签的train_label（矩阵大小是K*1)

->输入层的数据为train(矩阵大小K*M，其中K是样本数量，M是特征属性个数)

->隐藏层的节点高数为N

->输入层到隐藏层的系数矩阵W1（矩阵大小为M*N）

->隐藏层的输入是1*_W train input hidden =（矩阵大小是K*N）->隐藏层的输出是)11./(11___input hidden input

hidden e e output hidden --+=+=

（矩阵大小

是K*N）。

->隐藏层到输出层的系数矩阵为W2（矩阵大小是N*1）

->预测出来的是2*___W output hidden label predict y =(矩阵大小是K*1）则，误差为：2).^__(2

label train predict y E -=

；则对于隐藏层的系数W2求偏导：

)__(*)'_(2

__2label train predict y output hidden W predict

y predict y E W E -=∂∂∂∂=∂∂这样子的话，求出来的倒数是所有样本加起来的倒数，则W2的更新公式就是：

K label train predict y output hidden W W E

W W /)__(*)'_(*22

22--=∂∂-=ηη

而对于输入层的系数W1，求偏导：

train

output hidden output hidden W label train predict y W input

hidden input hidden output hidden output hidden predict y predict y E W E *)_1(*_*2*)__(1

______1--=∂∂∂∂∂∂∂∂=

∂∂而考虑到矩阵运算存在着维度上的问题，其导数在矩阵运算中应该为：

)]}_1(*._[*).'2(*)__{(*)'(1

output hidden output hidden W label train predict y train W E

--=∂∂同样，算出来的导数是基于所有样本的导数和，则W1的更新公式为：

K W E

W W /1

11∂∂-=η

。因为W1公式比较复杂，可以一步步的思考，每一步代表什么意义。

)]_1(*._[output hidden output hidden -是一个K*N 的矩阵，其ij 元素代表的是：第

i 个样本的第j 个隐藏层节点的输出值和1-输出值相乘。

)'2(*)__(W label train predict y -是一个K*N 的矩阵，其ij 元素代表的是：第i 个

样本的第j 个隐藏层节点对样本i 的预测误差造成的影响，W2对应的j 元素就是其权重。

)]}_1(*._[*).'2(*)__{(output hidden output hidden W label train predict y --是

一个K*N的矩阵，其ij元素代表的是：第i个样本的第j个隐藏层节点输入的对最终误差的影响。

则最后与train的相乘，是一个M*N的矩阵，其ij元素代表的是：所有样本的对Wij 的导数的一个求和。

2.伪代码/流程图

3.关键代码（带注释）

动态更新W：

->迭代loop次

->前向传输：

->根据当前的W1，算出每个隐藏节点的输入，然后再利用激活函数，算出每个隐藏层节点的输出。

->根据W2算出最终的结果。

->后向传输：

->根据算出的最终结果，对W2和W1求导，然后用梯度下降法的公式更新W1和W2。

4.创新点&优化（如果有）

数据预处理：

在本次实验中，可以看到原始数据是比较杂乱的，很多并没有实际的参考价值。所以进行了数据的预处理。

将instant 的id、年份year、日期、weekday 等无用或者重复信息忽视掉。对season、weather、hr 等属性进行一个onehot 处理。具体：

对于season，一共有四个季度，用三个属性就可以代表着四个季度；

对于weather，用一个属性来代表，1、2代表天气好，3、4代表天气不好；对于hr，分为上班时间和下班时间；最终整体属性的数据都在0—1之间。

自己推导E 对W 的公式，以一个矩阵运算代替for 完成更新：

鉴于之前ta 课上说的matlab 利用for 循环和直接用矩阵运算的时间成本差距非常大。所以并没有选择一个个样本进行运算，而是一次性计算所有的样本，利用矩阵运算达到佳和的效果。

具体原理见实验原理。

将sigmoid 函数换成tanh 函数：

简单的在计算隐藏层的输出的是有，将公式换成对应的tanh 的公式，在最后反向传播的时候，将)

_1(*___output hidden output hidden input

hidden output

hidden -=∂∂换成：

)_tanh(1__output hidden input

hidden output

hidden -=∂∂就可以了。

中山大学数据科学与计算机学院

页数:1
数据科学与大数据技术专业介绍

页数:9
XX研究生的计算机工程专业和计算机科学专业有啥区别

页数:5
中山大学数据科学与计算机学院计算机技术考研复试面试真题及答案总结

页数:22
数理与信息工程学院计算机科学与技术专业

页数:5
2018年数据科学培养方案

页数:2
计算机与科学技术简历

页数:3
数据科学

页数:10
中山大学数据科学与计算机学院考研复试真题答案经验分享

页数:2
计算机科学与技术专业情况汇报

页数:19

中山大学数据科学与计算机学院移动信息工程专业-人工智能

合集下载

相关主题

文档推荐

最新文档