感知器学习算法

  • 格式:ppt
  • 大小:695.00 KB
  • 文档页数:30

下载文档原格式

  / 30
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
o1(0)=sgn(2.5)=1 W(1)= W(0)+η [d1- o1(0)] X1 =(0.5,1,-1,0)T+0.1(-1-1)(-1,1,-2,0)T =(0.7,0.8,-0.6,0)T
--
北京工商大学信息工程学院
26
3.1.4感知器的学习算法
第二步 输入X2,得
前 馈 神 经 网 络 单 层 感 知 器
由于d2= o2(1),所以W(2)= W(1)。
北京工商大学信息工程学院
27
3.1.4感知器的学习算法
第三步 输入X3,得
前 馈 神 经 网 络 单 层 感 知 器
WT(2)X3=(0.7,0.8,-0.6,0)(-1,-1,1,0.5)T=-2.1
O3(2)=sgn(-2.1=-1 W(3)= W(2)+η [d3- o3(2)] X3 =(0.7,0.8,-0.6,0)T+0.1[1-(-1)](-1,-1,1,0.5)T =(0.5,0.6,-0.4,0.1)T
--
设初始权向量W(0)=(0.5,1,-1,0)T,η =0.1。注意, 输入向量中第一个分量x0恒等于-1,权向量中第一个分 量为阈值,试根据以上学习规则训练该感知器。
北京工商大学信息工程学院
25
3.1.4感知器的学习算法
解:第一步 输入X1,得
前 馈 神 经 网 络 单 层 感 知 器
WT(0)X1=(0.5,1,-1,0)(-1,1,-2,0)T=2.5
--
第四步 返回到第一步,继续训练直到dp- op=0,p=1,2,3。
北京工商大学信息工程学院
28
3.1.3单层感知器的局限性
问题:能否用感知器解决如下问题?
x1

O
O

x2
北京工商大学信息工程学院
29
3.1.3单层感知器的局限性
无法解决“异或”问题
“异或”的真值表
x1
x2
y
0
0 1 1
0
1 0 1
0
1 1 0
只能解决线性可分问题
北京工商大学信息工程学院 30
--
则由方程 wijx1+w2jx2+w3j –Tj=0
(3.4)
确定了三维空间上的一个分界平面。
北京工商大学信息工程学院
9
(2)输入是三维
T Wj X 0
是什么?
x1 * * * * * * x3 * O O * * O O O * * O O x2 O
wij x1+w2j x2 +w3j x3– Tj = 0
20
3.1.4感知器的学习算法
Perceptron(感知器)学习规则
式中,当实际输出与期望值相同时,权值不需要调整。感 知器学习规则代表一种有导师学习。
3.1.4感知器的学习算法
感知器学习规则的训练步骤:
前 馈 神 经 网 络 单 层 感 知 器
(1) 对各权值w0j(0),w1j(0),┄,wnj(0),j=1, 2,┄,m (m为计算层的节点数)赋予较小的非零随机数; (2) 输入样本对{Xp,dp},其中Xp=(-1,x1p,x2p,┄,xnp), dp为期望的输出向量(教师信号),上标p代表 样本对的模式序号,设样本集中的样本总数为P, 则p=1,2,┄,P;
第三章 前馈神经网络
3.1单层感知器 3.2多层感知器
北京工商大学信息工程学院
1
3 前馈神经网络
3.1单层感知器
3.1.1感知器模型
o1
W1

Wj
oj

om


Wm○

x1

x2


xi


xn
2
北京工商大学信息工程学院
3.1.1感知器模型
X ( x1,x2 ,...xi ,...,xn )
* * * *
--
北京工商大学信息工程学院
8
3.1.2感知器的功能
x1
(2)设输入向量X=(x1,x2,x3)T
前 馈 神 经 网 络 单 层 感 知 器
oj
-1
x2 x3
1 w1 j x1 w2 j x2 w3 j x3 T j 0 输出: o j 1 w1 j x1 w2 j x2 w3 j x3 T j 0
北京工商大学信息工程学院
24
3.1.4感知器的学习算法
例三 单计算节点感知器,3个输入。给定3对训练样 本对如下:
前 馈 神 经 网 络 单 层 感 知 器
X1 = (-1,1,-2,0)T X2 = (-1,0,1.5,-0.5)T X3 = (-1,-1,1,0.5)T
d1 =1 d2 = 1 d3 =1
net j

i 1
n
wij xi
(3.1)
n
输出:
o j sgn(net j T j ) sgn(

i 0
--
wij xi ) sgn(W T j X)
(3.2)
北京工商大学信息工程学院
4
3.1.2感知器的功能
x1
(1)设输入向量X=(x1 ,x2
前 馈 神 经 网 络 单 层 感 知 器
x1 = a x2 +b x3 +c
3.1.2感知器的功能
x1 *
前 馈 神 经 网 络 单 层 感 知 器
* * * * O O * O O O O O x2 O
* * * * * x3
--
北京工商大学信息工程学院
11
3.1.2感知器的功能
(3) 设输入向量X=(x1,x2,…,xn)T wijx1+w2jx2+…+wnj –Tj=0 输出: 则由方程 wijx1+w2jx2+…+wnj –Tj=0 确定了n维空间上的一个分界平面。 (3.5) (3.6)
x1 * * * * * * * O O O * O O * * O O T WjOX 0 x2 O T W j X0
T Wj X 0
WT * 0 j X
3.1.2感知器的功能
x1 *
前 馈 神 经 网 络 单 层 感 知 器
* * * * * O O * O O O O O O x2 O
--
北京工商大学信息工程学院
22
3.1.4感知器的学习算法
感知器学习规则的训练步骤:
前 馈 神 经 网 络 单 层 感 知 器
(3)计算各节点的实际输出ojp(t)=sgn[WjT(t)Xp], j=1,2,...,m;
(4)调整各节点对应的权值,Wj(t+1)= Wj(t)+η [djp-ojp(t)]Xp, j=1, 2,┄,m, 其中为学习率,用于控制调整速度,太大 会影响训练的稳定性,太小则使训练的收敛速度变慢, 一般取0<η ≤1; (5)返回到步骤(2)输入下一对样本,周而复始直到对所有 样本,感知器的实际输出与期望输出相等。
--
北京工商大学信息工程学院
23
感知器学习规则的训练步骤:
(1)权值初始化 (2)输入样本对 (3)计算输出 (4)根据感知器学习规则调整权值 (5)返回到步骤(2)输入下一对样本,周而 复始直到对所有样本,感知器的实际输出与 期望输出相等。
前 馈 神 经 网 络 单 层 感 知 器
--
wij x1 = Tj - w2j x2
x1 = (Tj -w2j x2) / wij = - ( w2j/ wij ) x2 +Tj / wij = a x2 +c
* * * * * * *
x1 * * * * O O O O O O O O x2 O
感知器的功能(二维)
T Wj X 0
WT j X0
3.1.3感知器的局限性
问题:能否用感知器实现“异或”功能?
前 馈 神 经 网 络 单 层 感 知 器
“异或”的真值表
x1
x1
x2
y
0
0 1 1
0
1 0 1
0
1 1 0

O
O
--

x2
北京工商大学信息工程学院
19
3.1.4感知器的学习
关键问题就是求
T Wj X 0
北京工商大学信息工程学院
前 馈 神 经 网 络 单 层 感 知 器
--
北京工商大学信息工程学院
12
3.1.2感知器的功能
一个最简单的单计算节点感知器具有
前 馈 神 经 网 络 单 层 感 知 器
分类功能。其分类原理是将分类知识存储
于感知器的权向量(包含了阈值)中,由
权向量确定的分类判决界面将输入模式分
为两类。
--
北京工商大学信息工程学院
WT(1)X2=(0.7,0.8,-0.6,0)(-1,0,1.5,-0.5)T=-1.6 o2(1)=sgn(-1.6)=-1 W(2)= W(1)+η [d2- o2(1)] X2 =(0.7,0.8,-0.6,0)T+0.1[-1-(-1)](-1,0,1.5,-0.5)T
--
=(0.7,0.8,-0.6,0)T
逻辑“或”真值表
x1 0 0 1 1
x2 0 1 0 1
y 0 1 1 1
例二 用感知器实现逻辑“或”功 能
感知器结构
x1 x2

1
1

0.5 -1
y

wix1+w2x2 -T=0 x1+x2-0.5=0
思考并回答
分界线的方程是什么?
感知器结构
T Wj X 0
感知器的模型如何表示?
图示? 数学表达式?
O (o1,o2 ,...oi ,...,om )
T
前 馈 神 经 网 络 单 层 感 知 器
T
j=1,2,…,m
T W j (w1 j ,w2 j ,...w ,...,w ) ij nj
--
北京工商大学信息工程学院
3
3.1.1感知器模型
前 馈 神 经 网 络 单 层 感 知 器
净输入:
Hale Waihona Puke Baidu)T
x2
-1
oj
1 输出: oj 1
w1 j x1 w2 j x2 T j 0 w1 j x1 w2 j x2 T j 0
--
则由方程 wijx1+w2jx2-Tj=0 (3.3) 确定了二维平面上的一条分界线。
北京工商大学信息工程学院
5
(1)输入是二维
wij x1+w2j x2 – Tj = 0
13
例一
用感知器实现逻辑“与”功能
逻辑“与”真值 表
x1 0 0 1 1
x2 0 1 0 1
y 0 0 0 1
例一 能
用感知器实现逻辑“与”功
感知器结构
x1 x2
○ ○
0.5 0.5

0.75 -1
y
wix1+w2x2 -T=0 0.5x1+0.5x2-0.75=0
例二
用感知器实现逻辑“或”功能