1、RNN产生原因
一些数据前后有关联,且关联的长度不确定,需要根据数据前后关系进行预测。比如视频每一帧与之前与之后的关联,要分析这些帧连接起来的整个序列。
2、几种神经网络
(1)基本循环神经网络
考虑例子:
我 昨天 上学 迟到 了 ,老师 批评 了 ____。
分为如下几步:
1、通过one-hot编码将数据向量化变为对应的数字序列
2、根据如下神经网络进行预测后面的数据
通过公式:
计算St与Ot
(1)首先随机初始化一个W作为向后传递的初始值
(2)然后通过输入的x向量与权重矩阵U做乘积映射成隐藏层,这个过程类似于全连接矩阵映射,比如x向量是1维的,设置的隐藏层节点个数是16,则矩阵规格是(1*16)。与全连接矩阵不同的是,在此还要加上W矩阵与上一次的隐藏层相乘的值,即将本次结果与上一次的结果建立联系
(3)通过隐藏层与输出层矩阵相乘,然后经过一个激活函数(例如softmax函数)得到本次输入的结果,将结果与预期值进行比较,然后使用梯度下降法更新U和W矩阵,直到误差最小