CNN RNN相同点:
传统神经网络扩展
前向计算产生结果,反向计算更新模型
每层神经网络横向可以多个神经元共存,纵向可以有多个神经网络连接
不同点:

组合
同时利用时间(RNN)和空间特征(CNN)
组合方式
CNN特征提取,用RNN语句生成->图片标注?????
RNN特征提取用于cNN内容分类->视频分类???
CNN特征用于对话问答->图片问答
组合方式实现

图片标注
问题描述:拥有大量图片以及标注信息,能否通过学习建立一个图片标注的模型


每个时刻都要加入FC特征v
数据准备
图片CNN特征提取
图片标注生成WOrd2vec向量
生成训练数据:图片特征+第n单词向量:第n+1单词向量

模型训练

图片标注模型运行
CNN特征提取
CNN特征+语句开头,单词逐个预测???????
图片标注升级-详细标注
DenseCap???
视频行为识别



RNN进行关键帧提取???????
视频目标检测


图片/视频问答 Visual Question-Answering
图片问答意义:
对纯文本语言问答系统的扩展
图片理解和语言处理的深度融合
提高人工智能应用范围-观察,思考,表达

纯文字问答系统
