基于全局交互的图像语义理解方法 | |
库涛3,4; 熊艳彬1,3,4; 杨楠1,3,4; 林乐新3,4; 朱珠2 | |
刊名 | 控制与决策 |
2020 | |
卷号 | 35期号:9页码:2013-2111 |
关键词 | 卷积神经网络 循环神经网络 图像语义理解 全局交互机制 数据正则化 门控循环单元GRU |
ISSN号 | 1001-0920 |
其他题名 | Image Semantic Understanding Method Based on Global Interaction |
产权排序 | 1 |
英文摘要 | 本文针对图像语义生成过程中图像信息易模糊的问题,研究了基于全局交互的图像语义理解方法。提出了基于双向门控循环单元(Gated Recurrent Unit,GRU)和图像信息全局交互相结合的图像语义生成模型,并在模型中提出了将图像和文本数据进行正则化处理以及采用文本向量映射表示文本信息的方法用于指导语义生成。实验结果表明,所提出的模型提高了图像语义描述的内容丰富度、准确性和逻辑性;将数据正则化处理、采用文本向量映射方式可以较大程度的解决数据稀疏和偏态问题;采用GUR单元可以进一步降低模型参数规模加快算法收敛速度,结合正则化及Dropout率可以有效抑制模型过拟合。 |
语种 | 中文 |
CSCD记录号 | CSCD:6815694 |
资助机构 | 国家重点研发计划(2017YFB0306401) ; 国家自然科学基金(61803367) |
内容类型 | 期刊论文 |
源URL | [http://ir.sia.cn/handle/173321/25452] |
专题 | 沈阳自动化研究所_数字工厂研究室 |
通讯作者 | 库涛 |
作者单位 | 1.中国科学院大学 2.辽宁大学 3.中国科学院沈阳自动化研究所 4.中国科学院机器人与智能制造创新研究院 |
推荐引用方式 GB/T 7714 | 库涛,熊艳彬,杨楠,等. 基于全局交互的图像语义理解方法[J]. 控制与决策,2020,35(9):2013-2111. |
APA | 库涛,熊艳彬,杨楠,林乐新,&朱珠.(2020).基于全局交互的图像语义理解方法.控制与决策,35(9),2013-2111. |
MLA | 库涛,et al."基于全局交互的图像语义理解方法".控制与决策 35.9(2020):2013-2111. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论