图像和语音的跨模态检索分类器模型、检索系统和检索方法
袁媛; 卢孝强; 郭毛
2019-02-21
著作权人中国科学院西安光学精密机械研究所
专利号CN201910131147.7
国家中国
文献子类发明专利
产权排序1
英文摘要为解决现有图像检索方法检索效率低、可能会丢失一些有用或重要的细节信息、不能很好满足用户真正检索需求的技术问题,本发明提供了一种图像和语音的跨模态检索分类器模型、检索系统和检索方法。本发明构建了一个图像‑语音神经网络结构,利用图像及其语音描述之间的相关性作为监督信息,对深度神经网络进行训练,得到图像和语音关联关系的函数模型,从而实现图像和语音的跨模态检索,提高了图像检索效率和检索准确率,使检索过程中的人机交互变得更容易。
公开日期2019-07-05
申请日期2019-02-21
语种中文
状态申请中
内容类型专利
源URL[http://ir.opt.ac.cn/handle/181661/93850]  
专题西安光学精密机械研究所_光学影像学习与分析中心
推荐引用方式
GB/T 7714
袁媛,卢孝强,郭毛. 图像和语音的跨模态检索分类器模型、检索系统和检索方法. CN201910131147.7. 2019-02-21.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace