图像和语音的跨模态检索分类器模型、检索系统和检索方法 | |
袁媛; 卢孝强; 郭毛 | |
2019-02-21 | |
著作权人 | 中国科学院西安光学精密机械研究所 |
专利号 | CN201910131147.7 |
国家 | 中国 |
文献子类 | 发明专利 |
产权排序 | 1 |
英文摘要 | 为解决现有图像检索方法检索效率低、可能会丢失一些有用或重要的细节信息、不能很好满足用户真正检索需求的技术问题,本发明提供了一种图像和语音的跨模态检索分类器模型、检索系统和检索方法。本发明构建了一个图像‑语音神经网络结构,利用图像及其语音描述之间的相关性作为监督信息,对深度神经网络进行训练,得到图像和语音关联关系的函数模型,从而实现图像和语音的跨模态检索,提高了图像检索效率和检索准确率,使检索过程中的人机交互变得更容易。 |
公开日期 | 2019-07-05 |
申请日期 | 2019-02-21 |
语种 | 中文 |
状态 | 申请中 |
内容类型 | 专利 |
源URL | [http://ir.opt.ac.cn/handle/181661/93850] ![]() |
专题 | 西安光学精密机械研究所_光学影像学习与分析中心 |
推荐引用方式 GB/T 7714 | 袁媛,卢孝强,郭毛. 图像和语音的跨模态检索分类器模型、检索系统和检索方法. CN201910131147.7. 2019-02-21. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论