×
验证码:
换一张
忘记密码?
记住我
CORC
首页
科研机构
检索
知识图谱
申请加入
托管服务
登录
注册
在结果中检索
科研机构
自动化研究所 [92]
北京大学 [14]
计算技术研究所 [11]
深圳先进技术研究院 [8]
西安光学精密机械研究... [7]
大连理工大学 [6]
更多...
内容类型
期刊论文 [98]
会议论文 [46]
其他 [8]
学位论文 [8]
发表日期
2024 [8]
2023 [16]
2022 [12]
2021 [10]
2020 [6]
2019 [11]
更多...
学科主题
artificial... [2]
computer s... [2]
electrical... [1]
engineerin... [1]
×
知识图谱
CORC
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共160条,第1-10条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
题名升序
题名降序
发表日期升序
发表日期降序
提交时间升序
提交时间降序
GraphMLLM: A Graph-based Multi-level Layout Language-independent Model for Document Understanding
会议论文
希腊雅典, 2024-09
作者:
He-Sen Dai
;
Xiao-Hui Li
;
Fei Yin
;
Xudong Yan
;
Shuqi Mei
收藏
  |  
浏览/下载:4/0
  |  
提交时间:2024/06/05
Visual information extraction
Self-supervised pre-training
Multi-level page layouts
Fuse & Calibrate: A bi-directional Vision-Language Guided Framework for Referring Image Segmentation
会议论文
Tianjin, China, 2024/08/05
作者:
Yichen Yan
;
Xingjian He
;
Sihan Chen
;
Shichen Lu
;
Jing Liu
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/07/08
Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision
Calibration & Reconstruction: Deep Integrated Language for Referring Image Segmentation
会议论文
Phuket, Thailand, 2024/03/08
作者:
Yichen Yan
;
Xingjian He
;
Sihan Chen
;
Jing Liu
收藏
  |  
浏览/下载:1/0
  |  
提交时间:2024/07/08
Referring Image Segmentation, CLIP, Hierarchical Fusion, Computer Vision
DARTScore: DuAl-Reconstruction Transformer for Video Captioning Evaluation
期刊论文
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 2024, 卷号: 34, 期号: 4, 页码: 2041-2055
作者:
Chen, Yuxin
;
Zhang, Ziqi
;
Qi, Zhongang
;
Yuan, Chunfeng
;
Wang, Jie
收藏
  |  
浏览/下载:3/0
  |  
提交时间:2024/05/30
Chinese video captioning evaluation
dual-reconstruction transformer
AnomalyGPT: Detecting Industrial Anomalies Using Large Vision-Language Models
会议论文
VANCOUVER, CANADA, 2024-2-20至2024-2-27
作者:
Zhaopeng Gu
;
Bingke Zhu
;
Guibo Zhu
;
Yingying Chen
;
Ming Tang
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/06/06
VLP2MSA: Expanding vision-language pre-training to multimodal sentiment analysis
期刊论文
KNOWLEDGE-BASED SYSTEMS, 2024, 卷号: 283, 页码: 9
作者:
Yi, Guofeng
;
Fan, Cunhang
;
Zhu, Kang
;
Lv, Zhao
;
Liang, Shan
收藏
  |  
浏览/下载:5/0
  |  
提交时间:2024/02/22
Multimodal sentiment analysis
Vision-language
Multimodal fusion
Memory-Adaptive Vision-and-Language Navigation
期刊论文
Pattern Recognition, 2024, 卷号: 153, 页码: 110511
作者:
Keji He
;
Ya Jing
;
Yan Huang
;
Zhihe Lu
;
Dong An
收藏
  |  
浏览/下载:2/0
  |  
提交时间:2024/06/26
Vision-and-Language Navigation
Memory bank
History noises
Memory-Adaptive Model
Comprehensive Attribute Prediction Learning for Person Search by Language
期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2024, 卷号: 33, 页码: 1990-2003
作者:
Niu, Kai
;
Huang, Linjiang
;
Long, Yuzhou
;
Huang, Yan
;
Wang, Liang
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/07/03
Person search by language
cross-modal retrieval
smart video surveillance
attribute prediction
SCOOT: Self-supervised Centric Open-set Object Tracking
会议论文
Sydney, Australia, 2023-12-12-2023-12-15
作者:
Li W(李巍)
;
Meng WL(孟维亮)
;
Li BW(李博文)
;
Zhang JG(张吉光)
;
Zhang XP(张晓鹏)
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/06/03
Frequency-Enhanced Data Augmentation for Vision-and-Language Navigation
会议论文
新奥尔良, 2023-12-9 至 2023-12-15
作者:
Keji He
;
Chenyang Si
;
Zhihe Lu
;
Yan Huang
;
Liang Wang
收藏
  |  
浏览/下载:0/0
  |  
提交时间:2024/06/26
©版权所有 ©2017 CSpace - Powered by
CSpace