图像描述技术方法研究

时间:2023-03-06 21:40:53
作者:陈耀传,2,奚雪峰,2*,崔志明,2,盛胜利,2
关键字:图像描述,图像处理,文本生成,机器学习,多模态任务
DOI:10.3969/j.issn.1673-629X.2023.04.002
查看次数:285

如需要完整文档点击下方 "点击下载文档" 按钮

图像描述是人工智能领域中的多模态研究任务,融合了计算机视觉技术与自然语言处理技术,在人机交互和智能家居等领域具有广泛的应用。 然而图像与文本之间存在较大的语义鸿沟,生成语义丰富的图像描述是一项具有挑战性的任务。 文章旨在对图像描述技术进行总结研究,首先,文章简要地概述了图像描述任务的定义和发展历程。 其次,文章分析了图像描述任务发展过程中出现的经典方法与模型,包括模板填充的方法、检索的方法和深度学习的方法;其中,基于深度学习的方法有:基于注意力机制的方法、基于对抗生成网络的方法和基于强化学习的方法,并对这些基于深度学习的图像描述方法在不同数据集上的实验结果进行了比较分析。 另外,文章介绍了图像描述任务的相关数据集和评价指标。最后,文章展望了图像描述任务的未来工作。

如需要完整文档点击下方 "点击下载文档" 按钮

图像描述技术方法研究
《图像描述技术方法研究》
完整文档 下载到本地,方便收藏和查阅
文件号:057934
图像描述技术方法研究
点击下载文档
图像描述技术方法研究

点击下载 文件号:057934(点击复制) 公众号(点击复制)

x