您当前的位置: > 详细浏览

多模态古代汉语大语言模型AI九思2.0的设计与开发

请选择邀稿期刊:

The Design and Development of Multimodal Ancient Chinese Large Language Model AI Jiusi 2.0

摘要: [目的/意义] 随着生成式人工智能(AIGC)的快速发展,各类大模型由最初仅能处理单一文本模态的大语言模型,逐步升级为能够同时处理文本、图像、语音和视频等多模态数据的大语言模型。而国内面向古代汉语专业领域的大语言模型,仍主要聚焦于提升古汉语信息处理任务的性能,且以单一文本模态信息处理为主,在大语言模型的知识理解与问答交互能力,以及多模态信息处理方面,还有较大发展空间。基于此,华中科技大学全新推出了既掌握古汉语专业知识,又兼备古汉语应用能力,并支持多模态数据处理的古汉语多模态大语言模型——“AI九思2.0”,以为多模态古代汉语大语言模型的发展抛砖引玉。[方法/过程]本文详细介绍了“AI九思2.0”的数据集构建、算力升级、模型训练、界面优化情况,并展示新版本“AI九思”在古汉语语言知识和语言能力方面的表现。[结果/结论]全新升级的“AI九思2.0”在古代汉语文本理解及古代汉语知识问答领域展现出显著优势,且已经具备了一定的古文字(甲骨文、金文)图像理解能力,从而为推动古代汉语大语言模型的发展做出了应有的贡献。

版本历史

[V1] 2025-01-26 09:44:25 ChinaXiv:202501.00233V1 下载全文
点击下载全文
预览
同行评议状态
待评议
许可声明
metrics指标
  •  点击量3132
  •  下载量921
评论
分享
申请专家评阅