多模态古代汉语大语言模型AI九思2.0的设计与开发
The Design and Development of Multimodal Ancient Chinese Large Language Model AI Jiusi 2.0
摘要: [目的/意义] 随着生成式人工智能(AIGC)的快速发展,各类大模型由最初仅能处理单一文本模态的大语言模型,逐步升级为能够同时处理文本、图像、语音和视频等多模态数据的大语言模型。而国内面向古代汉语专业领域的大语言模型,仍主要聚焦于提升古汉语信息处理任务的性能,且以单一文本模态信息处理为主,在大语言模型的知识理解与问答交互能力,以及多模态信息处理方面,还有较大发展空间。基于此,华中科技大学全新推出了既掌握古汉语专业知识,又兼备古汉语应用能力,并支持多模态数据处理的古汉语多模态大语言模型——“AI九思2.0”,以为多模态古代汉语大语言模型的发展抛砖引玉。[方法/过程]本文详细介绍了“AI九思2.0”的数据集构建、算力升级、模型训练、界面优化情况,并展示新版本“AI九思”在古汉语语言知识和语言能力方面的表现。[结果/结论]全新升级的“AI九思2.0”在古代汉语文本理解及古代汉语知识问答领域展现出显著优势,且已经具备了一定的古文字(甲骨文、金文)图像理解能力,从而为推动古代汉语大语言模型的发展做出了应有的贡献。
-
来自:
刘根辉
-
分类:
图书馆学、情报学
>>
情报学
语言学及应用语言学
>>
语言学及应用语言学
-
投稿状态:
未投稿
-
引用:
ChinaXiv:202501.00233
(或此版本
ChinaXiv:202501.00233V1)
DOI:10.12074/202501.00233
CSTR:32003.36.ChinaXiv.202501.00233
-
科创链TXID:
509719c0-a1bb-4e80-b839-6ac0f7f097b3
- 推荐引用方式:
刘根辉,刘金柱,王锦绣,罗捷春,李志芳,袁方,余静静,龚丹,谢雨霏,罗婉滢,郑苏楠,陈旷心,贺心雨,张润哲,夏婉婷,谢佳延,吕佳源,吕萍,余乐妍,郑诗铭,王金柳,刘艺溶,杨纯,张曼丽,吴翊嘉,余锁湘,汪靓.多模态古代汉语大语言模型AI九思2.0的设计与开发.语音乐律预印本平台.[DOI:10.12074/202501.00233]
(点此复制)
版本历史
[V1] |
2025-01-26 09:44:25 |
ChinaXiv:202501.00233V1
|
下载全文 |