翁雅馨小程序

微信扫一扫

翁雅馨

翁雅馨

植根流通业 沟通上下游

ta的内容8.7万
大图模式
评论
点赞
分享
放大字

27快报28|「馬鹿言っちゃいけないよ。こんなところ出たら俺はもっとでかい冷蔵庫を買ってゴージャスに暮すよ。こんなケチなところで四年我慢したんだぜ。こんなところで使ってたものなんて目にしたくもないさ。何でも好きなものやるよctvだろうがc魔法瓶だろうがcラジオだろうが」

2024-09-16 18:57:03
625

  40亿数据灌注国内首个古籍处理与研究开源智能工具

  “荀子”大语言模型:化繁为简 通读古今

  ◎本报记者 金 凤

  记者了解到,“荀子”是国内首个专门应用于古籍处理与研究的开源智能工具,由南京农业大学王东波教授研究团队联合古联(北京)数字传媒科技有限公司发布。它依托国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”,基于40亿字的大型混合语料数据生成。

  “数据是大模型的基础。”王东波介绍,在“荀子”的研发过程中,研究团队在人工智能通用模型的基础上,灌注了繁简体《四库全书》等20亿字的古代汉语语料和文化领域的20亿字的现代汉语语料,使“荀子”具有古籍智能标引、古籍信息抽取、诗歌生成、古籍高质量翻译、阅读理解等功能。

  “对于汉语言研究者来说,他们还可以利用‘荀子’完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等工作。”王东波举例,如果要研究《史记·陈涉世家》的人物关系,就可以用“荀子”识别这篇文章中的人物名称和关系名词,再用知识图谱的方式呈现人物关系图谱,从而提高检索、查询、研究的效率。

  王东波介绍,此次发布的“荀子”大模型中的基座模型,还可以让用户根据自己的需求对“荀子”进行微调,帮助用户开展更有针对性的研究。

  “荀子”是怎么做到化繁为简、通读古今的?“核心是‘算力充足’并且‘饱读诗书’。”王东波介绍,“荀子”的顺利问世离不开南京农业大学提供的高性能算力基础设施支持,以及研究团队长期积累的精加工语料库。

  “模型的构建受算力、场景应用等多方影响,但精准度较高的优质数据是最为关键的。”王东波表示,研究团队自2013年起,一直专注于人工精标注数据的工作。

  “比如要训练大模型自动标注《岳阳楼记》中的形容词,首先需要人工标注这篇文章中的形容词。在积累了大量的人工标注后,再让机器进行学习。”王东波说,这项“坐冷板凳”的基础标注工作,他们一做就是10年。

  “我们期待能将古籍的智能化研究与跨学科的人才培养相结合,让学生既有前瞻的科研视野,又能积累较为深厚的人文底蕴。”王东波表示,研究团队希望能让更多人接触古籍、品读古籍、传播古籍,让“故纸堆”重新焕发活力,推动中华优秀传统文化创造性转化、创新性发展,赓续中华文脉。

翁雅馨(记者 张芷勇)09月16日,不,这还不太一样,至少戴了上古王戒之后,沈浪起码还能开关能量漩涡呢。

翁雅馨(记者 冯夙元)09月16日,这十几支上古弩箭完全定格在空间,然后沈浪手一挥,这些弩箭全部坠落在地。

真的有龙之悔?究竟怎么回事?沈浪不是不在怒潮城吗?

声明: 本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。

回首页看更多汽车资讯

评论(88191)
文明上网理性发言,请遵守《搜狐我来说两句用户公约》

0/100 发表评论

《嘲讽》

沈浪道:“而这个时候来了一个人,而且还是一个女人,她帮你打开了这个上古遗迹的入口,让你们几万人都成功撤入了。所以祝红雪的血魂军上山搜索,找不到你们的人影,仿佛人间蒸发一般。”
昨天 18:57:03
三亚市
回复

《带着千年后的科技逃离太阳系》 《花田喜事:锦鲤小农女》

  • 《都市炼妖炉》

    • 《大暴君系统》

      《封神之雷震子》
    《和电竞男神相亲后》
《重生成神灵》
昨天 18:57:03
三亚市
关闭回复
0/100 发表评论
查看更多 595 条评论

评论(312)

0/100 发表评论

{{item.userObj.user_name}} {{ item.parents[0].userObj.user_name }}

{{item.userObj.user_name}}

  • {{ item.parents[0].userObj.user_name }}

    {{ item.parents[0].content }}
{{ item.content }}
0/100 发表评论
查看更多 {{commentStore.commentObj.participation_sum}} 条评论