网站地图 - 关于我们
您的当前位置: 首页 > 科技 > 业内 正文

理光开发出高性能日语大语言模型

作者:网络 时间:2024-06-05 06:19 点击:
导读:

  新华社东京6月4日电(记者钱铮)日本理光公司日前表示,该公司利用和日本理化学研究所共同研发得到的指令数据训练理光的日语大语言模型,提高了模型的指令遵循性能。

  理光公司3日发布新闻公报说,他们用10329份指令数据对公司研发的130亿参数日语大语言模型进行了指令调优。与调优前相比,大语言模型的指令遵循性能得分从1.19分大幅提高至3.02分。

  指令调优是训练大语言模型的一个过程,主要为了缩小模型的下一个标记预测目标与用户期望的模型遵循人类指令的目标之间差距。

  理光公司说,随着老龄化和随之而来的劳动人口减少,许多企业寄希望于利用人工智能来提高生产效率,实现高附加值的劳动方法。而要将人工智能应用于实际业务,需要让大语言模型追加学习包括企业所处行业、所经营业务、以及企业固有用语等在内的大量数据。

  相比英语国家围绕大语言模型研发的竞争,日语大语言模型的研发相对滞后。这主要是因为日语的语法和表达与英语完全不同,以英语为基础的模型难以充分发挥功能,而研发适合日语的模型首先必须花时间研究日语的特征。

  大语言模型的研发还需要大量数据,而日语的数据远少于英语,品质和多样性方面也存在问题,日语数据的收集和完善需要大量时间和成本。大语言模型研发还需要很高的算力,而日本超算和云等计算资源原本就不足,能运用这些计算资源的技术和人才也不足。

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

相关推荐:

网友评论:

推荐使用友言、多说、畅言(需备案后使用)等社会化评论插件

栏目分类
Copyright © 2021 早报网 版权所有

苏ICP备19042297号-4
本网站所刊载信息,不代表早报网观点。如您发现内容涉嫌侵权违法立即与我们联系客服 106291126@qq.com 对其相关内容进行删除。
早报网登载文章只用于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
《早报网》官方网站:www.zhgzbw.cn互联网违法和不良信息举报中心
Top