新华社东京6月4日电(记者钱铮)日本理光公司日前表示,该公司利用和日本理化学研究所共同研发得到的指令数据训练理光的日语大语言模型,提高了模型的指令遵循性能。 理光公司3日发布新闻公报说,他们用10329份指令数据对公司研发的130亿参数日语大语言模型进行了指令调优。与调优前相比,大语言模型的指令遵循性能得分从1.19分大幅提高至3.02分。 指令调优是训练大语言模型的一个过程,主要为了缩小模型的下一个标记预测目标与用户期望的模型遵循人类指令的目标之间差距。 理光公司说,随着老龄化和随之而来的劳动人口减少,许多企业寄希望于利用人工智能来提高生产效率,实现高附加值的劳动方法。而要将人工智能应用于实际业务,需要让大语言模型追加学习包括企业所处行业、所经营业务、以及企业固有用语等在内的大量数据。 相比英语国家围绕大语言模型研发的竞争,日语大语言模型的研发相对滞后。这主要是因为日语的语法和表达与英语完全不同,以英语为基础的模型难以充分发挥功能,而研发适合日语的模型首先必须花时间研究日语的特征。 大语言模型的研发还需要大量数据,而日语的数据远少于英语,品质和多样性方面也存在问题,日语数据的收集和完善需要大量时间和成本。大语言模型研发还需要很高的算力,而日本超算和云等计算资源原本就不足,能运用这些计算资源的技术和人才也不足。 |
理光开发出高性能日语大语言模型
新闻录入:贯通日本语 责任编辑:贯通日本语
相关文章
2025年“国际中文日”活动在日本举行
外交部:敦促日方加快日遗化武处理进程,早日还中国人民以安全和净土
北京动物园:“萌兰代表中国参加2025日本大阪世博会”等均为虚假信息
日本米价再创新高 多地出现“半价米”骗局
日本经济面临“金利时代”挑战
“犬笛”言论引发自杀事件
日本公取委调查日本棒球机构
日本NHK连续三年预算赤字
日本政府预测2025年经济增长1.2%
东京海上日动将全面停止员工派遣至代理店
东京股市日经指数大幅下跌
秋篠宫夫妇将正式访问土耳其
日本介护业倒闭数创历史新高
日本百岁及以上老人连续54年创新高
実写版『スッキリ』、原作と主人公が違うと話題
鈴木亮平、クロール苦手も犬かき得意
共演者が振り返る 中山美穂との思い出
木村沙織、ライラック色ワンピース姿を披露
滝沢ななえ、22歳で本当の自分に気づく
渡邊渚、激動の日々を乗り越えエッセイ再開
芸人カップル、彼氏の浮気発覚で彼女涙
大地真央、12歳年下夫と全身ショットが話題
吉田沙保里、ハーレーにまたがる「免許ないけど」
渡邊渚、体育座りショットにいいね7000件
萩原利久、神尾楓珠とオーディションで出会う










