Apple联合中国和法国研究团队,针对现有大语言模型(LLM)在非英语语言生成中的不自然表现展开研究。传统LLM多以英语为基础,即使是多语言模型,也常表现出“英式思维”,导致在中文、法语等语言中的词汇和语法使用不够自然。
研究团队通过分析多语言维基百科文章,验证了模型在词汇和句法上的偏差。随后,他们通过改进训练方法,让模型在“问题-处理-思考-回答”全流程中使用目标语言思维,减少翻译依赖。结果显示,改进后的模型在词汇选择和语法结构上更贴近母语习惯,同时保持了标准测试中的整体性能。
Apple ML Research
📮投稿 ☘️频道 🐶618红包
👏 161 👍 36 👎 11 ❤️ 10 🤷♂ 6 💊 6 👀 5 😁 2