新浪科技讯 3月25日上午消息,杨植研究今日举办的模型2026中关村论坛年会上,月之暗面Kimi创始人杨植麟分享指出,训练大模型训练正进入第三个阶段——AI主导研究。正进主导
杨植麟指出,入第三年之前,个阶大模型训练更多地是杨植研究使用从整个互联网获取的天然数据,加上一些少量的模型人工标注数据是否符合你的价值观或者偏好。到去年,训练大家更加重视大规模的正进主导强化学习系统,在这里面人会去精选一些高质量的入第任务,但是个阶这些任务还是由人来确定,然后通过在这些任务上做强化学习,杨植研究得到更好的模型效果。
“但是训练从今年到明年以及接下来的若干年,整个AI研究和研发的方式会发生重大的变化,会有更多的是AI去主导这个研究,每个研究员会配备非常多的AI的Token,由Token帮你去合成新的任务和环境,去帮你定义在这个环境下面到底什么样是最好最合适的奖励参数,甚至帮你探索新的网络架构。”杨植麟表示。
在他看来,在这样的前提下,整个AI的研发也会逐渐加速,月之暗面希望能跟整个开源社区一起去不断地把智能技术往前推进,打造一个更好的生态系统。(文猛)
海量资讯、精准解读,尽在新浪财经APP 责任编辑:常福强