裁员后,我成了科技教父
首页

第110章 OpenAI最近有点儿跳,得限制一下!

数据,造成模型被污染,进而产生一些低级错误。

而现在有了小沙,这项工作可以更快速的进行,准确率甚至不比人工清洗差。

而更关键的一个问题,以往pt类的模型,是lhf,也就是基于人类反馈的强化学习。

怎么做的呢:就是先预训练一个语言模型,然后做微调。

微调怎么调呢:就是你问一个问题,语言模型给你回答,然后人工给这些回答进行排名,然后获得一个有质量排序的数据集,用这个数据集反过来再去微调相关的模型参数,一遍又一遍循环往复,然后答案就会越来越接近人想要的。

而现在,小沙代替了人工的这个步骤。

lhf模型先前被认为不可能无限提高,其中最重要的一个原因就是,随着参数越来越多,数据量越来越大,人工去获取一个有质量排序的数据集也变得越来越不可能。

于是有人就认为,自我反馈模型,也就是让模型自我去评价去提升的模型才是未来,纵然它有时候显得很弱智。

但是现在,有了小沙,小沙替代【基于人类反馈的强化学习】里边的人类,变成了【基于小沙反馈的强化学习】,这一切就又变得可能了!

不仅解决了自我反馈容易弱智的问题,同时解决了人工反馈效率过低、成本过高的问题。

这就相当于将两个模型的优点直接结合了。

而且,超大规模超超大规模,也不用担心人工的问题了。

所以,各家的模型现在进步都非常大,原因就在于此。

想要变得跟小沙一样厉害,那当然不可能——基于小沙训练的ai想超过小沙那本身就是一个悖论。

但是,只要舍

本章未完,请点击下一页继续阅读! 第2页 / 共5页

相关小说

1979黄金时代 都市 /
1979黄金时代
睡觉会变白
1979黄金时代笔趣阁最新章节由网友提供,《1979黄金时代》情节跌宕起伏、扣人心弦,...
3838395字02-12
提前登陆五百年,我靠挖宝成神 都市 /
提前登陆五百年,我靠挖宝成神
最终永恒
超自然时代降临,规则变化,神秘到来,世界变迁。无数文明遗迹浮现于世,海量天材地宝...
3985816字02-12
女钳工[六零] 都市 /
女钳工[六零]
渝跃鸢飞
女钳工[六零]是渝跃鸢飞的经典都市小说类作品,女钳工[六零]主要讲述了:他们受崇敬...
298579字05-03
重生从1993开始 都市 /
重生从1993开始
月阳之涯
重生从1993开始笔趣阁最新章节由网友提供,《重生从1993开始》情节跌宕起伏、扣人心...
4534671字05-02
观南(父女,1v1) 都市 /
观南(父女,1v1)
余戳
烈火中文网提供观南(父女,1v1)全集及全本免费在线阅读,无弹窗广告全文阅读,界面...
66170字01-01
回到过去做财阀 都市 /
回到过去做财阀
小鱼的命运
《回到过去做财阀》这是一个大洗牌的时代,旧霸主已经退位,新霸主尚未上位!这是一...
8746771字05-02