的论文题目。
\n
“r1:redefiningcost-performancetradeoffsinlarge-scalelanguagemodels?”
\n
旁边的同学sarah搜了一下,果然找到了这篇刚刚发布不久的文章。
\n
“这是哪个公司的成果吗?”因为作者的名单上长长一串一般只有公司的文章才会这样。
\n
“就是deepseek,之前他们不是发过一个v3版本的论文吗?当时老板还让我们看过,你不记得了?”
\n
“哦~好像有点印象,怎么,这篇r1有很大的提升吗?”他一边说着一边看向下面的摘要部分。
\n
“reinforcementlearning(强化学习)?这不是和我们现在做的方向一样吗?”不过当他看到第一张图片的时候不由得歪了歪脑袋,发出了同样的惊呼:“holy*&#$?真的假的?”
\n
图片上面显示了,其效果几乎和gpt-o1持平,而且文中写到了其推理成本的二十分之一还不到。
\n
leo苦笑着摇头“不知道,我希望是假的,但我感觉应该是真的。”
\n
搞科研最为悲伤的事情之一——你有了一个很好的idea,并且已经做了一段时间,就在快要有成果的时候,却发现人家已经做出来了,而且比自己做的更好。
\n
好消息:llm有了新的突破,坏消息:你论文白写了。
\n
“哎~没办法,我再看看吧,如果是真的,估计老板肯定会要求我们复现的。”
\n
“说的也是。”
\n
和他们一样反应还有很多人,公司的工程师们,高校的学生老师,对搞科研的人
本章未完,请点击下一页继续阅读! 第3页 / 共4页