/>\n
他做到了。
\n
他带着团队,耗时几个月,不眠不休。
\n
终于,开发出了一个全新的基于深度残差网络和注意力机制的自然语言处理模型。
\n
他给这个模型,起了一个名字。
\n
“女娲”。
\n
陆若溪走了过来。
\n
她看了一眼屏幕上的数据,眼神里也闪过一丝赞许。
\n
“很漂亮的模型。”她说,“它的语义理解能力,比市面上所有公开的模型,都要高出一个量级。”
\n
“但是……”苏-阳的眉头,又皱了起来。
\n
“它的算力消耗,太恐怖了。”
\n
他指着另一块屏幕上的监控数据。
\n
“我们调用了学校超算中心百分之三十的资源,才勉强让它完成了一次完整的训练。”
\n
“一次训练,就要烧掉几十万。这根本无法商业化。”
\n
实验室里的气氛,瞬间从狂喜,跌落到凝重。
\n
一个无法投入实际应用的模型,无论多先进都只是一个昂贵的玩具。
\n
“问题出在哪里?”陆若溪问。
\n
“cpu。”苏阳一针见血。
\n
“我们现有的计算架构,是以cpu为核心的。它擅长逻辑控制,但不擅长这种大规模的,并行的,浮点运算。”
\n
“‘女娲’模型
本章未完,请点击下一页继续阅读! 第3页 / 共6页