科技入侵现代最新章节 - 鸦的碎碎念 - 格格党
首页

第291章 联合登月前(求月

发生什麽。」

林燃随后又振奋道:「不过还好,我和华为那边沟通过,对我们而言,他们的晶片已经够用了。

因为根据元素特性推导材料性质,这类模型的数据量很稀疏,数据丶算力和算法三要素里,对数据和算法的依赖远高于算力。」

Pony对人工智慧也颇为了解,腾讯每年从ai领域挖来的大牛不计其数,哪怕此时ChatGPT还没有横空出世,他希望从林燃这了解更多信息,好为后续开展工作提供方向:「林生,你仔细说说。」

林燃进一步解释道:「这是因为材料科学领域的数据非常非常有限,数据共享也好获取也好都面临着空前的障碍。

不同实验室产出的实验数据除非刊登到论文里,不然各家的数据是不会进同一个池子,当然他们想要进同一个池子,也会有各种各样的担心。

因为你很难保证,所有研究机构提供的数据不会污染资料库。

有人数据造假,就会污染整个数据源。

目前就我了解到的情况,类似研究数据非常稀缺,最多的数据也要少于4000个样本。

特徵工程是AI模型成功的关键,但其设计在材料属性预测中尤为复杂。

物理元素性质,像原子量丶电负性这些和材料结构,像晶格类型丶键长这些,都要转化为数值特徵,提供给模型学习。

其中特徵选择直接影响模型准确性,错误选择可能导致性能下降。

目前整个过程仍然需要依赖研究人员去手动处理特徵值,去做筛查。

非常依赖研究者经验和直觉,极可能遗漏重要信息。

nature去年的子刊他们整出了一个MODNet的学习框架,就是一个材料属性预测的机器学习框架。

(《通过特徵选择和MODNet的联合学习实现有限数据集的材料属性预测》于2021年6月3日刊登在Nature子刊NPJ上)

他们发现要预测材料的振动熵时,反向键长和p价电子是关键特徵,但手动识别这些特徵需深厚领域知识。

这些数据的提取需要有足够丰富经验的科研民工来做,同时还要确保数据的精确,降低误差,整个过程非常繁琐。

因为我们要做的东西远比他们更复杂,我们要做的是一个更大的,更复杂的模型,特徵数据的归纳总结和收集,速度肯定很慢。

毕竟这件事无法像网络空间的数据那样,可以通过特徵值剔除,各种

本章未完,请点击下一页继续阅读! 第2页 / 共7页

相关小说

神明调查报告 网游 /
神明调查报告
黑山老鬼
神明调查报告是黑山老鬼的经典科幻小说类作品,神明调查报告主要讲述了:一场来自过...
639117字09-17
维校的三好学生 网游 /
维校的三好学生
核动力战列舰
维校的三好学生是核动力战列舰的经典科幻小说类作品,维校的三好学生主要讲述了:宣...
531909字09-14
科研系学霸 网游 /
科研系学霸
我是躺赢狗
科研系学霸是我是躺赢狗的经典科幻小说类作品,科研系学霸主要讲述了:经过三年读研...
414024字09-17
模拟器?不!是分身流 网游 /
模拟器?不!是分身流
洛月幻华
《模拟器?不!是分身流》看起来像是模拟器的金手指,实际上居然是分身流?林天赐分...
2188349字07-13
黄泉逆行 网游 /
黄泉逆行
踏浪寻舟
黄泉逆行笔趣阁最新章节由网友提供,《黄泉逆行》情节跌宕起伏、扣人心弦,是一本情...
5635462字08-22