GPT-3改变化学研究
人工智能正在发展成为化学研究的关键工具,提供新颖的方法来应对传统方法难以应对的复杂挑战。在化学领域越来越多使用的人工智能的一种子类型是机器学习,它使用算法和统计模型根据数据做出决策并执行尚未明确编程的任务。
然而,为了做出可靠的预测,机器学习还需要大量数据,而这在化学研究中并不总是可用。小型化学数据集根本无法为这些算法提供足够的信息来进行训练,这限制了它们的有效性。
EPFLBerendSmit团队的科学家们在GPT-3等大型语言模型中找到了解决方案。这些模型经过大量文本的预先训练,并以其在理解和生成类人文本方面的广泛能力而闻名。GPT-3构成了更流行的人工智能ChatGPT的基础。
这项发表在《自然机器智能》上的研究揭示了一种利用人工智能显着简化化学分析的新方法。与最初的怀疑相反,该方法并不直接询问GPT-3化学问题。
该研究的首席研究员KevinJablonka表示:“GPT-3尚未见过大部分化学文献,因此,如果我们向ChatGPT询问一个化学问题,答案通常仅限于在维基百科上可以找到的内容。”
“相反,我们使用转换为问题和答案的小数据集对GPT-3进行微调,创建一个能够提供准确化学见解的新模型。”
此过程涉及向GPT-3提供精选的问答列表。“例如,对于高熵合金,了解合金是单相还是多相非常重要,”斯密特说。“精心策划的问答列表的类型是:Q=‘(高熵合金的名称)是单相吗?’A=‘是/否。’”
他继续说道:“在文献中,我们发现了许多已知答案的合金,我们使用这些数据来微调GPT-3。我们得到的是一个经过训练的精炼AI模型,仅回答这个问题是或否。”
在测试中,该模型经过相对较少的问答训练,正确回答了超过95%的非常多样化的化学问题,通常超过了最先进的机器学习模型的准确性。“重点是,这就像进行文献检索一样简单,这适用于许多化学问题,”斯密特说。
这项研究最引人注目的方面之一是其简单性和速度。传统的机器学习模型需要数月的时间来开发,并且需要广泛的知识。相比之下,Jablonka开发的方法只需五分钟,并且需要零知识。
这项研究的意义是深远的。它介绍了一种像文献检索一样简单的方法,适用于各种化学问题。能够提出诸如“用此(配方)制成的[化学品]的产量高吗?”之类的问题。并获得准确的答案可以彻底改变化学研究的计划和实施方式。
作者在论文中表示,“除了文献检索之外,查询基础模型(例如GPT-3,4)可能会成为利用这些基础模型中编码的集体知识来引导项目的常规方法。”或者,正如斯密特简洁地指出的那样,“这将改变我们进行化学反应的方式。”
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。