将人工智能交到需要解决问题的人们手中

导读 在白宫活动的前一天,迪纳卡花了几个小时试图制作一个可以识别Twitter上相关帖子的工作演示。晚上11点左右,他打电话给琼斯说他要放弃。然...

在白宫活动的前一天,迪纳卡花了几个小时试图制作一个可以识别Twitter上相关帖子的工作演示。晚上11点左右,他打电话给琼斯说他要放弃。

然后琼斯决定查看数据。事实证明,迪纳卡的模型标记了正确的帖子类型,但海报使用了迪纳卡没有注意到的青少年俚语和其他间接语言。问题不在于模型,而在于迪纳卡和他试图帮助的青少年之间的脱节。

“就在我们到达白宫之前,我们意识到构建这些模型的人不应该只是机器学习工程师,”迪纳卡说。“他们应该是最了解数据的人。”

这一见解促使研究人员开发了点击式工具,允许非专家构建机器学习模型。这些工具成为了Pienso的基础,如今,Pienso正在帮助人们构建大型语言模型,用于检测错误信息、人口贩运、武器销售等,而无需编写任何代码。

“这类应用对我们来说很重要,因为我们的根源在于网络欺凌,并了解如何使用人工智能来真正帮助人类,”琼斯说。

至于白宫展示的系统的早期版本,创始人最终与马萨诸塞州剑桥附近学校的学生合作,让他们训练模型。

“这些孩子训练的模型比我能想到的任何模型都要好得多,而且细致入微,”迪纳卡说。“比拉戈和我大吃一惊,‘啊哈!’在那一刻,我们意识到赋予领域专家权力——这与人工智能的民主化不同——是最好的前进道路。”

一个有目的的项目

琼斯和迪纳卡是麻省理工学院媒体实验室软件代理研究组的研究生时相识的。他们对后来的Pienso的研究从课程6.864(自然语言处理)开始,一直持续到他们在2012年获得硕士学位。

事实证明,2010年并不是创始人最后一次受邀到白宫演示他们的项目。这项工作引起了很大的热情,但创始人在Pienso上兼职工作,直到2016年Dinakar在麻省理工学院完成了博士学位,深度学习开始大受欢迎。

“我们仍然与校园里的许多人保持联系,”迪纳卡说。“我们在麻省理工学院的经历,人机界面的融合,拓宽了我们的理解。如果没有麻省理工学院校园的活力,我们在Pienso的理念就不可能实现。”

创始人还感谢麻省理工学院的工业联络计划(ILP)和创业加速器(STEX)将他们与早期合作伙伴联系起来。

SkyUK是早期的合作伙伴之一。该公司的客户成功团队使用Pienso构建模型来了解客户最常见的问题。如今,这些模型每天帮助处理50万个客户电话,创始人表示,通过缩短公司呼叫中心的通话时间,迄今为止,他们已为公司节省了超过700万英镑。

“人工智能民主化和用人工智能赋予人们权力之间的区别取决于谁最了解数据——你、医生、记者还是每天与客户打交道的人?”琼斯说。“这些人应该创建模型。这就是您从数据中获取洞察的方式。”

2020年,正当Covid-19在美国爆发时,政府官员联系了创始人,希望使用他们的工具更好地了解这种新出现的疾病。皮恩索帮助病毒学和传染病专家建立机器学习模型来挖掘数千篇有关冠状病毒的研究文章。迪纳卡说,他们后来了解到这项工作帮助政府确定和加强了关键的药物供应链,包括流行的抗病毒药物瑞德西韦。

“这些化合物是由一个不了解深度学习但能够使用我们平台的团队提出的,”迪纳卡说。

构建更美好的人工智能未来

由于Pienso可以在内部服务器和云基础设施上运行,创始人表示,它为被迫使用其他人工智能公司提供的服务来捐赠数据的企业提供了另一种选择。

“Pienso界面是一系列缝合在一起的网络应用程序,”Dinakar解释道。“你可以把它想象成用于大型语言模型的Adob​​ePhotoshop,但是是在网络中。您无需编写一行代码即可指向并导入数据。您可以细化数据,为深度学习做好准备,对其进行分析,如果没有标记或注释,则为其提供结构,然后您可以在25分钟内获得经过微调的大型语言模型。”

今年早些时候,Pienso宣布与GraphCore合作,后者为机器学习提供更快、更高效的计算平台。创始人表示,此次合作将通过大幅减少延迟来进一步降低利用人工智能的障碍。

“如果你正在构建一个交互式人工智能平台,用户不会在每次点击按钮时都喝一杯咖啡,”迪纳卡说。“它需要快速且反应灵敏。”

创始人相信,他们的解决方案正在推动未来,由最熟悉他们要解决的问题的人为特定用例开发更有效的人工智能模型。

“没有一个模型可以包揽一切,”迪纳卡说。“每个人的应用程序都不同,他们的需求不同,他们的数据也不同。一种模型不太可能满足您的所有需求。它是将模型花园整合在一起,让它们相互协作,并以一种有意义的方式编排它们——而进行编排的人应该是最了解数据的人。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。