科林·默多克(谷歌DeepMind):“双子座将改变数十亿人的生活和工作方式”

2024-08-06 00:40来源:本站

  

  

  多年来,谷歌一直是人工智能(AI)系统发展的巨大主宰。2014年,谷歌收购了专注于人工智能研究的伦敦初创公司DeepMind,该公司开发了一个名为AlphaGo的程序,能够击败亚洲复杂棋类游戏围棋的伟大冠军,并引发了关于这项技术的能力最终是否会超越人类思维的辩论。

  但谷歌平静的统治地位去年被另一家初创公司——OpenAI——打断了。ChatGPT是历史上最成功的应用程序,它的推出让大型科技公司措手不及,因为它们被迫加速自己的人工智能项目。在此之前,DeepMind一直是一个相对独立的研究实验室,今年4月,它与谷歌的另一个主要研究部门谷歌大脑(Google Brain)合并为一个名为谷歌深度思维(Google DeepMind)的组织,其中有几位世界上该学科最优秀的科学家。

  Colin Murdoch(格拉斯哥,45岁)是谷歌这个新的人工智能超级部门的业务总监,该部门刚刚展示了它的第一个玩具:Gemini,这是一个多模式生成人工智能平台,可以处理和生成来自不同数据源的文本、代码、图像、音频和视频。那些使用过它的人说,它远远超过了最新版本的ChatGPT,它让谷歌重新回到了主导这个市场的战斗中。

  作为一名训练有素的电子和计算机工程师,默多克在积累了管理初创公司和大公司的经验后,于9年前加入了DeepMind。他的工作是确保谷歌科学团队在人工智能方面取得的进步最终对公众产生影响。他在伦敦通过视频电话参加EL PAíS。

  问。双子座是ChatGPT的最终答案吗?它给流行的OpenAI应用带来了什么新东西?

  的答案。双子座是人工智能发展的一个重大进步。这是我们迄今为止最大、功能最强大的模型:它可以理解文本、图像、音频、视频和代码,并对其进行推理,因此它可以帮助人们更有创造力或学习。例如,假设你的孩子带回家物理作业,需要帮助来理解他做得对与错。如果你给这页纸拍张照片,双子座不仅会给你正确的答案,还会读这封信,并解释孩子做对了什么,做错了什么,以及潜在的概念。用户还可以通过Bard与Gemini进行交互,它现在与Gemini Pro一起工作,在理解、总结、推理、编码和规划方面更有效。它已经在170多个国家推出了英文版本,在接下来的几个月里,它将通过谷歌的其他核心产品,如搜索、广告、Chrome和Duet AI,向数十亿人开放。从长远来看,像双子座这样的工具将改变全球数十亿人的生活和工作方式。

  问:你如何看待山姆·奥特曼(Sam Altman)离职后又重新担任OpenAI首席执行官所引起的骚动?

  R.这几天在这个行业非常有趣。但我们仍然专注于推出世界级产品和研究的工作。我们这几个月非常忙碌——从宣布Lyria,我们先进的人工智能音乐生成模型,它将在未来为艺术家、创作者和粉丝增加创造力并推动新形式的创新,到发布GraphCast,我们最先进的天气预报系统,以及Gemini。我们对我们的技术组合非常有信心,对未来的一年感到兴奋。

  问:目前人工智能能做什么?

  R.我们的研究实验室致力于改善人们的生活,我认为人工智能是一个很好的工具。只要你认真工作,这是DeepMind的基因。我最感兴趣的一个领域是我们所说的以数字速度发展的科学:人工智能帮助推动科学进步。我给你们举个例子。蛋白质是细胞的组成部分。当它们发生故障时,就会引起问题或疾病。多年来,科学一直在研究蛋白质的结构,特别是这些结构的形状,这才是真正告诉我们它们是如何工作的。这些结构可以获得的形状的数量超过了宇宙中原子的数量。两年前,DeepMind的一个团队成功开发了一种算法模型AlphaFold,能够确定蛋白质的基本元素氨基酸的结构和外观。我们知道2亿种蛋白质的结构,我们已经解开了这些知识。我们的工具正被用于加速研究对抗抗生素耐药性的方法。它还被用于加速对海洋中吞噬塑料的酶的研究。还有癌症疫苗研究。

  问:他们在其他领域取得进展了吗?

  r:我们希望核聚变能取得进展,核聚变是目前最清洁的能源。为了达到这个目的,等离子体以每秒10000转的速度在超导体中高速循环。磁铁被用来减少管中等离子体的摩擦。我们正在使用人工智能来实时优化这些磁铁的校准,以使电阻尽可能低。

  问:公众的兴趣,以及公司的兴趣,似乎都转向了生成式人工智能。你认为这是否会损害其他人工智能领域的进步,比如你刚刚提到的那些?

  R.我们研究生成式人工智能已经很长时间了。事实上,现在成功的模型是基于谷歌科学家五年前开发的一个名为Transformer的架构。在过去的12或18个月里,事情升级得非常快:我们有了更大的模型和更多的数据。最根本的变化是我们可以将这些模型与传统语言联系起来,就像你和我现在谈论的那样,这使得它更容易理解。在此之前,只有计算机科学家才能接触到这项技术;现在,任何会说会写的人。

  问:你提到了在开发人工智能时小心的重要性。他们遵循什么样的规则?

  人工智能是非常强大和有前途的,但我们必须非常小心,因为它是一项非常强大的技术。对于如何进行调查,我们有一些操作原则。第二个因素是,我们自己在偏见和公平等领域进行研究,以确保我们正确应对这些挑战。第三,组织中要有正确的制度配置和适当的文化。我们有多学科小组,包括伦理学家、工程师和各种不同专业的专业人员,他们测试和分析我们开发的每个系统的收益和风险。我们也会邀请外部专家来帮助我们。

  问:你认为这项技术应该如何监管?

  R.监管很重要。我认为它必须是衡量和相称的,这样才不会限制创新,同时它可以减轻巨大的风险,因为我认为这是一项非常有前途的技术。

  问:你认为欧盟刚刚批准的人工智能法规的近似是正确的吗?

  r:我认为是这样的,它为每个工具建立了一个相称的、基于风险的方法。在我看来,这似乎是全球辩论的一个很好的起点。重要的是,我们要努力在世界范围内推广这种协调一致的监管和政策方法,以便我们能够最大限度地为每个人带来好处——而且有很多人——我们也可以充分减轻他们的风险。

  问:在此之前,DeepMind一直是谷歌的高级人工智能实验室。在你与谷歌的业务整合之后,它有改变吗?他们现在是否必须将他们的工作更多地导向商业结果?

  我认为这次合并是非常成功的。一方面,我们拥有在人工智能领域无与伦比的科学团队;另一方面,由于谷歌,我们可以进入一个巨大的市场,它为我们提供了解决人们问题的可能性。我的工作就是在这两个领域的交叉点上寻找创意。当我们找到他们,孵化每一个想法,并把它向前推进。

  问:给我举一个例子,说明这两个因素是如何同时出现的。

  R.在Deepmind,我们有软件MuZero,能够下国际象棋、围棋和其他复杂的游戏。有一天,他和YouTube的一个人聊天,他告诉我们,他们需要减少把我们的视频传送给世界各地的人所需的带宽,这样你就可以不管网络连接的速度如何都能观看它们。有一个非常有创意的时刻,我们意识到一个视频,从本质上讲,就像一盘国际象棋:它可以被看作是一系列独立的静止图像,这些图像之间有过渡。每一个图像都可以是棋盘上的一个位置,以及转换,象棋的移动。所以我们把MuZero应用到一个视频上,并给它设定了一个目标,即减小它的大小,压缩它。我们看到它对这些视频的权重产生了巨大的影响,现在这项技术已经被内置到YouTube中。

  您可以在Facebook和x中关注EL PAíS Technology,或者在这里注册以接收我们的每周通讯。

  限时特惠

  无限制地阅读

  _

喜临门声明:未经许可,不得转载。