Sam Altman刚刚提醒了大家OpenAI领先的原因

2024-06-01 10:15来源:本站编辑

  • Sam Altman再次震惊了人工智能行业。
  • 周四,OpenAI发布了其新的文本到视频模型Sora。
  • 苍井空制作高保真视频的能力震惊了互联网。

山姆·奥特曼刚刚震惊了人工智能行业。再一次。

这一次,不是因为OpenAI的突然离职,也不是因为ChatGPT。相反,这是因为一种名为Sora的全新人工智能模型。

周四,他向全世界介绍了Sora, Sora的名字来自日语,意思是“天空”,它可以用文本制作长达一分钟的视频。

本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.

OpenAI表示,它与Sora合作的目的是教会人工智能“理解和模拟运动中的物理世界,目标是训练模型,帮助人们解决需要现实世界互动的问题。”

这是描述模型实际能力的一种有点迟钝的方式。它可以制作各种高保真视频,从19世纪淘金热时期的加州到类似梦工厂制作的3D动画。它所要求的只是一个简单的文本提示。

值得一提的是,这并不是这种技术的第一个实例。

由谷歌和英伟达支持的纽约初创公司Runway有一款基于人工智能的工具,可以从文本中制作视频。meta也有类似的东西叫Emu Video。上个月,谷歌推出了名为Lumiere的文本转视频服务。

他们周围的嗡嗡声是否可以与苍井空相提并论?不完全是。

在某种程度上,这是因为奥特曼在私营公司OpenAI的领导地位使他能够自由地宣传这项技术——尽管它仍在进行危害测试。(注:苍井空的发行仅限于“红队”,他们将测试它的风险,以及选择视觉艺术家和电影制作人。)

这就是为什么他在社交媒体上宣布Sora的消息时,不仅提供了一个解释新人工智能模型的博客的超链接;它包括与他的追随者直接接触。

在X上,他接受了用户想看的由苍井空制作的视频的即时请求。

“我们想让你看看Sora能做什么,请回复你想看的视频,我们会开始制作一些!”他写道。请求如潮水般涌来。

网络名人比斯特先生向他索要了一段猴子在公园下棋的视频。还有人要求看金毛猎犬在山上的播客。首席执行官卡尔·裴要求提供威尔·史密斯吃意大利面的视频。很多人也这么做了。

Khosla Ventures的风投合伙人Nikunj Kothari强调了Altman战略的影响,并将其与谷歌在Sora发布当天通过博客分享其人工智能模型Gemini大规模更新的方式进行了对比。

他在X上说,谷歌宣布了“一些令人兴奋的事情”,通过将Gemini的“上下文窗口”——人工智能模型可以围绕目标代币处理的单词数量——扩大到100万。这是一个巨大的进步,但谷歌并没有像奥特曼那样展示出来。

“这里没有操场,我不能自己去尝试。在博客文章中有一些非常令人印象深刻的视频,但它根本不是针对我个人的,”Kothari在X上写道,同时强调奥特曼是通过接受别人的请求来“展示”苍井空的能力。

“这将极大地掩盖谷歌非常非常令人印象深刻的成就。谷歌正处于守势,需要‘分享’来再次获得关注。”Kothari说。

不过,这种炒作可能不会持续太久。

能够生成视觉效果令人印象深刻的视频的人工智能模型的发布可能会对创意产业构成新的威胁,在去年好莱坞罢工之后,创意产业已经引发了对生成式人工智能可能取代他们工作的担忧。

如果这项技术被坏人用来制作唐纳德·特朗普或乔·拜登等人的虚假视频,那么这项技术的广泛采用也可能对今年的选举造成严重破坏。

这可能也会导致人们重新要求OpenAI对其用于训练模型的数据保持透明,就像开源模型一样。

不过,就目前而言,人们对奥特曼的炒作买账。

喜临门声明:未经许可,不得转载。