苹果用一款新的图像编辑工具展示了它的人工智能技术

2024-07-17 12:08来源:大智报

虽然谷歌(Google)、meta和亚马逊(Amazon)等无数科技公司都加入了生成式人工智能的潮流,并在其他领域推动人工智能的发展,但苹果(Apple)采取了更为低调的做法。

虽然这不是一个面向消费者的版本,但苹果公司推出了一款新的图像编辑模型,可以在几秒钟内处理复杂的任务。我们要注意的是,这只是一个演示和一个开源模型,但很容易看到它如何在未来的某个时候集成到iPhone, iPad或Mac上的照片或相机应用程序中。

与其他图片编辑器不同,你必须从工具中选择然后进行调整,这里的目标是说或写一些东西,然后很快看到想要的效果。新的MGIE或用于引导图像编辑的多模态大型语言学习模型允许您输入一些内容并生成结果。

随附论文中的一个例子是一张披萨的照片,并要求“让它更健康”。结果是蔬菜被添加到配料中。类似地,您可以使用MGIE来调整图像的一部分,例如从背景中删除一个人或更改网页上显示的内容。后一种编辑可以在ps等照片编辑应用程序中手动完成,并且可以与其他一些生成式人工智能模型相媲美。另一个例子更类似于照片编辑工具,比如调整亮度或对比度。

除了这篇论文,GitHub上还发布了一个开源模型,你可以在其中自己演示MGIE,尽管它不是最终的。苹果没有具体说明何时或是否会出现这种情况,但它确实在幕后展示了苹果的一些人工智能和生成式人工智能工作。VentureBeat对此进行了更多的分析,你可以在这里看到。

这家科技巨头一直对新产品、软件和服务采取更隐秘的方式,在认为时机成熟的情况下,不会展示或发布这些产品。在苹果最近的财报电话会议上,首席执行官蒂姆·库克暗示了更多关于人工智能的信息,他说:“我们已经有了一些让我们非常兴奋的东西,我们将在今年晚些时候讨论。”

就我个人而言,我可以想象其中一些工具会被内置到iPhone、iPad、Mac甚至Vision Pro等设备上的照片应用程序中。当然,你可以在编辑照片时使用它们,但考虑到自然语言的实现,你甚至可以让Siri做出改变。

无论是哪一种方式,只要其中的一些使其成为一个全面的发布,苹果可能会以一种超级简单的方式直接与Photoshop等软件竞争,从而更快地完成工作。

喜临门声明:未经许可,不得转载。