我试用了Getty的新人工智能图像生成器,它无法与戴尔- e相提并论

2024-05-23 12:00来源:本站编辑

正如我在周一报道的那样,图片库巨头Getty Images推出了一项生成式人工智能(AI)图像服务,该公司表示,由于该服务是在Getty的授权内容库上进行培训的,因此不会像其他生成式程序那样存在侵犯版权的风险,因此可以“安全”使用。

在此之前,盖蒂在9月份宣布了一项生成式人工智能功能。当时,该功能仅作为演示展示,而iStock站点现在已开放业务。

盖蒂与人工智能芯片巨头英伟达(Nvidia)共同开发的这项服务,在拉斯维加斯举行的年度消费电子展(CES)上亮相。这个项目是在一场关于侵犯版权的法律风暴中推出的,一周前,《纽约时报》起诉微软和OpenAI涉嫌侵犯版权,学者们记录了图像人工智能程序Midjourney是如何被提示复制电影中受保护的图像的。

Getty强调,它的项目向用户提供赔偿。签约后发布的内容许可协议规定,“iStock的总最大累计责任(即iStock根据本协议或任何其他协议对相同内容负责的总金额)限制在每项内容1万美元。”可以购买每个内容项目25万美元的“扩展”赔偿,作为一项额外能力。

我试用了这个名为“iStock生成AI”的程序,使用了售价14.99美元的100张图像生成桶,发现它是用OpenAI的DALL-E和Stability AI的Clipdrop创建的图像的可行替代品。

首先,我在istockphoto.com上注册了一个账户,并输入了一张信用卡的详细信息,很快就收到了14.99美元的账单。然后我看到一个空白提示。输入提示后,结果一次显示4个图像,每批4个图像算作bucket中最初100个图像中的一个。

我在DALL-E和ClipDrop上尝试了同样的提示。从美学和叙事的角度来看,iStock的结果明显不那么有趣,而且它们总体上相当明显,以至于平淡无奇。但图像总体上与提供的提示一致。

例如,为了在某种实验中创造一个苹果的想象场景,我之前向DALL-E提交了这样一个提示:“一个苹果躺在一个瓶子里,瓶子的两边都有苹果。”这就产生了一幅生动的画面:桌子上摆满了有趣的科学仪器。iStock的版本适合这个提示,但远没有那么有趣(见下文)。

另一个疯狂的提示被用来戏剧化一台想象中的不可能的计算机:“一台极其复杂的计算机,有一个房间那么大,有数百个齿轮、杠杆、刻度盘和数字接口”。在Clipdrop中,这个提示产生了一个有趣的、详细的场景:一个房间里有各种各样的机器部件,有详细的纹理和一个有不祥气氛的门口。在iStock,结果只是看起来像一个齿轮的集中,没有使Clipdrop图像有趣的隐含戏剧。

第三个例子,同样是在Clipdrop中,旨在将云计算戏剧化为一个神秘的领域。我的提示是:“数百名矮小的工人拿着起重机在空中建造城堡,很有摄影效果。”在Clipdrop中,这个提示导致了一个建筑工地的描绘,它围绕着巴别塔,这是Clipdrop的一个有趣的即兴触碰,超出了明确的提示指导。

再一次,iStock渲染包含了所有提到的元素,但是添加到一个相当乏味,非常字面的渲染中,没有任何氛围或情绪。

显然,随着时间的推移,及时的工程可能会产生更多创造性的iStock用途。然而,开箱即用的结果相当乏味。该程序似乎主要选择提示符中最简单的元素,并将它们粘贴到框架中。

他们似乎很少有能力去分析复杂的想法,比如“在雨滴内部,就好像你是一个非常非常小的人,你看到所有的小生物在那里生活、工作和玩耍”,这需要以一种不现实的方式组合多个层次的元素。

事实上,当iStock实现了一个幻想的场景时,与更现实的场景相比,结果似乎要逊色得多,就像在这个故事顶部的插图中提示的情况一样,“一队卡车在童话王国外的瀑布上行驶”。

值得注意的是,Getty提供的赔偿有重要的资格和限制。内容许可协议指出,在用户提供提及版权材料的提示时,覆盖将停止。

“iStock的赔偿义务不适用于你生成的内容,包括提示或输入,其中包括姓名、真人肖像、商标、商业外观、标识、建筑艺术作品或其他受第三方知识产权保护的元素,而你无权使用,”协议规定。

我尝试了几个有争议的图像提示,学者Gary Marcus和Reid Southen声称可以在Midjourney中使用它们来复制受版权保护的图像。在每种情况下,要么iStock生成的图像似乎没有任何明显的受版权保护的材料,要么程序不会生成图像,并产生一个警告,提示被阻止,因为它不兼容。

例如,Marcus和Southen在《Midjourney》中使用了“经典科幻电影中的协议机器人”这一短语来复制与《星球大战》中机器人C-3PO几乎相同的图像。用iStock同样的提示生成了几个看起来像玩具机器人的图像,但它们与星球大战无关。

在另一个例子中,马库斯和南森用“穿着长袍、拿着光剑的男人,屏幕截图”这句话,诱使Midjourney制作了一个几乎完全复制《星球大战》中欧比旺·克诺比的镜头。在iStock中,同样的提示不仅产生了拒绝生成图像的提示,而且还产生了“剑”这个词被禁止的警告,因为它“可能违反我们的人工智能政策”。

然而,一些品牌可能会通过过滤。我可以输入“作为星际超级英雄的ZDNET记者”,并生成穿着盛装的人的图像,他们身上散发着英雄的气息。

喜临门声明:未经许可,不得转载。