巴西滥用儿童照片为人工智能工具提供动力

2024-08-04 05:55来源:本站

  

  人权观察今天表示,巴西儿童的个人照片在儿童不知情或未经其同意的情况下被用于制造强大的人工智能(AI)工具。这些照片被从网上抓取到一个大型数据集,然后公司用它来训练他们的人工智能工具。反过来,其他人正在使用这些工具制作恶意深度伪造,使更多儿童面临被剥削和伤害的风险。

  人权观察(Human rights Watch)的儿童权利和技术研究员、倡导者韩慧贞(Hye Jung Han)表示:“儿童不应该生活在担心自己的照片可能被窃取并被用作武器的恐惧中。”“政府应该紧急采取政策,保护儿童数据免受人工智能引发的滥用。”

  人权观察(Human Rights Watch)的分析发现,用于训练流行人工智能工具的数据集LAION-5B包含巴西儿童可识别照片的链接,该数据集是通过抓取大部分互联网构建的。有些孩子的名字列在随附的标题或存储图像的URL中。在许多情况下,他们的身份很容易追踪,包括拍摄照片时孩子在何时何地的信息。

  其中一张照片是一个两岁的小女孩,她的嘴唇惊奇地张开,抚摸着她刚出生的妹妹的小手指。照片中的文字说明和信息不仅显示了两个孩子的名字,还显示了9年前一个冬天的下午,孩子在圣卡塔琳娜出生的那家医院的名称和确切位置。

  人权观察发现170张儿童的照片,来自至少10个州:阿拉戈斯州、巴伊亚州、塞埃尔

  、南马托格罗索州、米纳斯吉拉斯州、帕拉纳

  、里约热内卢、南里奥格兰德州、圣卡塔琳娜州和

  圣保罗州。这很可能是对LAION-5B中存在的儿童个人数据总量的严重低估,因为人权观察审查了数据集中包含的58.5亿张图像和说明文字中的不到0.0001%。

  这些照片涵盖了整个童年时期。他们捕捉到了医生戴着手套接生婴儿的亲密时刻,小孩子在家里吹灭生日蛋糕上的蜡烛或穿着内衣跳舞,学生在学校做演讲,青少年在高中嘉年华上摆姿势拍照。

  其中许多照片最初很少有人看到,似乎之前有一定程度的隐私。它们似乎不可能通过在线搜索找到。其中一些照片是由孩子、他们的父母或他们的家人在个人博客、照片和视频分享网站上发布的。有些是在LAION-5B创建前几年甚至十年前上传的。

  一旦他们的数据被收集并输入人工智能系统,由于技术缺陷,这些孩子的隐私将面临进一步的威胁。人工智能模型,包括那些在LAION-5B上训练的模型,因泄露私人信息而臭名昭著;他们可以复制训练材料的相同副本,包括医疗记录和真人的照片。一些公司为防止敏感数据泄露而设置的护栏一再被破坏。

  这些隐私风险为进一步的伤害铺平了道路。对真实儿童的照片进行训练,使人工智能模型能够根据少量照片甚至单张图像创建令人信服的任何儿童克隆。恶意行为者使用laion训练的人工智能工具,使用无害的照片生成儿童的露骨图像,以及将性虐待图像刮入LAION-5B的儿童幸存者的露骨图像。

  同样,LAION-5B中巴西儿童的存在有助于在该数据集上训练的人工智能模型产生巴西儿童的逼真图像的能力。这大大增加了儿童面临的现有风险,即有人会从他们发布在网上的照片或视频中窃取他们的肖像,并使用人工智能操纵他们说或做他们从未说过或做过的事情。

  来自阿拉戈斯州、米纳斯吉拉斯州、伯南布哥州、里约热内卢、南里奥格兰德州和

  圣保罗州的至少85名女孩报告说,她们的同学利用人工智能工具,根据这些女孩在社交媒体上的个人资料拍摄的照片,对她们进行了深度的色情模仿,然后在网上传播这些假照片。

  捏造的媒体一直存在,但它们需要时间、资源和专业知识来创造,而且在很大程度上不太现实。今天的人工智能工具在几秒钟内就能创造出逼真的输出,通常是免费的,而且很容易使用,冒着未经同意的深度伪造扩散的风险,这些深度伪造可能会在网上流传一辈子,并造成持久的伤害。

  作为回应,负责管理LAION- 5b的德国非营利组织LAION证实,该数据集包含人权观察发现的儿童个人照片,并承诺删除这些照片。该公司对在LAION-5B上训练的人工智能模型能否逐字复制个人数据提出了质疑。LAION还表示,儿童及其监护人有责任从互联网上删除儿童的个人照片,这是防止滥用的最有效保护措施。

  立法者提议禁止在未经同意的情况下使用人工智能来生成包括儿童在内的人的色情图像。这些努力紧迫而重要,但它们只解决了更深层次问题的一个症状,即儿童的个人数据在很大程度上仍未受到保护,不会被滥用。巴西的数据保护法——《一般个人数据保护法》(Lei General de prote

  o de Dados Pessoais)——没有为儿童提供足够的保护。

  政府应该通过采取额外的、全面的儿童数据隐私保护措施来加强数据保护法。4月,为保护儿童权利而依法成立的审议机构——全国儿童和青少年权利委员会(National Council for the Rights of Children and Adolescents)发布了一项决议,指示委员会和人权与公民部在90天内制定一项保护数字环境中儿童和青少年权利的国家政策。他们应该这样做。

  鉴于涉及的隐私风险以及随着技术的发展可能出现的新形式的滥用,新政策应禁止将儿童的个人数据收集到人工智能系统中。它还应该禁止未经同意的数字复制或操纵儿童的肖像。它还应为遭受伤害的儿童提供寻求有意义的正义和补救的机制。

  巴西国会还应确保拟议的人工智能法规包括对每个人,尤其是儿童的数据隐私保护。

  “生成式人工智能仍然是一项新兴技术,儿童已经经历的相关伤害并非不可避免,”韩说。“现在保护儿童的数据隐私将有助于使这项技术的发展成为促进而不是侵犯儿童权利的技术。”

喜临门声明:未经许可,不得转载。