在视频之前,护士让马克发一张照片给医生看下。马克照做了。
然而让他没想到的是,这张照片可给他惹了大祸了。
/ 爱子心切的父亲,算法眼中的“恋童癖” /
在照片发出的两天后,马克突然接到了Google的一纸通知。
由于涉嫌储存和传播有害内容,严重违反用户协议和公司政策,并且涉嫌违法,他的Google账号被完全关闭。
由于马克是Google全家桶的忠实用户,Google这一决定的后果相当惨痛:
他不仅失去了自己的 Gmail 邮件、通讯录、日历,还因为是 Google Fi 虚拟运营商的用户,连手机号都被一起冻结了。
到了这里,噩梦还远未结束。
Google不仅封了他的账号,还直接把这件事报到专门打击儿童色情/性虐待内容的监督机构那去了,该机构后来又联系了旧金山警察部门。终于在去年年底,旧金山警方从Google公司那里调取了关于马克的所有资料和记录,正式对马克展开了调查。
长达一年的时间里,马克面临“恋童癖”的严重指控,工作生活都难以开展,甚至几乎“身败名裂”……
《纽约时报》描述此事的文章提到,将马克置于尴尬境地的,正是Google少为人知的儿童性虐待内容打击系统。
根据美国政府的定义,儿童性虐待内容(Child Sexual Abuse Material,以下简称 CSAM),包括照片、视频等,只要其中涉及未成年人露骨色情行为的画面,都属于此类内容。更具体来说,涉及包括诱骗、勒索、展示/鼓动/宣扬性化 (sexualization) 未成年人、拐卖儿童性质的内容,都属于Google明令禁止的 CSAM 范畴。
图片来源:Google
为了防止平台、产品和技术被用于传播 CSAM,Google投入了大量资源,对 CSAM 进行扫描、阻止、移除和举报——然而这次让马克遭殃的并不是Google的扫描技术,而是Google的人工查验流程出了疏漏。
在各大公司,CSAM 检索和事后举报的流程,都包括了算法扫描和人工查验的双保险制度,Google也不免俗。然而在马克的遭遇当中,在算法发现了照片,并自动触发系统锁死马克的账户,并交由人工查验之后,核查员似乎并没有考虑当时的场景,没有发现这张照片是发给医疗专业人士的。
事后,马克立即进行了申诉。然而Google不仅拒绝复核之前做出的决定,甚至都不让他下载保存自己的数据。被关闭的账号,数据在两个月后就被自动删除了,马克失去了过去多年积累的很多重要信息。
事情就这样拖了整整一年,直到去年年底警方正式启动了调查。
在这一年里,马克几近“社死”,很难跟同事和朋友完整、诚实地解释,自己的电话号码、邮箱,为什么突然就凭空消失了。
直到今年前不久,当地警方才完成了调查并予以结案。
结果毫无意外:马克无罪。
对于把自己的忠实用户推进深渊,Google用法律作为挡箭牌的解释,很合情合理,却也绵软无力。一位公司发言人表示,美国的儿童保护相关法律要求像Google这样的公司必须对发现的 CSAM 事件进行上报。
根据Google的透明度报告,仅在2021年度,公司就屏蔽了近120万个涉及 CSAM 的超链接,向美国相关监督机构“全国失踪与受虐儿童服务中心” (NCMEC) 提交了87万份报告,涉及约670万条内容,关闭了约27万个账号。
遗憾的是,马克不幸成为了27万分之一。
身处这27万人中间,就像那些进了监狱却高喊着无辜的人一样,那种有冤情说不出,说出也不被人相信的滋味,简直无法想象。
/ 好心办坏事 /
在介绍打击 CSAM 工作的官方页面上,Google宣称,公司组建并训练了专门的队伍,使用最尖端的技术来识别 CSAM。
目前在美国大公司的范围里,检索 CSAM 有两种技术途径:哈希值匹配,和计算机视觉识别。
哈希值匹配比较简单,就是调取市面上第三方机构维护的数据库里的条目,和自己平台上的图片进行哈希值匹配,从而检测已知的 CSAM 相关内容。这方面早年Google曾经用过微软的 PhotoDNA。这项技术已经存在了10年多的时间了,不止Google,包括 Meta、Reddit、Twitter 等公司,以及 CSAM 领域的权威公共监督机构 NCMEC,都在使用它。
图片来源:微软
以及,Google系的 YouTube 也在使用自研的 CSAI Match 技术来,实现流媒体视频的哈希匹配。
当然,每天都有新的违法图片和视频诞生,所以除了哈希匹配之外,Google还自研并部署了基于计算机视觉技术的机器学习分类器,从而检索“未曾见过”的相关内容。
Google将这一技术整合到了 Content Safety API 当中,也开放给第三方使用。目前,包括 Meta、Reddit、Adobe、雅虎等公司,也是Google自研 CSAM 检索技术的用户和合作伙伴。
图片来源:Google
至于本次案件,Google似乎是从马克的 Google Photos 检索到了相关内容。
Google Photos 是Google推出的照片备份和云端相册服务,在自有品牌以及其它一些主流 Android 手机厂商的机型上都有预装。值得注意的是,用户在 Google Photos 里登录Google账号后,应用会提示建议用户打开自动上传备份——马克可能就是在这里吃了亏。
如果打开了自动上传功能,除了在某些第三方应用(比如 Twitter、Instagram) 下载的照片之外,包括相机照片集,以及手机上生成的其它照片,都会被 Google Photos 会自动上传到云端。
而根据官方网站和公司发言人透露的情况,Google不止明令限制用户通过 Google Photos 上传和传播相关内容,它的 CSAM 打击系统,也会对 Google Photos 里的照片进行扫描和匹配。
问题在于,根据Google发言人的表述,CSAM 打击系统的对象仅限于用户“主动行为” (affirmative action) 上传的图片。
从务实的角度来看,马克开启了 Google Photos 自动上传,结果因为急着给娃看病,拍了这张照片,自动上传了,忘了删,回头被Google找上麻烦——这样也要算作主动行为,未免有点牵强。
图片来源:《纽约时报》
扫描 CSAM,能够保护儿童安全,有效地打击恋童癖和各种变态,听上去怎么都是一件好事对不对?
然而实际上,近年来美国大型互联网和科技公司在做这件事的时候各种问题故障和丑闻不断——结果就是,算法自动化打击 CSAM 这件事,在技术道德和隐私权方面已经引发了巨大争议。
如果把Google这次乌龙事件形容为“人祸”的话,那么去年同一时间苹果出的事故,可以称得上“天灾”了。
去年8月初,苹果突然宣布,将要在 iOS 平台上推出一个专门扫描 CSAM 的客户端侧工具。
图片来源:苹果公司
苹果突出的关键词在“端侧”上:和Google一直以来扫描云端服务器存储的用户内容的做法不同,苹果表示只会在用户设备上做这件事,系统会下载 NCMEC 的数据库,然后完全在本地进行哈希值匹配。
然而,苹果所谓的“端侧”、“注重隐私”等,只是表面说辞。有专家发现,实际上用户发送到 iCloud 保存的照片也会成为检测对象。还有研究者发现苹果所采用的匹配算法 NeuralHash 存在设计理念缺陷。而且这一技术根本不是即将推出,而是好久以前就偷偷植入到公开版 iOS 里了,苹果还专门混淆了 API 命名,以便“隐姓埋名”。
结果,苹果宣布了这件事之后没出一个月,就有人对 NeuralHash 算法实现了哈希碰撞和“原像攻击”。
简单来说,哈希碰撞就是找到两张哈希值相同的随机照片;而原像攻击,则是“刻意生成的碰撞”,也即先给定一张照片,然后生成另一张和其哈希值相同,但内容不同的照片。
甚至,有人直接在广受欢迎的 ImageNet 标注图像数据库里,都能够找到几对天然的 NeuralHash “双胞胎”(两张不同的原视图片,哈希值相同)……
这些攻击测试的结果,从原理和逻辑上直接推翻了苹果的 CSAM 检索技术,使其一文不值。
图片来源:Cory Cornelius
早期测试的结果显示,NeuralHash 的哈希碰撞发生率和苹果宣称的误报率水平差不多,属于可以接受的范围。然而考虑到苹果在全球拥有超过15亿设备用户,基数过于巨大,一旦 NeuralHash 出现误报,甚至哈希碰撞导致的事故,都会波及大量用户。
总的来看,目前Google、苹果这两大移动平台级超大型公司,在扫描和打击儿童色情这件事上,都确实努力做了一些事情,也值得鼓励。
然而这件事的另一面,却令人大为遗憾:
因为一张随手拍出的照片,工作和生活陷入僵局,甚至险些身败名裂,这恐怕是马克,以及不少和他经历相似的人,所完全没有预料到的。
这也是整件事的尴尬之处:在过界的科技平台和糟糕的算法面前,好心真的可能会办坏事。
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。