如果有一种技术可以一秒复制或模仿你讲话,你会感到惊喜还是惊恐?
进入2019年,AI技术的应用落地越来越多样化。科大讯飞、搜狗等技术公司相继发布了语音合成技术的应用。通过AI手段,用户可以一秒变声社会名人或者其他想模仿的声音。
互联网技术在悄无声息地改变我们的生活,对人工智能企业来说,语音识别技术的广泛应用已不是难事。但背后的伦理道德和安全隐患,或将成为伴随AI技术发展不容忽视的一个问题。
实时变声技术受AI公司热捧一秒可换声
“嗨,大家好,今天非常开心,来到科大讯飞新品发布会,一直好喜欢科大讯飞哦……”
这是发生在科大讯飞2019新品发布会上的一幕,科大讯飞董事长刘庆峰通过技术,现场模拟了单田芳、林志玲和罗永浩的声音来做开场白。尤其当罗永浩声音响起的时候,不少人以为老罗到了现场。
“你看到的是刘庆峰,但听到的是老罗的声音。”台上的刘庆峰表示,这是公司最新的实时变声技术。据悉,这项新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。
不止科大讯飞,也是在近期,搜狗CEO王小川在一场大会上展示了搜狗变声功能,通过手机软件,王小川模拟了高晓松和东北妹子的声音,引得现场连连发笑。他随后展示了歌曲中的声音替换,据介绍,系统先用14分钟对他的语音做了训练,然后把音色做迁移。
这是搜狗最新的语音合成技术,可以实现把任何人的声音转化成特定声音,秒变林志玲、马云的声音都可以。王小川表示,这不只是一个简单的语音合成,可以把语音语调情感做迁移。
目前,在搜狗输入法中,用户可以将自己的声音自由变换成喜欢的声音,在微信、QQ、陌陌等主要社交场景均可使用。搜狗提供了明星、卡通人物、游戏IP、方言等几个类别供19种特定声音。
▲王小川
其实,语音合成早就不是新技术,之前,我们见到更多的是将文字转化为声音,比如在导航、转写、智能音箱、Siri等智能语音助手等方面的应用,并不是真人在说话。
今年,很多AI公司发力语音合成在变声、语音cos等场景下的应用,将真人发出的声音转化成特定声音。
百度也有相关技术的落地应用,今年5月初,在中央电视台公益节目《等着我》中,百度大脑基于智能语音技术,合成了已故老兵的声音,帮助分别64年的老战友实现“重逢”。
据介绍,该技术使用百度端到端语音风格分离和建模方案,使用多组神经网络对语音的不同维度,例如音色、情感、风格等,进行独立的编码建模,从而指导最终合成。
这些AI技术落地应用的背后,一方面体现了AI技术应用的进展,和为社会带来的普惠价值理念。比如搜狗将语音变声技术、AI合成主播技术等与行业结合,在媒体、教育、内容制作、旅游等场景结合,将会带来更大的价值想象空间。
另一方面,未来可能存在的技术漏洞、技术滥用等风险也不容忽视。有网友就指出“小心被用于电信诈骗”“以后可能会收到‘马云’的电话”……
一音频领域业内人士认为,对于音频作为交互方式的工具型产品应该是有用的,但对于音频作为内容载体的线上音频平台,正面意义有待观察。
因此,对企业来说,在不断寻求技术突破和商业价值的同时,也应该树立对技术安全的责任心。
语音合成技术在实操层面还有非常多的硬伤
据了解,逼真的语音合成技术,背后是神经网络和机器学习的支持。神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理,它利用分层的神经元,从大量样本数据中总结出共同特征。
语音合成技术在商业化落地方面,可见的在诸如语音交互、有声读物、新媒体、智能客服、泛娱乐等领域被应用。
在接受新浪科技采访时,蜻蜓FM大教育品类负责人牛森表示,语音合成技术在音频领域会大大降低文字内容转向音频的人员、时间和经济成本。
在谈到语音cos时,牛森指出,这件事在实操层面有非常多的硬伤,比如合成后的音频与真实的人声在情绪和情感表达上肯定是做不到完全一致的。
他表示,对于音频用户来说,同样的内容,读稿和讲述的收听体验会有很大区别,只有最真实的人声才能引发深刻的情感共鸣,也是音频的价值所在。
而在道德和安全层面上,牛森认为,首先要从技术上对人声和合成音进行筛选确认,从权利上需要明确版权链条,任何未经授权的合成音频属于侵权违法行为,“作为平台方我们会进行严格的版权和品质把控”。
据了解,在一些音频平台上,语音合成技术主要用于儿童类节目,其他的内容上,AI模拟效果没那么好,尚未被广泛应用。
对于语音合成存在的安全隐患,在发布了变声技术后,刘庆峰现场曾强调:人工智能要持续发展,最核心的是它的价值观如何阳光健康与人为善,所以像变声技术这样一个黑科技,我们显然是不会轻易在各种App中对外开放的,一定是要有一种健康、安全又有趣的方式来跟这个世界来对接。
此前,刘庆峰还提到,人工智能领域要技术合作,更要法律伦理的合作。
对于安全问题,搜狗公司向新浪科技表示,“技术是一柄双刃剑,可以用来造福也可能带来灾难,搜狗坚守科技向善。变声技术是当下人工智能的前沿应用,基于语音表征学习、迁移学习技术,可以将任何人的声音转换成特定人的声音(Any-to-One)。搜狗在这方面取得突破,率先进入实用阶段。这项技术还可以应用到影视配音,家人陪伴等场景中帮助人们提升工作效率和生活幸福感。”
搜狗透露,为了保证这项技术不被有心之人滥用,公司作了严格的管理和限制:
1、搜狗不向第三方输出变声技术,确保该技术的可控性和安全性。
2、变声功能的所有目标音色都由搜狗定义,不支持用户随意模仿。
3、变声后的声音在微信、QQ等App中使用,不能转发复制,能够做到对发送者追踪溯源。
此前,王小川在媒体采访中也提到过人工智能立法:在当前人工智能发展的阶段,尽快根据技术发展不断调整和完善,是应对人工智能所带来的法律和伦理风险最为切实的手段。
不过,目前技术的发展仍然是走在伦理、法律的前面。周鸿祎曾在今年5月份的世界智能大会上提到过,在AI领域,如果没有人文的思考,可能设计出来的系统就是一个悲剧。
AI技术背后的人文思考
其实,AI技术背后的“以假乱真”现象不只出现在声音领域,近日三星的一项技术应用也引起人们的注意。
据外媒报道,三星位于莫斯科的人工智能实验室研究人员,基于大量动图和视频素材,以及“深度卷积神经网络”训练,通过AI技术准确识别某些面部特征,可以将静止图像变为动图甚至视频。
在实验中,研究人员以爱因斯坦、玛丽莲·梦露甚至蒙娜丽莎的静止图像为基础,分别生成了他们正在说话的视频,不过目前视频质量较低。
也就是说,未来随着AI图像生成技术的进步,可以仅仅通过一张照片就能生成虚假视频。
在此之前,AI换脸也曾在社交媒体上引起热议。有人将94版《射雕英雄传》里朱茵扮演的黄蓉换上了杨幂的脸,网友直呼“毫无违和”“以假乱真”,甚至调侃“老剧新拍最省成本的方式”。
这原本是一则恶搞或者纯娱乐视频,但是,这一操作背后,却让不少人担忧技术会被滥用,如果没有使用在正确的地方,将涉及版权、肖像权、安全等问题。
而这类技术早在两年前国外技术圈就存在和流传,此前也有网友将主播的脸换成明星的。不过,受多种因素限制,这一技术真正落地应用还比较少见。
在美国,就已经有人利用人工智能将色情视频里的女主角换成女明星。这一技术正引发恐慌,遭到查封。
此外,在一些行业,这样的技术也将带来新的思考。比如一些音频会被篡改,引发社会问题;在未来的影视剧中,可能出现明星替身AI换脸、AI合成的配音等现场。虽然这些技术,一定程度上节约了影视剧制作成本,加快影视剧制作的进程,但在道德和人文层面释放的价值观还需要商榷。
而不管是AI变声,还是AI换脸,高科技迅速发展的同时,也给法律规则带来新的挑战。
值得注意的是,在4月全国人大常委会审议的《民法典人格权编(草案)》里,正式加了一条:任何组织和个人不得以利用信息技术手段伪造的方式侵害他人的肖像权。
也就是说,一个好的信号是,未来AI换脸、甚至语音合成技术的应用或将受到法律管制。
目前,AI技术的落地应用,正在不断打通虚拟世界和现实世界的界限,我们需要思考的是,如果未来这些技术越来越强大和普及,明辨真假将会变得越来越困难,技术发展的同时又该如何把控安全隐患问题?
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。