小心隐私,你的手机和智能音箱都在录音给别人听。。。
2019-08-01 00:59:10 Author: mp.weixin.qq.com(查看原文) 阅读量:44 收藏

前几天,差评君上网时,看到了这么一条有意思的新闻。。。
英国媒体 The Guardian ,也就是「 卫报 」发布了一篇文章,说「 苹果合约方定期听取 Siri 录音 」 。。。
差评君看完这个消息,感觉信息量有点大:
和 Siri 讲话会被录音?
这个录音还会被苹果拿到外面给别人听??
这两个事情,经过苹果证实,确实有小于 1% 的语音片段会被录下来上传,做人工分析。
也就是说这份报道是真的。
你平时和 Siri 说的话,真的有小概率会被录音,而且给苹果外包的第三方做分析。
而这么做的原因,和苹果之前写在隐私说明里的目的是一致的:提升 Siri 的用户体验。
尽管这种通过「 用户体验计划 」收集数据的方式已经被各大公司用了很久了,但苹果这一出还是让差评君觉得很不习惯 ——
这可是苹果啊,那个最重视隐私,在广告宣传中把隐私作为最大卖点的苹果啊。。。
在今年 1 月 CES 时期,从不参加 CES 的苹果照例缺席了 CES ,但竖起了大大的广告,写着「 在 iPhone 上发生的事情,只会呆在你的 iPhone 里 」。
虽然苹果证实的 1% 不算太高,但很明显,他们做的和这句宣传语是有出入的。
在语音助手收集录音这件事情上,向来注重隐私的苹果都做成这样了,这个行业还会好么?
事实上就是。。。不太乐观。
首先,差评君要先和差友们说清楚一点,现在的大公司做「 用户体验计划 」时收集的数据,除非法律要求,一般都是「 脱敏 」的 —— 也就是去标识化能看到数据是啥,但分辨不出数据来源在哪。
如果哪家大公司这一点没有做好,那就不仅仅是大新闻了,而是丑闻了。。。
也就是说,无论是华为也好,苹果也好,三星、谷歌等等,一般情况下你都不用太担心有人用他们通过「 用户体验计划 」收集到的数据找到你。
那差评君为啥还说「 不太乐观 」?
因为文字信息这东西对电脑来说是字符,是可以用机器对敏感内容做一些预先处理的,苹果在这一点上尤其用心,还用到了差分隐私技术。
而语音内容的转换过程本身就是个极为复杂的机器学习过程,在这个过程中,往往需要人类参与给这些内容做标识,告诉机器哪段识别对了,哪段不对,把屎把尿地把语音人工智能教好。
说白了,要有人工参与这件事,这一点似乎做语音助手的科技公司都没少干。
苹果把一部分 Siri 录音传给第三方,让他们判断语音助手被唤醒的时候是不是意外,Siri 回答得好不好等等。。。
美国电商巨头亚马逊也雇人专门听自家语音助手 Alexa 采集的录音,从而提升体验
谷歌的 Google Assistant 语音助手虽然好用,但早些时候也证实聘请合同工听取用户录音。。。
由于给这些录音打标签等工作没啥技术含量,差评君上面提到的三巨头都选择了外包合约工来做这件事。
也就是说,在语音助手上,大家都在用一套类似的做法:
  1. 录音
  2. 让人类来检查录音
  3. 这些人还都是第三方合约工
国内的很多科技公司,也或多或少存在类似的情况。
比如小米曾经公布了小爱同学的聊天统计,结果起到了负面宣传效果,一堆网民在微博下评论质疑隐私问题。
但目前为止,虽然让人类来听这些录音,或多或少让人觉得心里膈应,但总归还是「 脱敏 」的吧?
这里差评君就要提及普遍存在的另一个潜在问题了 —— 意外唤醒。
「 天猫精灵 」、「 小爱同学 」、「 Hey,Siri 」、「 OK,Google 」 。。。
现在语音助手都能被语音唤醒,但有时候机器会「 误听 」到唤醒词,在主人不知道的时候就开始聆听了。。。
你确实不会在主动唤醒语音助手以后,开始说「 我家住在 XXX 」、「 银行卡号是 XXX 」。
但如果你不知道它被唤醒了,然后刚好随机算法轮到这 1% 的采集时间了呢?
根据「 卫报 」文章里做爆料的苹果外包工说:「 有不少录音的内容涉及隐私对话,例如医患讨论病情,商业合同,涉及犯罪的交易,以及性相关的内容 」
很多时候,用户本人都不知道,语音助手就被唤醒了,然后稀里糊涂地就被录音传了,然后。。。听到录音的是另一个活生生的人类。
总之,这一套逻辑下来可以看到,这很不安全,对隐私也存在威胁。
而这,目前还是没有啥好的解决方法,我们作为用户能选择的,顶多就是抛弃便利,关闭个性化和优化服务,或者干脆就不用。
这个问题说到底还是绕不开「 隐私和便利 」这个话题。
况且,人工智能产品如果样本数据量不够,是很难做好的。
科技公司们的初心也许就是单纯地想做「 用户体验计划 」,靠数据提升服务水平,又因为语音识别的特殊性,不得不介入人工。
但,这不意味着他们可以用妥协的方案来将就着,也不意味着他们应该在直到有人爆料之前,都一声不吭。
隐私和便利如何抉择,我们都抓秃了头,但不代表这就没法解决了。
苹果广泛使用的差分隐私技术,解决了传统数据隐私问题;也许哪一天有一门技术,可以搞定语音数据的隐私问题。
但不论如何,差评君觉得,这些大公司在语音助手的「 用户体验计划 」上,起码应该尊重用户的知情权。
资料来源:
The Guardian 「 Apple contractors 'regularly hear confidential details' on Siri recordings 」
The Guardian 「 Amazon staff listen to customers' Alexa recordings, report says 」
The Guardian 「 Google workers can listen to what people say to its AI home devices 」
VRT NEWS 「 Google employees are eavesdropping, even in your living room, VRT NWS has discovered 」
苹果官网 「 我们如何保护你的隐私安全。」
腾讯科技「 亚马逊被爆全球雇佣数千人“偷听”Alexa用户说话 」
新浪微博
“ 其实我银行账户里的数字,听到了应该也没人想偷 ”

文章来源: http://mp.weixin.qq.com/s?__biz=MzA5NDc1NzQ4MA==&mid=2653381194&idx=1&sn=7eb422365f44ec719814cefe7b9b8764&chksm=8b9a754dbcedfc5b7780e744d009f1d4589ccf6dd7a686daa5f3289dc30c541fa607e2b8c160#rd
如有侵权请联系:admin#unsafe.sh