在开放的同时,苹果搬出了次时代隐私策略

2020-06-27

在开放的同时,苹果搬出了次时代隐私策略

作为一年一次必须「观看」的科技盛宴, WWDC 其实才进入第三天。一般围观群众最为关心的开幕已然结束,但在各式各样的中文总结之中却有一个苹果非常强调的词甚少出现,它就是隐私。

在一系列新隐私做法和策略中还出现了一个全新成员的面孔 — Differential Privacy,同时它也可能是目前解决大数据时代下隐私问题的最彻底办法之一。

新服务、新体验,背后却是来自隐私的挑战

虽说 10 个更新的 iOS 10 仍算不上单次更新最多的 iOS 版本,但是全新人工智慧、大数据技术的加入,给苹果用户带来了全新的使用体验。而要达成这些这些功能,首先第一步就是要对用户的数据进行分析。

在开放的同时,苹果搬出了次时代隐私策略

全新的 Home 应用让用户能够远端在统一的界面对家中的智慧家居进行调整,毫不意外的,苹果对 Home 应用的远程控制数据也採用了与 Facetime 、 iMessenger 一样的端到端加密算法。

在开放的同时,苹果搬出了次时代隐私策略

接下来照片应用不仅仅拥有原先的相册功能,同时还加入了深度学习功能。能够自动根据地点、主题、人、物将照片归纳分组,并且和一些相关资源组合,生成以「回忆合集」。苹果的做法也很简单,这部分用户讯息的处理和加工全部只在 iPhone 本地完成。

在开放的同时,苹果搬出了次时代隐私策略

同时苹果还表示在 Siri 、 Map 一类的日常服务应用中,不会以「用户个人档案」的形式进行数据的收集。

在开放的同时,苹果搬出了次时代隐私策略

之后我们就迎来了本文重点需要讨论的「Differential Privacy」,按照字面意思来看,它似乎指的是苹果在不同的应用中採用了不同的隐私策略,但它实际却是一种全新的用户数据收集方式,目的是从根本上保证在收集用户数据的同时,保护用户的隐私。

没错,听起来真的就是这幺矛盾。

为了证明这项技术有多幺先进,苹果的软体工程高级副总裁 Craig Federighi 还在现场展示了一段来自宾夕法尼亚大学的隐私研究者, Aaron Roth 教授的一段表态:

不被大家注意的「差分隐私」
在开放的同时,苹果搬出了次时代隐私策略

苹果之所以会在 iOS 10 上面打造了这样一个以「开放」为主线的更新路线,其中最关键的可能就是新的关键算法——「Differential Privacy」。

所以 Differential Privacy 究竟是个啥?用苹果官方给外媒 Wired 的官方回复来解释就是:

Wired 随后也给出了自己理解的版本,可能更加通俗易懂一点:

到这里,你肯定还是听的一头雾水。所以,不妨让我再来给你们解释一些背景信息。

在开放的同时,苹果搬出了次时代隐私策略

数据,是这个时代的一种全新「资产」,你可以通过採集用户的数据进行分析,从而得出他们的行为规律,并且反过来提升用户的使用感受。这也是「体验至上」时代每个产品的製胜法宝,连苹果都不例外。

但在被收集数据的时候,实际上用户都是「毫不知情」的,讯息中哪怕夹杂着大量的隐私讯息,也一样被发送到了云端。

早在 2007 年,美国德州 Austin 大学的 Arvind Narayanan 和 Vitaly Shmatikov 就进行了一次实验,他们利用网路影片服务商 Netflix 提供经隐私处理的数据,与 IMDB 的数据进行比对,从而最终得出 Netflix 的匿名讯息。

这也意味着在大数据技术的帮助之下,哪怕你对用户讯息进行了匿名处理,用户的隐私依然无法得到保障。

在大数据时代的当下,这些用来反向比对的数据总有办法获得。最为明显的例子就在网站密码比对,如果你不习惯每个网站用一个帐号,那幺迟早你会被「盗用」。更不要提安装种类繁複的输入法了,大多数从用户回馈的数据甚至使用明码进行传输。

很可惜,苹果目前也未透露其「差分隐私」技术的细节,同时也只是在 QuickType 键盘、表情推荐、Spotlight 深度链接推荐进行尝试。

根据 Microsoft Research 工程师 Cynthia Dwork 和上文中宾夕法尼亚大学 Aaron Roth 教授一起刊发的一份相关论文来看,「Differential Privacy」即便是研究也处于一个非常初期的状态:

但在询问了国内安全、隐私的相关工程人士之后,他给出了对 Differential Privacy 的看法

这是一个弱化之后的用户讯息收集策略,关键在于不能从手机讯息里还原具体是谁,但同时能够区分是哪一群体。整体步骤应该包括用户数据的「破碎化」,并且降低不同碎片之间的关联性。

举个例子:

而苹果实际收集的数据却「很有可能」是这样的:

很多人会放学,很多人会在电影院看重庆森林,很多人会告别
有一些人「放学+看重庆森林」
有一些人「看重庆森林+告别」
有一些人「放学+看重庆森林+告别」
但是苹果实际是怎幺从用户的数据里面来提取这样的「颗粒」?不知道。这个颗粒如何更新、组合、从而实现统计的有效性?还是需要实际试验。另外一种可能性在于苹果会通过收集这些「颗粒」来不断修正自己的结果。

苹果在 WWDC 现场提到的「不建立用户档案」正是其中一个重要的步骤,但如何降低用户数据碎片之间的关联性?在苹果选择公开之前,我们依旧无法得知。

科技巨头都纠结的问题:隐私 vs 体验提升

有意思的是,大多数科技公司在有可能侵犯用户隐私的前提下,大量收集用户数据的目的不是出售用户的数据,而是分析用户的使用数据,从而更加了解用户,结合用户的喜好、想法,最终提升用户的使用体验。

正如微软中国 CTO 上个月底所说:

无论是之前的 Google Assitant 、还是这次的 Siri,他们都拥有「预测用户接下来想输入什幺」的能力,要实现这个能力,一定不是靠人工逐项输入,而是由数据直接分析结果。而分析所用的数据则是从用户那里收集而来,进而也就将隐私问题拉下了水。

对之前一直都被视为封闭系统典型代表的 iOS 来说,这个问题并不突出,至少苹果对自己的安全技术有把握、有信心。但既然选择了开放,这就为外界获得用户讯息提供了可能。

这个潜在的「隐私危机」,大多企业的选择都是尽可能,但是对于影响力巨大的苹果来说,则是最终按下「开放」按钮的必须前提。

在开放的同时,苹果搬出了次时代隐私策略

从 07 年苹果发布一代 iPhone 以来, iOS 一直都被视为封闭系统的典型代表,当然这也有 Android 充当「对照组」的原因。但实际,苹果纠结的并不是「要不要开放」,而是「开放」之后可能带来的安全、稳定性、生态等一系列问题。正如甲柏斯自传中写道:

而在用新方法解决了用户的隐私问题之后,苹果终于开始尝试「开放」,虽然不知道「Differential Privacy」这项技术之后是否能够普及并且惠及人类,但苹果的吃螃蟹之举,必将给予科学研究人士和科技行业以信心和提醒。

在开放的同时,苹果搬出了次时代隐私策略

最后 Craig Federighi 在 WWDC 上也用一张 Keynote 表明了苹果的决心:

上一篇:
下一篇:
扩展阅读