@
chenchangjv #18
> 我对您的问题的理解,就是用户上传了多维数据,通过多维数据的联合可以得到更多的信息量。
正确。
> Apple 有明确说明会把所有的数据聚合在一起去做用户画像吗?
隐私研究的目的是从数学或计算资源上保证坏事不会发生,而不是依靠信任。我没说 Apple 要去把数据合起来做画像,我甚至没说 Apple 要做任何画像。
你去考虑 Apple 是否值得信任、是否会做这件事,是完全背离该项研究的——这研究的目的是为了让人不需要考虑这个问题。
换成密码学更容易理解,加密是为了不需要保证没人窃听,而是有人窃听也可以。
> 在 Apple 描绘的应用差分隐私的场景中,每一个独立的 database 都是符合差分隐私的吧?
Apple 的文档里每个内容都是符合 DP 的,我的点在于这样的参数选取不带来实际的隐私保证。
> 如果我理解的没有问题,那么这能发生并不是差分隐私的问题。Apple 能够达到您所说的攻击的前提是能够将同一用户的不同维度数据聚合起来,这是因为她拥有差分隐私所要发布的信息以外的内容。
并不是,只是 DP 的参数选取问题。
> 我目前在做的只是差分隐私下的一些复杂数据的处理,在差分的缺陷方面无法帮助您。
我没有寻求你的帮助。
> 我无法理解您计算出隐私参数的问题,隐私参数一般是人为指定的,使用例如 Lap ( privacy param )等方式加噪音到数据上。
你真的不是看了 Laplace mechanism 之后背公式吗?
数据库 curator 的模型下,形式化的表述是这样的:若 D 是一个数据库,F, G 分别是 D 上的 a/b-diff. priv. mechanism,则 (f, g) 是 (a+b)-diff. priv. 的。
这个命题 **并没有** 说 (f, g) 不是 (a+b-1)-diff. priv. 的。我不能理解这么一个简单的不等式放缩为什么会有问题。
再用向量举例子:u, v 的长度都是 1,这相当于你选择每个你支持的 query 的时候 priv. param. 是 1 ;接着你把 u 和 v 相加,在不引入其他条件下我们能说的最准确的话是“ u+v 的长度不超过 2 ”,但这不代表 u+v 的长度不可以是 1.1 ;同理,当你 compose 两个 priv. param. 是 1 的 mechanisms 之后,你得到的是一个 2-diff. priv. 的 mechanism,但这不代表这个新的 mechanism 一定不是 1.1-diff. priv.。
如果你有一个 1-diff. priv. 的 mechanism,它当然也是 2-diff. priv. 的。