@
geelaw #17
对不起我没太理解您的数学证明,也只是从您上面的回复里大概理解了您的问题。
我对您的问题的理解,就是用户上传了多维数据,通过多维数据的联合可以得到更多的信息量。
先说矛盾:
Apple 有明确说明会把所有的数据聚合在一起去做用户画像吗?
在 Apple 描绘的应用差分隐私的场景中,每一个独立的 database 都是符合差分隐私的吧?
您考虑的是 Apple 在收集以后把多维数据聚合起来,这是因为 Apple 作为一个收集者,承担了多个差分隐私过程中的收集者的角色,是这样吗?
如果我理解的没有问题,那么这能发生并不是差分隐私的问题。Apple 能够达到您所说的攻击的前提是能够将同一用户的不同维度数据聚合起来,这是因为她拥有差分隐私所要发布的信息以外的内容。
再说问题:
差分隐私已经不是最新的标准,确实存在问题,隐私保护也在探索之中。
我目前在做的只是差分隐私下的一些复杂数据的处理,在差分的缺陷方面无法帮助您。
另:
我无法理解您计算出隐私参数的问题,隐私参数一般是人为指定的,使用例如 Lap ( privacy param )等方式加噪音到数据上。
我的理解:隐私参数是用来决定是否传递正确信息的一个概率,从信息的角度来说,是从原始数据中所要去除的信息量。