甲看到 a 贴的标题,点都不会点;乙看到 a 贴的标题,仅会点进去看看;丙看到 a 贴的标题,会点进去更会回帖。
甲看到 b 贴的标题,仅会点进去看看;乙看到 a 贴的标题,会点进去更会回帖;丙看到 a 贴的标题,点都不会点。
甲看到 c 贴的标题,仅会点进去看看;乙看到 a 贴的标题,仅会点进去看看;丙看到 a 贴的标题,仅会点进去看看。
...
每一个帖子都会有不同的类型,根据这些类型来判断这些用户的价值观等
漫画网站 判断一个用户喜欢阅读的漫画
本子网站 判断一个用户的历史 x 癖
百度贴吧 判断用户不同贴、不同回复的意向
v2ex 同上
新浪微博 同上
知乎 同上
新闻评论区 同上
京东 /淘宝 判断用户属性(这个好像已经有了)
支付宝 /微信
银行流水
用户的日常灌水可以很明显的看出这个用户的价值取向
用户的购物 /金融平台流水可以看出用户日常消费倾向、理念和收入
关于用户甚至说不同的平台上相同的问题同样的用户同时间段也会有意向不相同的回复 /评论
举个例子
像 epic 现在挺火的。
抓取 epic 刚推出时候,游民、机核、3dm 、nga 、贴吧等等平台用户的评论
抓取 epic 出现争议时候,这些平台的用户评论
抓取 epic 限时免费知名作品(天国拯救、正当防卫)时候的评论
抓取 epic 限时免费 gtv5 时候的评论。
每个时期同一个“用户”的评论所包含“价值观”的变迁图,同时现实该用户不同时期是否用 epic 账户
从开始到现在就一直讨厌 epic 的 不注册 /仅注册 /注册领取
从开始 fxxx epic 到后面开始用 epic 不注册 /仅注册 /注册领取
从开始就无所谓 epic 的用户 不注册 /仅注册 /注册领取
...
同理还有拼多多,网易,百度,腾讯等等
也就是说搞一个平台,将这些“用户”的数据注入到这个平台以后,会形成一个“用户”完整“画像”。
注意,不是说一个类型的平台数据,而是用这个“用户”在网络上的所有能够“公开”抓取到的痕迹来构建这个画像。
虽然我不知道通过大数据耗时耗力搞出一个能够详细展示一个人价值观变迁的画像有什么用,不过不是挺有意思的么?
就像点开
一个“id”的画像看到这个 id 发布“开挂 xxx”,但是购物流水发现多次购买“科技产品”;
一个“id”说自己拿着底薪勉强度日,实际上月入百万;
一个“id”两年前说“永不使用 xx”,直到现在这个“id”也没有使用痕迹
一个“id”昨天说“用 xx 的都是 xx”,实际这个“id”已经使用 xx 许久。
甲看到 b 贴的标题,仅会点进去看看;乙看到 a 贴的标题,会点进去更会回帖;丙看到 a 贴的标题,点都不会点。
甲看到 c 贴的标题,仅会点进去看看;乙看到 a 贴的标题,仅会点进去看看;丙看到 a 贴的标题,仅会点进去看看。
...
每一个帖子都会有不同的类型,根据这些类型来判断这些用户的价值观等
漫画网站 判断一个用户喜欢阅读的漫画
本子网站 判断一个用户的历史 x 癖
百度贴吧 判断用户不同贴、不同回复的意向
v2ex 同上
新浪微博 同上
知乎 同上
新闻评论区 同上
京东 /淘宝 判断用户属性(这个好像已经有了)
支付宝 /微信
银行流水
用户的日常灌水可以很明显的看出这个用户的价值取向
用户的购物 /金融平台流水可以看出用户日常消费倾向、理念和收入
关于用户甚至说不同的平台上相同的问题同样的用户同时间段也会有意向不相同的回复 /评论
举个例子
像 epic 现在挺火的。
抓取 epic 刚推出时候,游民、机核、3dm 、nga 、贴吧等等平台用户的评论
抓取 epic 出现争议时候,这些平台的用户评论
抓取 epic 限时免费知名作品(天国拯救、正当防卫)时候的评论
抓取 epic 限时免费 gtv5 时候的评论。
每个时期同一个“用户”的评论所包含“价值观”的变迁图,同时现实该用户不同时期是否用 epic 账户
从开始到现在就一直讨厌 epic 的 不注册 /仅注册 /注册领取
从开始 fxxx epic 到后面开始用 epic 不注册 /仅注册 /注册领取
从开始就无所谓 epic 的用户 不注册 /仅注册 /注册领取
...
同理还有拼多多,网易,百度,腾讯等等
也就是说搞一个平台,将这些“用户”的数据注入到这个平台以后,会形成一个“用户”完整“画像”。
注意,不是说一个类型的平台数据,而是用这个“用户”在网络上的所有能够“公开”抓取到的痕迹来构建这个画像。
虽然我不知道通过大数据耗时耗力搞出一个能够详细展示一个人价值观变迁的画像有什么用,不过不是挺有意思的么?
就像点开
一个“id”的画像看到这个 id 发布“开挂 xxx”,但是购物流水发现多次购买“科技产品”;
一个“id”说自己拿着底薪勉强度日,实际上月入百万;
一个“id”两年前说“永不使用 xx”,直到现在这个“id”也没有使用痕迹
一个“id”昨天说“用 xx 的都是 xx”,实际这个“id”已经使用 xx 许久。