1
withrock 2014-10-10 16:47:32 +08:00
|
2
withrock 2014-10-10 16:48:17 +08:00
我也很想知道,而且我还加了这个作者聊天,但是估计是不会开源的,我想我还是再琢磨琢磨吧。
|
8
iyaozhen 2014-10-10 20:07:28 +08:00
阅读数和赞数估计不好拿,内置浏览器打开才看得见。
|
9
cheny95 2014-10-10 20:53:12 +08:00 1
确实是需要内置浏览器才可以看到赞和阅读数.新版的微信就是这样,链接做了改动,每个文章的Key都是随机生成并且又是有时效性的,所以2个办法,1.按键精灵模拟用户点击,一 个文章一个文章点,2.反编译微信安装包,找到关键代码..
抓取了一下,人工访问的,同一个文章每次key都不一样,只能模拟用户点击.安卓的按键精灵吧. key: 92d93ba1b575468c7ff6c0fd655e1e8eaad445eb195c636072ba1c39f5a57765c635d71eee25c80ab97f81ddb181f2bb 文章标题: 古风歌曲TOP10,听了一定会喜欢! 文章描述: TOP10 断弦古人以弹琴为雅兴,常云:人生得一知己足以。弦则为琴弦,断弦则指琴弦已断,表达心中的悲愤之情。 阅读数量: 58 赞: 没有人赞呢 key: 94a250db12b2a6e1e9177653ea7dcb39eb38ef8d11dda4825596f02dd1eed5705177ffe464e23ff66fe59e681d5407e2 文章标题: 戴上耳机全世界都与我无关 文章描述: ?1.你哭-Nico你笑,全世界都跟著你笑。你哭,全世界只有你一个人哭。?2.Happiness-爱的魔幻爱 阅读数量: 47 赞: 1 key: 6b49eeb57a8e66392d7b51c7d5d783463cef9689d177cd84774d84af3acc1e5dc8562458ef565f0c64930f6aa6ceb967 文章标题: 戴上耳机全世界都与我无关 文章描述: ?1.你哭-Nico你笑,全世界都跟著你笑。你哭,全世界只有你一个人哭。?2.Happiness-爱的魔幻爱 阅读数量: 48 赞: 1 key: 5f545a9ae2d1a64bff0d2045d1d568efb25395e786cedc767483529410d7aadc0727cb3aee00fc3110f5e39a7fbd8dc8 文章标题: 戴上耳机全世界都与我无关 文章描述: ?1.你哭-Nico你笑,全世界都跟著你笑。你哭,全世界只有你一个人哭。?2.Happiness-爱的魔幻爱 阅读数量: 48 赞: 1 |
11
zhaohai 2014-10-10 23:12:44 +08:00
想知道在吗刷阅读量
|
12
zhaohai 2014-10-10 23:12:58 +08:00
想知道怎么刷阅读量
|
13
macken OP @cheny95 我今天用tcpdump抓了下包,可以抓到数据包,微信除了心跳以外,用的都是短连接,分析了下包,我估计key的值的是通过ssl传递的,每次打开文章前都会有一个ssl的数据通信
|
20
aaronleo 2014-10-25 20:34:27 +08:00 1
我正在做的也是微信文章聚合平台,微口网 - http://www.vccoo.com/
所以以我的经验来回答一下楼主的问题吧。 思路一,利用rss生成工具,将搜狗的微信搜索结果生成一个rss,然后通过rss监控这个公众号的文章是否更新。(理论上应该可行,但没试过) 思路二,自己做一个桌面浏览器,IE内核。用这个浏览器登录web微信,这个微信帐号关注你想抓取的公众号,这样就可以监控到是这些公众号是否已更新,更新后链接是什么,从而达到抓取数据的目的。(使用过,效率不高,但非常稳定) 思路三,通过修改android的微信客户端来实现(这个方法是我们曾经使用过一段时间的) 思路四,想办法越过验证直接取到链接,再通过链接取到数据。 补充一下:阅读数和赞数内置浏览器打开才看得见。 |
21
lomanyong 2014-10-25 22:25:40 +08:00
@aaronleo 这几天也在做微信抓取的练习....感觉抓取文章内容是没问题的...但是想要获取阅读数和点赞数实在是难以下手...不知道还有什么抓包的思路嘛...
|
22
lomanyong 2014-10-25 22:50:43 +08:00
@macken 不知道解决了木有,可以交流一下...其实我也是做到了抓取公众平台的内容,但是后面的浏览量和点赞数就很捉急了...
|
23
macken OP @aaronleo 如果能够拿到微信的授权key是可以通过修改浏览器的ua,直接访问文章可以获取到阅读数和赞数的
|
25
aaronleo 2014-11-23 11:36:29 +08:00 1
前天下午,微信公众平台更新了算法。 拿到key,修改浏览器的ua,也不行了。
不过现在可以得到10万+的精确数据了。已经有很多网站抓到这个数据了。 |
27
hzq888 2014-11-25 15:44:15 +08:00 1
我有个思路可以试试。
首先修改手机的 dns 然后劫持 微信文章页面里"http://res.wx.qq.com 这个域名, 然后在微信是会加载 <script type="text/javascript" src="http://res.wx.qq.com/mmbizwap/zh_CN/htmledition/js/biz_wap/moon2107db.js"></script> 这个文件的,然后你从腾讯拿到这个文件,加上你自己的js。 这样你就能在这台手机上微信里执行你自己的js 了 然后通过js 拿到 阅读数。 ----------------不知道你们懂了没,我太懒,不愿意去试,你们成功了告诉我结果!! |
28
llhh 2014-12-15 18:31:34 +08:00
楼主知道如何抓取了吗?
|
30
dsy2008bob 2014-12-23 15:03:28 +08:00
@macken 现在有什么解决思路么?
|
31
yzimhao 2014-12-24 21:23:56 +08:00
我已经抓取到了。目前开放接口给大家 http://www.kjson.com/weixin/?fm=v2ex
|
37
icewent 2015-02-01 09:52:19 +08:00
我也做了一个 http://wx5s.coding.io/stat
|
45
daijia1123 2015-02-18 11:55:43 +08:00
|
46
macken OP 这个你得直接修改html
|
47
cncba 2015-03-11 09:10:46 +08:00
偶尔用两次, http://www.kjson.com 这个就够用. 但还是要人工参与操作, 比较麻烦.
这个是收费的, http://www.dexj.net:82/ , 提供API, 用起来比较爽. |
48
weiguang3100 2015-04-13 23:47:22 +08:00
http://51tools.info/wx/weixin.aspx 实现了,而且提供免费的接口,一般的采集够用
|
49
weiguang3100 2015-04-13 23:48:31 +08:00
@cncba http://51tools.info/wx/weixin.aspx 思路跟第一个一样
|
53
macken OP @hzq888 插入图片不是上传一张图片,而是通过修改html的增加一个img标签,它的img指向你的服务器的图片地址
|
55
hjue 2015-07-30 21:15:57 +08:00
@macken 这个漏洞应该已经修复了
@Ourobotos 的确有文章有外站图片,这个文章第一张就是外站的 http://mp.weixin.qq.com/s?__biz=MzAxODIxNTM4MA==&mid=205751888&idx=1&sn=a5043dd7a77e7d4a4fd46752dfba0d79 |
57
hjue 2015-08-01 00:29:00 +08:00
@macken 发现微信的浏览器做了特殊处理,图片访问的refer为空
https://www.kjson.com/weixin/?fm=v2ex 特别提示是需要QQ浏览器的微信查看文章 http://51tools.info/wx/weixin.aspx 这个不需要,不知道是怎么实现的 |
59
rogeecn 2015-09-22 16:27:03 +08:00
你是在说这个么? http://qoofan.com/tool/article/get-view-cnt.html ,我做出一个 DEMO 来。
|
61
Lukin 2015-11-12 10:03:14 +08:00
反编译微信的 apk 文件能拿到 key 吗?
|
65
denghongcai 2015-11-18 00:21:44 +08:00
|
66
macken OP @denghongcai 是的 现在更新策略了,早前一个 key 是一个通用的
|
67
denghongcai 2015-11-18 10:35:30 +08:00
@macken 好想知道 regeecn 是怎么解决的,我感觉我现在已经走到邪路上了
|
68
wenfan 2015-11-19 13:18:21 +08:00 via iPhone
我也一直有个项目 需要找到 key 和 pass_ticket , pass_ticket 已经基本解决了,还需要 key ! 如果有人会解决 可以有偿!!! wechat : 23511839
|
72
21212121 2015-12-08 10:30:46 +08:00
|
77
g080166 2016-01-09 18:03:26 +08:00
@macken 不多,目前暂时是一万多,但是以后随着业务扩展,很难说。主要先你那边有没有 demo 看下,我看别人的都有网页可以尝试下,但是目前都挂了而已
|
81
ACzero 2016-01-19 16:35:38 +08:00
请问现在是用什么方法解决的?
|
83
haoning747 2016-01-28 13:29:46 +08:00
这是之前做的网盘引擎: www.quzhuanpan.com ,现在想搞个微信爬虫,发现很多人都是搜狗为入口,大家有新思路吗?
|
90
bojone 2016-03-13 09:37:49 +08:00
|
92
p5er 2016-04-17 20:29:41 +08:00
@macken 我用微信桌面版抓包发现。当我用微信搜狗获得的 URL ,粘到微信桌面版点开后,在第一个 get 请求的 URL 里,就已经带上了 key ,说明微信桌面版的程序,会自动把不带 key 的 URL 经过计算变成带 Key 的。然后第二个请求,就是通过 post 方法,带着 key 去请求 getappmsgext ,从而获得阅读数。所以我觉得 key 是在桌面版程序里计算出来的。
|
95
p5er 2016-04-18 01:40:28 +08:00
|
97
tinkerz 2016-06-20 17:04:57 +08:00
@macken 请问下,之前有过爬取公众号历史文章的经验不? 我这边现在要爬这部分内容,貌似只能登陆关注才能全部爬取,而且还要获取 key- -。 不知这儿用到的 key 跟文章阅读的 key 是不是同一类?
|
99
FANNG 2016-06-30 14:18:39 +08:00
|
100
tinkerz 2016-07-11 16:15:02 +08:00
|