V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
RobinFai
V2EX  ›  分享创造

<无聊之作:抓取网页截图>--另一种实现。

  •  
  •   RobinFai · 2013-06-06 09:24:05 +08:00 · 4897 次点击
    这是一个创建于 4212 天前的主题,其中的信息可能已经有所发展或是发生改变。
    google cutycapt 各种帖子
    yum 安装 flash player
    上传字体

    @vibbow 支持flash,外带可以设置延时多少ms XD
    木有java有木有。。。
    http://robinfai.com/capt.php
    19 条回复    1970-01-01 08:00:00 +08:00
    cute
        1
    cute  
       2013-06-06 09:47:46 +08:00
    好玩啊
    vibbow
        2
    vibbow  
       2013-06-06 15:32:27 +08:00
    在某些奇葩网站上cutycapt还是会有点小错位
    http://vsean.net/pic/di-0M2X.png
    http://vsean.net/pic/di-AOCC.png
    vibbow
        3
    vibbow  
       2013-06-06 15:42:21 +08:00
    还有你的截不了https的网站...
    RobinFai
        4
    RobinFai  
    OP
       2013-06-06 18:02:53 +08:00
    @vibbow https 搞定,QQ兼容是因为字体的原因

    o(︶︿︶)o 无压力。。。
    vibbow
        5
    vibbow  
       2013-06-06 18:23:11 +08:00
    @RobinFai 那17173的那个呢?
    shidenggui
        6
    shidenggui  
       2013-06-06 19:50:01 +08:00
    http://www.ihaveu.com/
    无法截取这个网站
    vibbow
        7
    vibbow  
       2013-06-07 03:06:19 +08:00
    貌似你的截图服务器挂了...
    RobinFai
        8
    RobinFai  
    OP
       2013-06-07 08:57:34 +08:00
    @vibbow ,真有劲啊,大半夜的。
    昨天 linode通知维护。 刚看了下又好了 - -#
    另外 17173 什么东西? 游戏咨询站?

    @shidenggui
    这个..... 真不知道flash还有哪些判断。youku之类的视频网站也是一样,只能加载出播放器,不能播放出内容。
    jiawenjun1126
        9
    jiawenjun1126  
       2013-06-07 10:06:16 +08:00
    我弄了一个java的
    用的是DJNative和swing的组件,有一个问题一直没有搞定,就是组件里面没有提供"网站完全加载完"的事件回调操作. 不是很完美.
    RobinFai
        10
    RobinFai  
    OP
       2013-06-07 11:09:01 +08:00
    @jiawenjun1126 页面加载到一半就截图了?
    用的是 Cutycapt 这个都不是自己控制的,有接口控制加载完再等待多少ms的。
    不过flash的一些东西依然等待不出来,不太清楚是什么情况。
    RobinFai
        11
    RobinFai  
    OP
       2013-06-07 16:17:10 +08:00
    @vibbow
    好吧,我错了。刚才看了下。昨天晚上在尝试看能不能弄出 flash的播放之后的截图来着。
    搞到一半,被老婆大人拉去吃饭了。。。。。。
    另外, http://www.ihaveu.com/ 这种站不是太大加载不出来,感觉像是 flash有什么机制去触发后面的展示,试过youku tudou 都不能截图到播放中。
    whaon
        12
    whaon  
       2013-06-09 15:31:54 +08:00
    我很好奇LZ是怎么实现的
    而且这种展现是基于什么浏览器的,IE?
    RobinFai
        13
    RobinFai  
    OP
       2013-06-09 16:47:46 +08:00
    @whaon
    怎么会是IE呢。 地地道道的centos啊。
    大致过程是
    1.shell脚本模拟x-server,也就是图形界面
    2.Cutycapt启动Qt的浏览器组件
    3.页面渲染后,Cutycapt截图,保存到命令行。
    4.杀死,模拟x-server的脚本。
    -------------------------------------------------------------------
    以上,除第一步外,均为猜测,无任何佐证。
    l0wkey
        14
    l0wkey  
       2013-06-09 16:54:08 +08:00
    不知道是不是被我搞崩了,我贴了张图片的地址
    RobinFai
        15
    RobinFai  
    OP
       2013-06-09 17:03:55 +08:00
    @l0wkey 木有崩,我真的没重启啊。
    话说刚配好的头两天到时真崩过两次,没查到是为啥。后来linode维护之后就没有了。
    l0wkey
        16
    l0wkey  
       2013-06-09 21:43:23 +08:00
    KiseXu
        17
    KiseXu  
       2013-06-09 22:38:12 +08:00
    厉害,是用的这个么: http://cutycapt.sourceforge.net/
    RobinFai
        18
    RobinFai  
    OP
       2013-06-14 08:38:41 +08:00
    @l0wkey 浏览器应该是Qt封装的webkit内核.兼容问题肯定还是有的.
    @KiseXu 是的,就是用的这个.
    我也只是提供思路,因为两年前有个业务需求,接触到这个东西.也是因为业务需要,弄到一半就没弄来.
    这次到看 @vibbow 同学发的帖子,就来凑凑热闹.
    btw,这两天手里的站被CC攻击.折腾了两天
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5299 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 06:40 · PVG 14:40 · LAX 22:40 · JFK 01:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.