V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 67 页 / 共 133 页
回复总数  2641
1 ... 63  64  65  66  67  68  69  70  71  72 ... 133  
2020-07-01 23:22:35 +08:00
回复了 smallgoogle 创建的主题 Python 我猜你们 selenium 使用 ActionChains 都非常脑袋疼吧?
@jiejiss 好奇的是它操作 webdriver 的时候, 鼠标行为是事件, 还是其他操作, 因为之前用 cdp 发鼠标事件被反爬识别到了, 用 pyautogui 操作鼠标就没被识别到
2020-07-01 23:08:49 +08:00
回复了 smallgoogle 创建的主题 Python 我猜你们 selenium 使用 ActionChains 都非常脑袋疼吧?
如果是想直接移动鼠标到指定位置的话, chrome devtools protocol 里有 dispatch 鼠标移动和点击的事件, 不过有点好奇 selenium 里的操作鼠标移动时候是和 cdp 一样发事件, 还是从驱动层面控制鼠标动的?
2020-07-01 23:06:49 +08:00
回复了 loliordie 创建的主题 Python 有代码洁癖算不算是个好事
洁癖是病吧...

规范标准什么的是基操, 反正在好点的公司各种流程怎么走怎么顺, 也有专门的培训和集体 code review; 差点的公司就什么牛鬼蛇神都有了, 遇到这种情况除了抱怨, 也该想想自己为什么会与他们为伍

总结一句话, 都是来挣钱的, 没几个真来做技术的
2020-07-01 23:04:43 +08:00
回复了 zzxy001 创建的主题 Python 请教一下如何对多个服务器上的爬虫进行管理
最近正好也在整集群折腾 chrome 爬虫, 不过肯定不会用 selenium 这种过时的东西...

简单的说, linux 真的太香了, 一开始用的 VPS 是 windows Server 用的 rdp 一开始还觉得有界面挺好的, 安装软件也挺快的... 后来贴代码实在傻, 就又弄了几台 CentOS, 全程 fabric, 线上调试也是 tmux 太简单了, 关键内存利用率高多了

跑题了, 目前楼上们说的用 git 自动拉代码已经是成本比较低的了, 如果代码不敏感, 自己写个 api 远程下代码对比字符串变化重启服务的小脚本也不是没写过...
要么把 for 循环放在 with open 里面
要么把 'w+', 改成 'a'

不要想当然以为 w+ 就是追加

甚至... 你 print 出来都会发现是变的
2020-06-30 23:27:37 +08:00
回复了 aoscici 创建的主题 Python 如何通过字符串名称得到类字段
这种属性操作参考内置函数 getattr
2020-06-28 00:14:16 +08:00
回复了 systemcall 创建的主题 Windows Windows 引以为傲的生态在现在是否反倒是劣势?
要不是 nvidia 脑残的只能用 windows 应用商店改默认设置, 我可能已经是删掉微软商店的第六个年头了 (win8 时候就删)

不是说它不好, 就是感觉和苹果商店一比不是内味儿啊... 各种驻留进程驻留服务, 还有关不掉的小娜什么的, 系统洁癖了
2020-06-28 00:02:03 +08:00
回复了 berumotto 创建的主题 分享发现 Github UI 更新了
@xiri 我也反馈了这个... 现在在论坛里找怎么改回旧版看到这帖子... 找不到就自己写 stylus 了
@cheese 我今天也抽了... 准备油猴强制改 cdn 了, 不过暂时通过挂野生的代理发现速度还挺快, 撑几天看看再搞

PS: 在老家山东的时候一路秒播, 到了北京各种转圈圈...
如果不去培养健康的爱好和学习态度, 任孩子自由发展, 歪了也怪不了别人吧... 只求年轻人的价值观迭代别太快, 让我追不上, 其他方面爱咋咋地吧, 个人发展七分靠教育两分靠自觉一分看运气, 剩下的九十分还不是看脸
想起当年解析 B 站的逆天 CDN 支配的时候了... 老被用户反馈怎么播放这么卡啊~
2020-06-25 23:41:34 +08:00
回复了 Colorful 创建的主题 Python 请教一个 Python 爬虫,抓取 JS 变量的问题
@Colorful ... 你是把 Tag 对象给正则了... 我以为提前已经 outerHTML 或者 text 了, 早点休息吧, 大过节的能不写代码就不写代码
2020-06-25 23:29:51 +08:00
回复了 Colorful 创建的主题 Python 请教一个 Python 爬虫,抓取 JS 变量的问题
我自己写框架调用无头浏览器拿变量也就三四行...

正则的话, 你正则写错了吧? 没原始代码不容易拼,

r' window\._xxxx = ([\s\S]*?)</script>'

你这又 xxx 又空 {} 的, 还是好好学学正则吧, 最怕盲猜需求
2020-06-25 10:43:30 +08:00
回复了 azev 创建的主题 Python pypi 这个仓库好简陋
某些第三方有统计下载数的

https://pypistats.org/packages/ichrome

我用的 Github badge 工具也有 https://shields.io/#your-badge

上个版本更简陋, 没准人家设计就是要去马太效应呢, 再说, 下载量并不是合理选票, 如果被 SEO 了再被刷了, 建站初衷都没了, 换个领导再来个竞价排名什么的, 风气全歪了

想看热门什么的, Awesome XXX 上都有(就同名项目看到过七八个了), 也算给 MD 项目留了条活路不好么, 每个月总有那么几个帖子被顶起来也该看的到

就像四大周报之一的 Awesome Python: https://python.libhunt.com/newsletter/212
去年大火的: Genymobile/scrcpy: Display and control your Android device - https://github.com/Genymobile/scrcpy

一直很火的: Welcome | Frida • A world-class dynamic instrumentation framework - https://frida.re/docs/home/

不纠结 python 的话选择更多, 稍微会点 adb shell 的命令, 很多东西可以做, 就像 Tasker, 价格特别便宜( 2 顿饭?), 主要是可以把自动操作的脚本做成 apk, 脱离电脑自己执行挺方便的
2020-06-21 10:16:18 +08:00
回复了 patx 创建的主题 Linux ssh config 是否安全?
没有绝对的安全, 跳板机, LDAP 登录, 动态口令, 各种东西都敌不过一行代码漏洞
2020-06-17 20:37:53 +08:00
回复了 JieS 创建的主题 程序员 关于 HTTP 请求, POST 请求为什么有的接口还在 url 里传参数呢?
1. 设计
2. 日志分析
3. 历史遗留
1 ... 63  64  65  66  67  68  69  70  71  72 ... 133  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1969 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 37ms · UTC 15:29 · PVG 23:29 · LAX 08:29 · JFK 11:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.