V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  shawlib  ›  全部回复第 3 页 / 共 3 页
回复总数  56
1  2  3  
@wqzjk393 皮歪查姆 笑死哈哈
2018-01-10 15:00:45 +08:00
回复了 xuanxxxr 创建的主题 职场话题 转 Python 爬虫方向,求助下到达什么能力可以求职。
@xuanxxxr 代码挂到 github,最好做一个完整的个人项目。我也不是本专业的。文科生...加油吧,面试的时候真诚点,不难。
2018-01-08 11:55:16 +08:00
回复了 xuanxxxr 创建的主题 职场话题 转 Python 爬虫方向,求助下到达什么能力可以求职。
爬虫起点低,顶点也低。能爬主流网站像知乎、微博、微信文章、今日头条、淘宝京东、拉勾直聘、汽车之家等等的,就差不多了。
2017-12-03 01:00:52 +08:00
回复了 shawlib 创建的主题 Python Postman 可以请求到数据,为什么 Python 的 requests 就不行呢
@ferrum 多谢多谢!^_^
2017-12-02 23:48:32 +08:00
回复了 shawlib 创建的主题 Python Postman 可以请求到数据,为什么 Python 的 requests 就不行呢
@ferrum 用 Python 可以完全模仿出来么?
@mringg 还是不行呢
@lance6716276 换 headers 也不行
@iyaozhen 用 postman 生成的代码是
```
import requests

url = "https://www.zhihu.com/r/search"

querystring = {"q":"留学","range":"1d","type":"content","offset":"0"}

headers = {
'content-type': "application/json",
'cache-control': "no-cache",
'postman-token': "96abb04d-fc38-6632-703e-0db88e60b9ca"
}

response = requests.request("GET", url, headers=headers, params=querystring)

print(response.text)
```
还是报 500
2017-09-13 09:29:18 +08:00
回复了 fengleidongxi 创建的主题 程序员 关于安卓抓包
@xanthuiop 我试了试,很多 app 屏蔽了这个抓不到,有什么解决办法吗?
2017-09-13 09:26:55 +08:00
回复了 brucebot 创建的主题 Python 付费做一个新闻爬虫
楼上说的 scrapy 跟 beautifulsoup 都不是一个东西,scrapy 是爬虫框架,beautifulsoup 是 html 解析库,(黑人问号???
2017-08-19 10:59:26 +08:00
回复了 Zioyi 创建的主题 Python 各位老师傅们, python2 支持异步 I/O 编程吗?
windows 不支持 signal(),我也是刚刚遇到这个问题,还不知道怎么解决
2017-08-19 10:52:37 +08:00
回复了 Zioyi 创建的主题 Python 各位老师傅们, python2 支持异步 I/O 编程吗?
什么系统?
2017-08-18 19:14:04 +08:00
回复了 xfspace 创建的主题 全球工单系统 噗,京东这个短信退订关键词
back off !
2017-08-18 17:43:00 +08:00
回复了 petelin 创建的主题 Python 有什么好办法约束一个函数的执行时间吗?
# 超时装饰器
import signal,functools # 下面会用到的两个库
class TimeoutError(Exception): pass # 定义一个 Exception,后面超时抛出

def timeout(seconds, error_message = 'Function call timed out'):
def decorated(func):
def _handle_timeout(signum, frame):
raise TimeoutError(error_message)
def wrapper(*args, **kwargs):
signal.signal(signal.SIGALRM, _handle_timeout)
signal.alarm(seconds)
try:
result = func(*args, **kwargs)
finally:
signal.alarm(0)
return result
return functools.wraps(func)(wrapper)
return decorated
2017-08-18 14:10:56 +08:00
回复了 eben 创建的主题 程序员 话说,现在写爬虫都用 Python 吗?
是的 量产
2017-08-15 00:13:53 +08:00
回复了 petelin 创建的主题 Python 有什么好办法约束一个函数的执行时间吗?
老哥,找到什么好方法了公布下
2017-08-15 00:12:38 +08:00
回复了 petelin 创建的主题 Python 有什么好办法约束一个函数的执行时间吗?
2017-08-08 20:18:26 +08:00
回复了 revotu 创建的主题 Python Python 如何模拟登陆知乎(目前知乎有倒立文字的验证码)
1.知乎的验证码出现的概率与你的异常操作成正比,一般情况不会轻易弹验证码。
2.验证码解决方案只有两种 a.自动验证(直接刚正面) b.避免(打不过躲得过)
3.爬虫本身是一场博弈,不要给别人的服务器造成过高的压力,该 sleep 就要 sleep
4.解决方案 a.Python 模拟登录库:github/fuck-login b.Python 知乎非官方 oauth:github/zhihu-oauth
2017-07-26 16:36:46 +08:00
回复了 since1994 创建的主题 全球工单系统 CSDN 的 blog 是不是炸了
是的,大熊得
1  2  3  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2654 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 05:12 · PVG 13:12 · LAX 21:12 · JFK 00:12
Developed with CodeLauncher
♥ Do have faith in what you're doing.