1
lanpong 2019-08-26 16:26:14 +08:00
伪代码不过分。写不出来也可以问思路什么的。
|
2
lihongjie0209 2019-08-26 16:29:19 +08:00
List<Data> = doParse(doRequest())
|
3
FantasyPupil 2019-08-26 17:05:26 +08:00
伪代码不过分,之前面试让我手写真实代码。差点就直接爆炸了。
|
4
wersonliu9527 2019-08-26 17:18:25 +08:00
'CONCURRENT_REQUESTS': 100,
'CONCURRENT_REQUESTS_PER_IP': 100, 'REACTOR_THREADPOOL_MAXSIZE': 20, response.xpath() 万一只会这个呢 0.0 |
5
iPhoneXI 2019-08-26 17:21:12 +08:00 via Android
这个好啊,写不出来可以可以淘汰了,写出来后可以可以继续问并发编程的实现,进程 线程 协程 事件循环 锁 进程池线程池
|
6
jss 2019-08-26 23:36:32 +08:00 via iPhone
很正常,以前面试我都手写 SQL
|
7
Leigg 2019-08-27 07:59:55 +08:00 via Android
没问题
|
8
locoz 2019-08-27 14:27:39 +08:00
不过分,但没必要,因为这问题看不出来啥水平...如果贵司有自己内部的爬虫框架的话,并发请求应该是一个框架最基础的功能;而解析数据的话就是苦力活,有需要的话图形化之后鼠标点几下都能生成。
个人认为问这种东西不如问问“搞过哪些网站”、“碰到过什么样的问题”、“碰到过最难搞的网站是什么”之类的问题,然后再让面试者细化描述,从浅入深了解一下对方,就能大概知道是什么水平了。 |
9
aieike 2019-08-27 17:33:45 +08:00
我觉得爬虫, 一是经验, 见多识广, 二是灵活变通, 可以见招拆招
|
10
aieike 2019-08-27 17:34:48 +08:00
当然, 量大简单的, 就是另一种了, 爬虫稳健和性能提升
|