V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 83 页 / 共 133 页
回复总数  2641
1 ... 79  80  81  82  83  84  85  86  87  88 ... 133  
2020-02-07 16:30:11 +08:00
回复了 wuwukai007 创建的主题 Python 国内 pypi 的镜像源同步时间为什么要一天啊?
@wuwukai007 #3 如果用阿里云机器, 除了改默认 pypi, 还要改默认 hosts/dns, 默认的各路 bug, 除了快一无是处
2020-02-07 16:26:06 +08:00
回复了 storypanda 创建的主题 问与答 不觉得最近更应该关心疫情而不是在家办公吗?
每天看点官方报道, 睡前扫一眼朋友圈, 平时自己抓点疫情警告推送微信, 了解下最新情况吧

捐款捐物量力而行, V 站的讨论还挺激烈的, 套用史记那句话:

"常有大度,不事家人生产作业"

-- 你们寒假作业做完了没有
2020-02-07 16:16:15 +08:00
回复了 wuwukai007 创建的主题 Python 国内 pypi 的镜像源同步时间为什么要一天啊?
豆瓣镜像算较快的了, 我印象中几分钟就有了

pypi 官方有时候刚发布就有, 有时候得等几分钟, 反正阿里云机器上的我都改了豆瓣, 家里都用官方了
2020-02-07 14:49:24 +08:00
回复了 suifengingo 创建的主题 问与答 Python 语言的 if 循环如何批量生成,在线向大神请教!
我如果没有理解错的话, 这个的需求是... 生成代码, 而不是拿到代码的执行结果...

https://paste.ubuntu.com/p/TVWrjgYfpq/ 虽然感觉这样生成代码挺没有意义的

PS: 题外话, 如果拿结果, 一个函数甚至是 lambda 函数就够了, operate = lambda id, n: id+n. 上面表驱动什么的说的都不像是讲生成代码的...
2020-02-07 11:54:56 +08:00
回复了 IDCFAN 创建的主题 PHP 请教如何限定 textarea 输入的 HTML 标签
提交前检验只能防君子不能防小人(模拟个请求就绕过去了)
后端简单的做个定向 escape 就好了, 不过我后端是 Python 的, 先解析 dom 然后拿到定向的几个节点强制 escape 就完事了
2020-02-07 11:52:34 +08:00
回复了 suifengingo 创建的主题 问与答 Python 语言的 if 循环如何批量生成,在线向大神请教!
同一楼, 别拿自己判断的做法来求思路, 直接提原始需求可以避免走弯路
2020-02-06 09:31:28 +08:00
回复了 mathzhaoliang 创建的主题 Python Python 怎么初始化一个参数很多的类来着
四种, https://paste.ubuntu.com/p/fMRyDqJPRY/

```python
# 1. use dataclass at python3.7+, recommended
from dataclasses import dataclass


@dataclass
class Data(object):
a: int
b: int
c: int
d: int


data = Data(1, 2, 3, 4)
print(data)
# Data(a=1, b=2, c=3, d=4)
print(data.a, data.b, data.c, data.d)
# 1 2 3 4

# 2. Use namedtuple

from typing import NamedTuple


class Data(NamedTuple):
a: int
b: int
c: int
d: int


data = Data(1, 2, 3, 4)
print(data)
# Data(a=1, b=2, c=3, d=4)
print(data.a, data.b, data.c, data.d)
# 1 2 3 4

# 3. Use __dict__ without __slots__


class Data(object):

def __init__(self, **kwargs):
super().__init__()
self.__dict__.update(kwargs)


data = Data(a=1, b=2, c=3, d=4)
print(data.a, data.b, data.c, data.d)
# 1 2 3 4

# 4. Use setattr with __slots__


class Data(object):
__slots__ = ('a', 'b', 'c', 'd')

def __init__(self, **kwargs):
super().__init__()
for k, v in kwargs.items():
setattr(self, k, v)


data = Data(a=1, b=2, c=3, d=4)
print(data.a, data.b, data.c, data.d)
# 1 2 3 4

```

作为一个程序员论坛, V 站貌似对代码支持的一塌糊涂
2020-02-04 18:11:27 +08:00
回复了 ech0x 创建的主题 微信 你觉得微信好用吗?
微信的设计违反了 职责单一原则 /🐶
@asus10tu #15
工具有的是吧
早年要抓 TCP, 所以用的 wireshark
后来基本只抓网站, 所以浏览器的调试工具足够用了
后来因为要在三个平台抓包, 就用了 Charles
再后来证书什么的有点问题, 试了 fiddler 的自定义规则, 还是不好使
然后发现阿里开源了个 AnyProxy, 真香, 用了几天又因为系统洁癖把 node js 删了...
后来部署生产环境用到 mitmproxy, 比以前随手学的时候香多了, 从那以后基本只用 mitmproxy 了, 在服务器上 nginx 做下域名映射, app 什么的直接挂服务器代理, 还能改流量(比如给某些页面注入点 js)
再后来看到 utools 有抓包工具, 然而又对爬虫深恶痛绝... 就没有然后了

requests.utils.quote 其实内置库里也有, 平时更常用的是 quote_plus, 区别一搜就知道了
你乱码明显就是 fiddler 强行解码的锅, 它想强行解码也是为了用户可读, 你试试在请求上右键 copy 什么的能拿到原始的结果没有

我后来用 Charles 最舒服的其实还是右键 copy 成 curl, 然后用自己写的 curl parser 转成 Requests 直接用的字典, 什么都不改就可以重发请求了
2020-02-04 18:00:48 +08:00
回复了 firejoke 创建的主题 Python 大家学爬虫的热情把文泉学堂爬挂了
曾经也想给自己网站带上 ddos 防火墙, 后来总结了月流量=2, 就算了...
2020-02-03 23:45:30 +08:00
回复了 yezhiye 创建的主题 Python Python selenium find_element_by_xpath 出错
1. 没有源码, 不知道你这定位到哪去了
2. 没有结果, 不知道你说的 find 到的到底是不是 div
3. selenium 如果不靠谱, 为什么不直接拿整个 HTML 丢给自己家的 lxml 去解析
@asus10tu #9
乱码一般是用了默认(但不一定正确)的编码强行解码导致的, 感觉你抓包工具的问题, 毕竟不解码一般没法给用户看

以前遇到过一种就是阿里巴巴爬虫, 当时他们的 url 是 urlencode 之前先 gbk 编码了一次, 也就是 encode 了两层, 不知道和你这情况类似么

你的抓包工具有可能为了给用户容易看, 强行 urldecode 了一次, 然后解出来的和阿里巴巴 url 一样少解码一次的情况下, 直接盲目 decode 输出给用户了

目前因为是盲猜瞎调试, 所以只能排除法, 先换个靠谱点的抓包工具, 尤其是别轻易 decode, 拿到 bytes 自己用一些编码尝试性解码看看

你的粤逆向 decode 一下就知道了

print('ÔÁ'.encode('latin-1').decode('gbk'))

基本可以定位是你抓包工具只认 latin-1 或者 u8, 然而该 api 走了 gbk..... 换个靠谱抓包工具吧
直接说最终目的算了, 你上来就问底层可能方向都错了, 何况还是违反协议的
比如想在什么地方看到原始中文
2020-02-02 14:04:18 +08:00
回复了 minglanyu 创建的主题 问与答 室内简易跑步机有推荐吗
作为 30 岁以上超重人群... 我比较想买那个健走机(还是叫健步机来着)... 现在不敢出门, 又想活动太难了, 每天 200 个仰卧起坐, 腿和屁股根本不瘦
2020-02-01 17:20:56 +08:00
回复了 veDone 创建的主题 问与答 就没有替代迅雷的软件吗?速度减半都可以。
现在用着胡萝卜周的极速版, 不用迅雷 X 是因为只要是去广告的, 都没了挂代理功能...

后来感觉需要代理的情况直接用绿色版 FDM 就够了, 一直设置着代理

反正挺多时候下载是脚本命令行调起的, FDM 很坑的一点是命令行只能 fdm.exe url, 没法指定文件名, 这不如迅雷靠谱
<少数派报告> 是发生在 2054 年的华盛顿特区...
<疑犯追踪> 里的 Machine 也不知道有是没有...

现在治病靠免疫, 防疫靠自觉吧
2020-01-29 00:24:02 +08:00
回复了 0gys 创建的主题 分享发现 广东省已经通知境内企业建议不得早于 2 月 9 号复工
朋友圈已经看到一群被要求回北京广州 SOHO 的了... 要求去了住处隔离 14 天再去公司... 怎么感觉一年比一年难
1 ... 79  80  81  82  83  84  85  86  87  88 ... 133  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1697 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 16:12 · PVG 00:12 · LAX 09:12 · JFK 12:12
Developed with CodeLauncher
♥ Do have faith in what you're doing.