V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  isSamle  ›  全部回复第 8 页 / 共 22 页
回复总数  422
1 ... 4  5  6  7  8  9  10  11  12  13 ... 22  
230 天前
回复了 kalayygl001 创建的主题 Windows 求 在线网页 批量转为 pdf
238 天前
回复了 robking 创建的主题 程序员 本科深度学习毕设
你的训练样本就是个大问题
240 天前
回复了 nnegier 创建的主题 游戏 有办法惩罚游戏中口嗨的人吗?
建议你钓鱼,用社工手段,开几个小号装妹子去加他,人工智能帮你回复,套出个人信息,想办法套出工作/学校相关信息,然后让他删号退网(不然就给单位/学校投举报信)
240 天前
回复了 sankooc 创建的主题 奇思妙想 v 友中有没有手工大佬 请教个问题
如果你不嫌麻烦,试下水晶滴胶+橡皮泥塑型?
我在一年前也面临了类似的情况,家里全是无线 WIFI 覆盖的,但是台式主机需要有线。
上某宝花了 20 多买了个 WiFi 转有线的拓展器,成功解决了
GPS 模块有些自带数据记录,去他的官网拿数据就行,一般有坐标的,用高德地图展示下坐标
270 天前
回复了 tmdgri 创建的主题 程序员 请教一个 app 保持登录的问题
还不如搞个小程序打卡抽奖/领话费/流量啥的,跳转登录应用
@tongqe 你买个 1H1G 的服务器,包年可能才 100 以内,自带了公网 IP 啊
1.搞个 IP 代理池 2.降低采集频率,那你不说谁知道,有些事情是可以做不可以说的
自己家里放一个台式电脑,装 ubuntu 系统,随便找个带宽好点的轻量套餐穿透出来
275 天前
回复了 Jinnrry 创建的主题 程序员 Google Gemma 开源没人讨论下吗?
我觉得现在的大模型都是畸形的,应该训练响应模式而不应该训练响应内容。
听起来像面向监狱编程,爬虫+脚本+小软件=方便使用的数据采集工具?
1.python 的爬虫无非就是 requests 、urllib 之类的库,选一到两个库了解下即可
2.了解下 http 之类的网络协议
3.找一些简单的网站,如天气、黄页之类的实操一下
4.对网络请求有一定了解后,优化下技能:正则表达式学习下(或者找些好用的工具能够自动解析页面数据生成正则的)、多线程多进程的库了解下、常见反爬机制手段了解下( IP 池、selenium )、最重要的是,相关刑法了解下
5.以上都 OK 的话,就可以尝试把这种采集工作打包成脚本工具了,Tkinter 之类的库了解下(这个可以问 GPT 让他给你出了你再修改也可以)
6.进阶版本的话,涉及到采集数据的存储和处理,那就建议搞个后台系统,这个时候 Django 再了解下,Excel 导出相关的库了解下
7.数据想要展示出对应的效果,画图库 pyecharts 之类的了解下
8.要更方便一点,类似于钉钉机器人了解下,官方文档一般都有
327 天前
回复了 Dongxiaohao 创建的主题 新手求助 if 和 else if 的区别
一个是走通了不再走了,一个是所有都走一遍吧
8848
1 ... 4  5  6  7  8  9  10  11  12  13 ... 22  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4120 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 49ms · UTC 05:23 · PVG 13:23 · LAX 21:23 · JFK 00:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.