一直有看到企查查、天眼查、还有一些行业类型的数据聚合类网站,他们提供的服务的数据来自政府、企业、协会等渠道。 有个好奇的点,关于这类数据的获取是怎样的? 获取这些数据是否符合监管要求呢? 如果是存在问题的,这些企业怎么做到可以持续经营呢?
1
opengps 244 天前
凡是平台都有个发展过程,有没有可能:
刚开始只是创始人自己知道怎么查>查多了开始考虑新方法:用爬虫 or 直接谈合作>提炼需求对外做平台>整理业务特征对外收费 |
2
karnaugh 244 天前
有些东西本来就是要求公开的,这种数据直接爬应该就没啥风险。。。
如果想入行,那还是得好好研究下相关行业的法律吧 |
3
Vanderick 244 天前
好几年前的事情仅作参考:
之前在的小公司去爬一些政府网站的金融相关文件/政策;觉得是公开文件,所以没考虑风险问题,而且没做反爬;后来有政府级别的电话直接打到老板那里警告了。。。 |