12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?
你当然可以爬12306。
要不携程飞猪去哪网这些的数据是哪来的。
这种爬虫反而给12306省流量。
因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。
而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。
不过你要是一天爬它几亿次,就别怪晶哥抓你了。
。
相关推荐
最新更新
推荐阅读
猜你喜欢
为什么中国现在全球军事实力第一,但包括中国人在内很多人不认可?
做个web服务器,gin框架和go-zero怎么选?
有没有一款音乐播放器,能连接nas音乐,创建音乐库,自动匹配歌词封面等等?类似infuse的概念呢?
为什么《歌手》不请周杰伦、陈奕迅、王菲、张学友、孙燕姿、梁静茹、王力宏、林俊杰当节目嘉宾?
有哪些开源web应用漏洞扫描工具?
如何评价《机动战士Gundam GQuuuuuuX》第十一集?
哈梅内伊称伊朗绝不接受任何「强加的和平或战争」,接下来他将如何反击?
广东怀集遇历史最大洪水,约 30 万人受灾,积水最深处达 3 米,目前当地情况如何?
同样是透析,有的透析三年就走了,有的十年20年还好好的,为什么?
曼德拉是南非的罪人吗?
关注我们

包装制品
网站首页
