用火车头V9采集器采集网页上的文章标题,测试时可以采集到内容,但是运行任务时就采集不到,是什么原因?以搜外的https://ke.seowhy.com/course/31这个网址为例,是循环采集网页上的文章标题,如下图所示测试时能够采集到标题,如下图所示但是运行任务开始采集标题时就采集不到了,如下图所示 对于初学者来 ...
本篇文章和大家分享一下火车头采集器网址获取选项的设置;在一开始学的时候这里就很容易被搞懵圈,我遇到的被懵圈的事情就是“链接过滤”的设置。比如使用“自动获取地址链接”搭配“链接过滤”就可以获取到网址;使用“手工设置规则获取”搭配“链接过滤”就获取不到网址,这个困扰了我很长时间,最终还是在多次摸索后找到了原因。下面以www.dyxtw.com/guandian/为例,给大家说明一下。 我使用的是V9版 ...