火车头采集器第一步介绍

图片[1]-火车头采集器简单教程

一、第一步采集网址设置

图片[2]-火车头采集器简单教程

网址设置一般有两种常见使用

1、普通网址

意思是直接把网址直接输入即可。

2、批量网址设置

如上图所示找到需要采集的网址规则,是每次增加1,还是每次增加2,总共多少页,都可以设置

二、采集内容设置

图片[3]-火车头采集器简单教程

内容设置一般有两种方式:

1、自动获取

自动获取任何内容不设置,也可以采集到网址,但是网址内容很多,可能包括自己想要的,也包括多余的。可以通过采集区域,开始字符——结束字符,之间的内容,设置区域之后也可能存在不需要的网址,通过后面的字符过滤,或者网址必须包含的字符设置,

设置完之后点击网址测试。查看是不是自己需要的网址。

图片[4]-火车头采集器简单教程

2、手动获取采集规则获取网址。

图片[5]-火车头采集器简单教程
图中常用标签都存在了。

【参数】:需要采集的参数,可以设置多个参数

图片[6]-火车头采集器简单教程

【*】:通配符,比如:

图片[7]-火车头采集器简单教程

图中的链接其他地方都一样,只有后面的”1234“是变化的,所以可用【*】,表示。

图片[8]-火车头采集器简单教程

【标签:XX】 XX可以改为任何字符。字符对应后面的字符表

图片[9]-火车头采集器简单教程

此处获取得到的标签内容=标签表中的内容。

此处设置了标签,后面标签栏中的只能用一个。

设置完之后,记得测试得到的网址。

图片[11]-火车头采集器简单教程
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情快捷回复

    暂无评论内容