![图片[1]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109072859-1024x789.png)
一、第一步采集网址设置
![图片[2]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109073051.png)
网址设置一般有两种常见使用
1、普通网址
意思是直接把网址直接输入即可。
2、批量网址设置
如上图所示找到需要采集的网址规则,是每次增加1,还是每次增加2,总共多少页,都可以设置
二、采集内容设置
![图片[3]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109073731-1024x417.png)
内容设置一般有两种方式:
1、自动获取
自动获取任何内容不设置,也可以采集到网址,但是网址内容很多,可能包括自己想要的,也包括多余的。可以通过采集区域,开始字符——结束字符,之间的内容,设置区域之后也可能存在不需要的网址,通过后面的字符过滤,或者网址必须包含的字符设置,
设置完之后点击网址测试。查看是不是自己需要的网址。
![图片[4]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109074501.png)
2、手动获取采集规则获取网址。
![图片[5]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109074711-1024x233.png)
【参数】:需要采集的参数,可以设置多个参数
![图片[6]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109075022.png)
【*】:通配符,比如:
![图片[7]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109075256.png)
图中的链接其他地方都一样,只有后面的”1234“是变化的,所以可用【*】,表示。
![图片[8]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/微信截图_20230109075515.png)
【标签:XX】 XX可以改为任何字符。字符对应后面的字符表
![图片[9]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109075631.png)
![图片[10]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109075621-1024x94.png)
此处获取得到的标签内容=标签表中的内容。
此处设置了标签,后面标签栏中的只能用一个。
设置完之后,记得测试得到的网址。
![图片[11]-火车头采集器简单教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109074501-1.png)
© 版权声明
THE END
暂无评论内容