![图片[1]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109081529-1024x771.png)
第二步主要设置采集内容
一、标签设置
![图片[2]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109082131.png)
二、内容采集规则
常用的设置方式一共有3种
1、前后截取(适合长篇内容)视频简介、文章内容
![图片[3]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109082523-1024x340.png)
第二种 正则提取,(适合采集短篇)如图中采集网址,图片地址,一段话或者几个字,
![图片[4]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109082432-1024x339.png)
第三种为固定字符,一般适合密码,或者ID,或者一些固定名称。
![图片[5]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109082410.png)
三、多页,或者关联页设置
1、分页设置
![图片[6]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109083318.png)
这个位置和第一步设置区间采集一样。可以自动识别网址,或者手动设置网址规则。
内容页采集网址数量设置
![图片[7]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109085120.png)
自己注意点,有的默认10,意思是采集内容页,如果有50条,只采集10条,0为不限制
2、
一般用来特定的字符来隔开采集内容,或者换行,每条采集内容一行。
![图片[8]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109083600.png)
![图片[9]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109083615.png)
源码中有多条需要采集的内用,而且每条内容采集规则一样,就可以用循环采集,用字符隔开采集内容,或者换行,每天内容一行一个。
3、关联多页设置
![图片[10]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109084350.png)
关联多页和内容页差不多,一般用内容页比较多。
也是两种,一种网页地址替换
![图片[11]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109084712-1024x369.png)
一般适合做
![图片[12]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109084930-1024x737.png)
这种其实也可以用内容分页获取,就看自己喜好。
四、采集结果内容替换
内容替换为上面的标签页,采集到的内容进行替换修改。
![图片[13]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/微信截图_20230109085900.png)
![图片[14]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/微信截图_20230109085728.png)
如图上图采集到的内容,采集一些不要的标签,和空格,就可以通过内容替换来得到的正确的。
![图片[15]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109090222.png)
勾选需要屏蔽的标签,采集文章一般
![图片[16]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109090247.png)
内容替换,把文章的123,替换为空,或者替换为字符。
设置完之后记得测试,查看得到的结果。
![图片[17]-火车头采集器教程](http://xiaogay.cn/wp-content/uploads/2023/01/截图20230109090837.png)
© 版权声明
THE END
暂无评论内容