火车头采集器第二步介绍

图片[1]-火车头采集器教程

第二步主要设置采集内容

图片[2]-火车头采集器教程

常用的设置方式一共有3种

1、前后截取(适合长篇内容)视频简介、文章内容

图片[3]-火车头采集器教程

第二种 正则提取,(适合采集短篇)如图中采集网址,图片地址,一段话或者几个字,

图片[4]-火车头采集器教程

第三种为固定字符,一般适合密码,或者ID,或者一些固定名称。

图片[5]-火车头采集器教程

1、分页设置

图片[6]-火车头采集器教程

这个位置和第一步设置区间采集一样。可以自动识别网址,或者手动设置网址规则。

内容页采集网址数量设置
图片[7]-火车头采集器教程

自己注意点,有的默认10,意思是采集内容页,如果有50条,只采集10条,0为不限制

2、循环设置需要配合标签采集的循环采集。

一般用来特定的字符来隔开采集内容,或者换行,每条采集内容一行。

图片[8]-火车头采集器教程
图片[9]-火车头采集器教程

源码中有多条需要采集的内用,而且每条内容采集规则一样,就可以用循环采集,用字符隔开采集内容,或者换行,每天内容一行一个。

3、关联多页设置

图片[10]-火车头采集器教程

关联多页和内容页差不多,一般用内容页比较多。

也是两种,一种网页地址替换

图片[11]-火车头采集器教程

一般适合做

图片[12]-火车头采集器教程

这种其实也可以用内容分页获取,就看自己喜好。

内容替换为上面的标签页,采集到的内容进行替换修改。

图片[14]-火车头采集器教程

如图上图采集到的内容,采集一些不要的标签,和空格,就可以通过内容替换来得到的正确的。

图片[15]-火车头采集器教程

勾选需要屏蔽的标签,采集文章一般保留<p>标签。或者<br>标签

图片[16]-火车头采集器教程

内容替换,把文章的123,替换为空,或者替换为字符。一般适合小说采集,文中插入的广告,替换为自己的广告。

设置完之后记得测试,查看得到的结果。

图片[17]-火车头采集器教程
© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情快捷回复

    暂无评论内容