广告投放

火车头采集器采集发布文章作者、时间、标签等内容

为什么采集这些东西,这里就不废话了。

下面一个一个的说怎么设置

1.作者

作者是在接口文件里设置的,这个接口文件不支持随机作者等。只能设置一个固定的。

在接口文件的30行左右。里面有个值我们根据自己具体情况填。

火车头采集器采集发布文章作者、时间、标签等内容

请注意,那里面的不是作者名字,也不是作者用户名。是作者账号的ID数字。

比如我们创建wordpress站点时默认创建的管理员账户ID就是1,后面的用户依次递增。2、3、4、5等等。这个应该很好理解。

内容采集规则里不需要再做作者的采集

2.时间

我们在内容采集规则里点击加号,添加一组标签

名字就填时间即可

火车头采集器采集发布文章作者、时间、标签等内容

然后开始设置数据的提取规则。

我们还以景安的这篇文章为例:https://server.zzidc.com/fwqjc/2018/1203/2825.html

火车头采集器采集发布文章作者、时间、标签等内容

他这个文章是有发表时间的,我们查看网页源代码,搜索:发表日期

火车头采集器采集发布文章作者、时间、标签等内容

然后将日期前后的内容填写到火车头采集规则里

火车头采集器采集发布文章作者、时间、标签等内容

可以点下面的测试看看食肉采集到了时间,这里就不发截图了。

3.标签

标签对于网站的SEO还是挺重要的,它可以增加我们网站里文章的内链,而且百度还挺喜欢采集标签里面的内容的。

标签跟时间采集思路一样,对比要采集的文章里标签前后的源代码。创建个采集项,然后设置采集规则。就行了

火车头采集器采集发布文章作者、时间、标签等内容
火车头采集器采集发布文章作者、时间、标签等内容

我们测试看看上面的采集效果

火车头采集器采集发布文章作者、时间、标签等内容

扩展知识

为什么添加的时间和标签两个项目名字一个填的“时间”,一个填的是“tag”?

火车头采集器采集发布文章作者、时间、标签等内容

这两个名字不是随便写的,是根据我们的发布模块里面的设置来写的。我们看下发布模块的具体内容

内容发布规则里点击修改配置

火车头采集器采集发布文章作者、时间、标签等内容

选择对应的模块,点击后面的编辑

火车头采集器采集发布文章作者、时间、标签等内容

这里面有发布参数,参数前面的表单名对应的是数据库里面的项目,后面的表单值是我们自己写的。

火车头采集器采集发布文章作者、时间、标签等内容

也就是说,这里面有的表单项目你才可以采集发布。没有的项目,你有动手能力就自己写。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
广告位招租919838898
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索