WordPress采集插件 WP-JPost , 很多群友要求有自动增量采集的功能,我们这里也积极响应群友的需求。
本规则由群友 玩心 赞助~
下面说一下增量采集如何设定。
运行增量脚本的前提:我们的脚本每次只查询一次一条最新的内容,后面的内容无法采集,所以需要全量采集的小伙伴请先在浏览器中点击【采集】运行全量一次采集。
WordPress 采集插件 WP-JPost 在Windows/Linux 系统环境下安装curl 采集 带ssl的https网站 图文教程
打开wp-jpost的后台,编辑对应的任务,复制 “当前任务定时采集地址” 的地址。
我们这里举例地址为:http://wp-jpost.com/?jpost=jpost&jtask=wopus&jpage=1&i=0
每个任务的地址都不相同,请对应每个任务复制地址~
Table of Contents
*Unix系统
以下方法 BT面板,terminal终端 任选其一即可~
BT面板
“计划任务” — 添加计划任务
任务类型:访问URL
任务名称:自定义
执行周期:N分钟
3分钟
URL地址:http://wp-jpost.com/?jpost=jpost&jtask=wopus&jpage=1&i=0
每3分钟去访问一次页面,进行增量查询。
terminal终端
我们需要用到crontab命令来做这件事情,不知道的补习一下 Linux命令详解:crontab 定时任务
#crontab -e
*/3 * * * * /usr/bin/curl http://wp-jpost.com/?jpost=jpost&jtask=wopus&jpage=1&i=0 >> /dev/null
同样也是每3分钟进行一次增量抓取。
Windows 系统
微软键(键盘上的田字键)+R调出运行窗口,然后输入taskschd.msc
启动定时任务设置窗口 。
创建基本任务,大致设定如下: