什么是采集任务
任务规则就是采集规则和发布模块之和,也就是我们经常说的规则,如下图:
这里就是任务规则了,后面有采集网址,采集内容,发布,3个操作,只能勾选相应的选项才会执行对应的操作。
现在就采集采集规则的一些操作做下说明。
1,运行任务
右击任务,选择开始任务:
在运行任务的过程中也可以暂停或者停止任务,如下图:
2, 新建任务
右击分组,选择新建任务:
3, 导出任务
右击规则,弹出如下界面选择导出任务:
4, 编辑任务
右击规则,弹出如下:
5, 删除任务
同样右击任务,选择删除任务。
6, 复制任务
右击任务,选择复制任务到剪贴板如下图:
7, 粘贴任务
把复制的任务粘贴到分组里面,右击分组,粘贴任务到该分组下:
粘贴后的任务是没有把之前的采集数据粘贴过来的,是全新的规则。
8, 重新下载未成功下载的文件
在运行任务后,发现有下载文件没有成功下载,在运行界面没有关闭的情况下,右击任务,就可以重新下载未成功下载的文件如下图:
9, 重新上传未成功FTP上传的文件
在使用了采集器内置ftp工具上传文件的情况下,任务运行完后发现有文件为上传成功,在运行界面没有关闭的情况下,右击任务,可以重新上传未成功FTP上传的文件如图:
10, 标记内容的发布状态
可以通过右击任务,设置任务下的内容发布状态为未发布或者已发布如下图:
11, 编辑查看采集的数据
采集器有查看编辑采集数据的界面,右击任务选择本地编辑任务采集数据,如下图:
右侧显示编辑查看界面如下图:
12, 打开数据库文件夹
如果采集器本地保存数据库选择的是access或者sqlite,可以通过以下方式,打开任务数据文件。
13, 清空任务采集数据或者任务的网址库
如果你需要从新采集,必须把采集的数据和任务网址库都清空,不然会提示重复,或者你不勾选判读重复也是可以的。
14, 导入任务
把导出的规则文件再次导入到采集器里面,右击分组,选择导入任务至该分组
新建规则实例参考:一个简单的文章采集实例