公告:
  • 欢迎访问火车采集器客户帮助中心

什么是采集任务

【作者:神秘嘉宾】【字号: 】【打印】【收藏

任务规则就是采集规则和发布模块之和,也就是我们经常说的规则,如下图:

clip_image002

这里就是任务规则了,后面有采集网址,采集内容,发布,3个操作,只能勾选相应的选项才会执行对应的操作。

现在就采集采集规则的一些操作做下说明。

1,运行任务

右击任务,选择开始任务:

clip_image004

在运行任务的过程中也可以暂停或者停止任务,如下图:

clip_image006

2, 新建任务

右击分组,选择新建任务:

clip_image008

3, 导出任务

右击规则,弹出如下界面选择导出任务:

clip_image010

4, 编辑任务

右击规则,弹出如下:

clip_image012

5, 删除任务

同样右击任务,选择删除任务。

6, 复制任务

右击任务,选择复制任务到剪贴板如下图:

clip_image014

7, 粘贴任务

把复制的任务粘贴到分组里面,右击分组,粘贴任务到该分组下:

clip_image016

粘贴后的任务是没有把之前的采集数据粘贴过来的,是全新的规则。

8, 重新下载未成功下载的文件

在运行任务后,发现有下载文件没有成功下载,在运行界面没有关闭的情况下,右击任务,就可以重新下载未成功下载的文件如下图:

clip_image018

9, 重新上传未成功FTP上传的文件

在使用了采集器内置ftp工具上传文件的情况下,任务运行完后发现有文件为上传成功,在运行界面没有关闭的情况下,右击任务,可以重新上传未成功FTP上传的文件如图:

clip_image020

10, 标记内容的发布状态

可以通过右击任务,设置任务下的内容发布状态为未发布或者已发布如下图:

clip_image022

11, 编辑查看采集的数据

采集器有查看编辑采集数据的界面,右击任务选择本地编辑任务采集数据,如下图:

clip_image024

右侧显示编辑查看界面如下图:

clip_image026

12, 打开数据库文件夹

如果采集器本地保存数据库选择的是access或者sqlite,可以通过以下方式,打开任务数据文件。

clip_image028

13, 清空任务采集数据或者任务的网址库

如果你需要从新采集,必须把采集的数据和任务网址库都清空,不然会提示重复,或者你不勾选判读重复也是可以的。

clip_image030

14, 导入任务

把导出的规则文件再次导入到采集器里面,右击分组,选择导入任务至该分组

clip_image032

新建规则实例参考:一个简单的文章采集实例