公告:
  • 欢迎访问火车采集器客户帮助中心
首页 >> 问题百科 >> 采集问题 >> 采集网址 >> 添加起始网址中其它网址格式网址的添加

添加起始网址中其它网址格式网址的添加

【作者:神秘嘉宾】【字号: 】【打印】【收藏

有的用户在实际使用中,他需要采集的网址如果用批量/多页的方式只可以改一个变量,

但是他实际是有两个或多个量需要变的,可以采用下面的方式来达到要求

image

下面说下具体步骤:

比如我要采集的网址格式是这样的:http://www.a.com/list1/pna

                                             http://www.a.com/list1/pnb

                                             http://www.a.com/list1/pnc

                                             ……

                                             http://www.a.com/list2/pna

                                             http://www.a.com/list2/pnb

                                             http://www.a.com/list2/pnc

                                             ……

要在在批量/多页里达到是无法实现的,但是通过下面这种方式就可以实现的

 

步骤一:我们看到list旁边的参数是等差数列的方式递增的,pn旁边的参数是以a-z的方式变换的

image 

image

将复制好的<>表达式粘贴都粘贴到一个文本文档中。

 

步骤二:将文本中的数据做如下修改,然后粘贴到替它网址格式的对应的选项框中

image

这里面的0,1是优先级别的

image

我们具体测试下结果:

image

备注下:如果有的用户采集的格式是这样的:  http://a/a1

                                                         http://a/a2

                                                         http://a/a3

                                                         ……

                                                         http://b/b1

                                                         http://b/b2

                                                         http://b/b3

                                                         ……

需要如何设置呢?具体的操作步骤的截图如下:

和上面一样需要先完成步骤一的操作,但是步骤二就有所区别,具体注意下:

image

这里{$0}调用的就是{0<a,z,False>},换句话来说{$1}就是调用的{1<0,1,5,1,False,False>},以此类推。

采集的结果如下:

image