我们采集内容的时候经常遇到内容里面有图片的,或者我们就采集图片并下载。采集的图片格式有2种:
1,带html标签的
,这样的情况我们只要在下载设置那里勾选“图片下载”;
2,不带html标签的就单单是采集图片地址,这样的情况在下载设置那里我们要勾选“探测文件下载”。
上面2种情况下,我们要下载图片,下载选项那里设置是不一样的如下图:

图片标签和缩略图标签采集的都是图片。如果我们要下载设置是不一样的如下图:


测试截图如下:

成功下载了。
原因就是采集器只会把包含<img 标签的看成图片文件,勾选下载图片就可以了,采集的是图片地址的就会当成其他文件下载,就需要勾选探测文件下载。