公告:
  • 欢迎访问火车采集器客户帮助中心
首页 >> 问题百科 >> 新手上路 >> 功能介绍 >> 一个简单的论坛采集实例

一个简单的论坛采集实例

【作者:神秘嘉宾】【字号: 】【打印】【收藏

在你看这个教程的时候,保证你已经完全掌握了一个简单的文章采集实例,所以本教程就只是论坛采集和文章采集不同处,相同处就不再多说了。

我们采集地址http://bbs.locoy.com/spider-132850-1-1.html,帖子里面主题还有回复,发帖人和回帖人。

同样打开帖子的页面源代码看下主题和回复的前后字符串在那里如下图:

clip_image004

查看页面源代码后我们发现主题和回复都在以字符“<div class="t_fsz">”开始以字符“</div>”,我们写到采集器里面如下图:

clip_image006

别忘了勾选“该标签循环匹配”(标签循环采集),如果帖子有分页要勾选“该标签在分页中匹配”(内容分页采集),然后点击“确定”按钮。

同样的发现无论发布主题的用户名还是回帖的用户名开始结束字符也是一样如下图:

clip_image008

写到采集器里面如下图:

clip_image010

测试结果如下:

clip_image012

其实采集是一样的就是用到了标签循环采集