公告:
  • 欢迎访问火车采集器客户帮助中心
首页 >> 问题百科 >> 采集问题 >> 采集内容 >> 采用前后截取方式采集网页源代码内容

采用前后截取方式采集网页源代码内容

【作者:神秘嘉宾】【字号: 】【打印】【收藏

    比如我要采集的是这个网址http://gaokao.chsi.com.cn/sch/schoolInfoMain--schId-1.dhtml中的学校名称:北京大学,我们首先查看下他的源代码并找到它的唯一标识码图如下:

image

我们在采集的标签中做如下设置:

image

这样就可以得到我们的采集结果了,如下图所示:

image

这个只是个使用前后截取的例子,实际运用中仿照这个就可以了。