我们以Sqlite数据库为例,Access的结构和它是一样的。
1.首先我们看有哪些表
默认的是Content和DownloadFile表。Content表是采集的标签内容,另一个是下载文件表。
2.Content表的结构。如图
其中有Id,已采,已发,PageUrl是默认字段,其它的是用户设置的采集规则中的标签。
3.DownloadFile表结构
表里有下载地址和保存地址,还有上传标识,Tpye表示该文件属于哪个标签,ContentId是内容表的id,PageUrl是下载页面的引用地址。
注意,使用火车采集器内置的数据导出功能时,导出的数据结构也是默认数据库结构。