- 积分
- 25130
- 注册时间
- 2007-3-16
- 激情
- 17691
- 居住地
- 中国 重庆市 江津市
- 在线时间
- 58046 小时
- 最佳答案
- 975

用户组:管理员
为人民服务!
      
|
发表于 2016-7-2 09:19:03
|
显示全部楼层
采集功能还不完善,建议用火车头等专业的采集器
由于 采集2 还不支持 {页码} 所以 采集2 只采集了第1页的数据,不完整
- --采集规则 百度贴吧名采集,非完整采集
- [伪造IP]{随机IP=中国}[/伪造IP]
- --fid是板块编号
- [采集来源1]http://tieba.baidu.com/f/index/forumclass[/采集来源1]
- [采集正则1]<li class="last_tag_li"><a href="(.*?)">[/采集正则1]
- [采集来源2]http://tieba.baidu.com{采集正则1}&st=new&pn={页码}[/采集来源2]
- [采集正则2]<p class="ba_name">(.*?)</p>[/采集正则2]
- [采集页数]1[/采集页数] --请自行修改要采集的页数
- [开始页码]1[/开始页码]
- [页码频率]1[/页码频率]
- [采集延时]100[/采集延时]
- [采集编码][/采集编码]
- [保存顺序]0[/保存顺序]
- [采集替换][/采集替换]
- [采集库]{采集正则2匹配1}[/采集库]
复制代码 |
|