|
|
发表于 2013-11-6 13:45:30
|
显示全部楼层
我能采集到呀 刚试过
不知道你啥原因- --这个只是采集百度的搜索结果,同时自动解密URL的例子,请自行修改来源。
- [采集来源1]http://www.baidu.com/s?wd=site%3A%28www.discuz.net%29&pn={页码}&tn=baiduadv&ie=utf-8&lm=1&rsv_page=1[/采集来源1]
- [采集正则1]data-tools="{title:'[\s\S]*?',url:'(.*?)'}">[/采集正则1]
- [采集页数]3[/采集页数]这里自行修改采集页数,不能超过75,这是百度的限制
- [开始页码]-9[/开始页码]因为第一页为0,页面频率为10,所以这里设置为-9
- [页码频率]10[/页码频率]
- [采集延时]100[/采集延时]
- [编码]utf8[/编码]
- [采集过滤]amp;[/采集过滤]自动删掉采集后多余的URL部分
复制代码
|
评分
-
查看全部评分
|