|
|
规则
| 规则类型: |
采集规则 |
| 更新时间: |
2014-07-31 |
| 编写作者: |
Ruler |
| 编写版本: |
2.9.9.1 |
| 是否有码: |
步兵 (无验证码) |
| 演示网址: |
http://zhidao.baidu.com/ |
| 规则简介: |
|
| 是否更新: |
不包更新 |
| 三天无效退还: |
不支持 |
| 是否开源: |
开源 |
| 规则使用说明: |
百度知道网址采集规则_Ruler |
| 规则用途: |
|
|
百度知道网址采集规则
论坛有人需要就写下,比较简单免费分享
效果演示:
规则代码:
- [采集词]BB霜和CC霜的区别[/采集词]
- [采集来源1]http://zhidao.baidu.com/search?word={采集词}&ie=gbk&site=-1&sites=0&date=0&pn={页码}[/采集来源1]
- [采集正则1]<dt class="dt mb-4 line" alog-alias="result-title-.*?">[\s\S]*?<a href="(.*?)"[/采集正则1]
- [采集页数]5[/采集页数] --请自行修改要采集的页数
- [开始页码]0[/开始页码]
- [页码频率]10[/页码频率]
- [采集延时]100[/采集延时]
- [采集编码]gbk[/采集编码]
- [保存顺序]1[/保存顺序]
- [采集过滤][/采集过滤]
- [采集库]{采集正则1}[/采集库]
复制代码 觉得还可以的话请您回复评分谢谢
|
评分
-
查看全部评分
|