|
|
按照教程:http://www.wzdr.cn/thread-47706-1-1.html(虽然过期,但参考为主,但还是出问题)
--采集规则
[采集来源1]http://www.baidu.com/s?wd=爱站网&ie=UTF-8[/采集来源1]
[采集正则1]href = \"(.*?)\"[/采集正则1]
[采集页数]1[/采集页数] --请自行修改要采集的页数
[开始页码]0[/开始页码]
[页码频率]10[/页码频率]
[采集延时]100[/采集延时]
[采集编码]utf-8[/采集编码]
[保存顺序]0[/保存顺序]
[采集替换][/采集替换]
[采集库]{采集正则1}[/采集库]
上面是我自己写的,但采集的时候全是搜索问题,估计是采集来源出的问题。
右键看规则报告-页面提示:
温馨提示:
根据您当前的搜索结果,您所处的网络环境可能已被恶意劫持。为了保证您的搜索体验,建议您使用加密链 https://www.baidu.com/ 进行搜索,并建议您将其设置为浏览器首页。根据我们的测试,这可以有效解决绝大部分的网络劫持问题。查看详情
不知道是什么问题,但用教程里面的规则,用SITE命令搜索的却是正常。求解。 |
|