找回密码
 快速注册

QQ登录

只需一步,快速开始

搜索
微自动2025 AutoMini (免费无功能限制,营销神器全新重构版)营销神器2024(新版免费无功能限制)
查看: 2420|回复: 4

百度搜索页面采集规则失效

[复制链接]
最佳答案
0 

792

回帖

4

好评

2196

达人币

用户组:VIP终身会员

宣传大使兔年幸运勋章

发表于 2013-11-6 11:23:10 | 显示全部楼层 |阅读模式

刚用了论坛的  百度搜索页面采集规则    发现采集不到网址,麻烦看下,谢谢!帖子地址:

http://www.wzdr.cn/forum.php?mod ... D121%26typeid%3D121
回复

使用道具 举报

最佳答案
71 

1325

回帖

247

好评

1万

达人币

用户组:VIP终身会员

VIP赞助会员乐于助人兔年幸运勋章七夕纪念勋章忠实粉丝羊年幸运勋章

发表于 2013-11-6 12:01:04 | 显示全部楼层
[采集正则1]data-tools="{title:'[\s\S]*?',url:'(.*?)'}">[/采集正则1]

你测试下
回复

使用道具 举报

最佳答案
0 

792

回帖

4

好评

2196

达人币

用户组:VIP终身会员

宣传大使兔年幸运勋章

 楼主| 发表于 2013-11-6 12:20:55 | 显示全部楼层

好像还是不行,导出来的数据是数字,不是网址
回复

使用道具 举报

最佳答案
71 

1325

回帖

247

好评

1万

达人币

用户组:VIP终身会员

VIP赞助会员乐于助人兔年幸运勋章七夕纪念勋章忠实粉丝羊年幸运勋章

发表于 2013-11-6 13:45:30 | 显示全部楼层
wcf5338 发表于 2013-11-6 12:20
好像还是不行,导出来的数据是数字,不是网址

我能采集到呀 刚试过
不知道你啥原因
  1. --这个只是采集百度的搜索结果,同时自动解密URL的例子,请自行修改来源。
  2. [采集来源1]http://www.baidu.com/s?wd=site%3A%28www.discuz.net%29&pn={页码}&tn=baiduadv&ie=utf-8&lm=1&rsv_page=1[/采集来源1]
  3. [采集正则1]data-tools="{title:'[\s\S]*?',url:'(.*?)'}">[/采集正则1]
  4. [采集页数]3[/采集页数]这里自行修改采集页数,不能超过75,这是百度的限制
  5. [开始页码]-9[/开始页码]因为第一页为0,页面频率为10,所以这里设置为-9
  6. [页码频率]10[/页码频率]
  7. [采集延时]100[/采集延时]
  8. [编码]utf8[/编码]
  9. [采集过滤]amp;[/采集过滤]自动删掉采集后多余的URL部分
复制代码
2345截图20131106134500.png

评分

参与人数 2好评 +1 达人币 +52 收起 理由
刺客 + 50 测试可用!
wcf5338 + 1 + 2 很给力!

查看全部评分

回复

使用道具 举报

最佳答案
0 

792

回帖

4

好评

2196

达人币

用户组:VIP终身会员

宣传大使兔年幸运勋章

 楼主| 发表于 2013-11-6 15:16:03 | 显示全部楼层
ruler 发表于 2013-11-6 13:45
我能采集到呀 刚试过
不知道你啥原因

非常感谢,是我电脑的问题,换了台电脑可以了。我换了个采集源,正则搞不来,能帮我写下嘛?http://www.baidu.com/s?q1=%BC%F5 ... mp;tn=32053019_4_pg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

抢沙发||关于我们|手机版|营销神器 (蜀ICP备14013818号)

GMT+8, 2025-12-6 21:03

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表