|
|
--提示:首先设置好自己要采集的关键词
[采集编码]utf8[/采集编码]
[采集词]美女哪里找[/采集词]
[采集来源1]http://wenda.so.com/search/?q={采集词}&pn={页码}[/采集来源1]
[采集正则1]aId=".*?" target="_blank" href="(.*?)">[/采集正则1]
[采集页数]30[/采集页数] --请自行修改要采集的页数
[开始页码]1[/开始页码]
[自定义结果前]http://wenda.so.com[/自定义结果前]
[页码频率]1[/页码频率]
[采集延时]100[/采集延时]
--
[采集库]{采集正则1}[/采集库]
-------------------------
基于以上采集的逻辑
aId="1378750707065589" target="_blank" href="/q/1378750707065589"> ------采集到的是/q/1378750707065589
虽然可以将http://wenda.so.com与采集到的/q/1378750707065589在excel中拼接成http://wenda.so.com/q/1378750707065589 这种完整网址
求助:有没有更快更好的规则写法,直接能导出最终的网址啊?
谢谢各位! |
|