|
|
--取符合条件的帖子ID
[发布提交网址1]http://dx31.wzdr.cn/forum.php?mod=forumdisplay&fid=2&page=1[/发布提交网址1]
[发布提交1参数1]<td class="num"><a href="forum.php\?mod=viewthread&tid=(.*?)&extra=page%3D1" class="xi2">[0-2]</a>[/发布提交1参数1] --正则[0-2]表示只匹配回帖数为0到2个帖子的ID,如果大于2次回复,就不匹配
[发布1对比库]c:\对比库.txt==={发布提交1参数1}[/发布1对比库] --如果找到右边ID数据,表示此帖已经回复过!如果没找到,表示是新帖!
--点击上面标签,有详细说明
[发布1过滤库]tid={发布1对比库}&[/发布1过滤库] --这边标签,是用来过滤库上面对比库里面的数据信息,防止正则匹配到已经顶过帖子的ID号。
--“对比文本不存在”信息是蓝色的,表示系统预留关键字
[发布成功特征1]对比文本不存在===新帖,准备回帖!帖子ID:{发布提交1参数1}[/发布成功特征1]
[发布失败特征1]对比文本存在===此贴已回过,自动跳过!帖子ID:{发布提交1参数1}[/发布失败特征1]
--如果发布1失败,是不会继续下面的操作
[发布提交网址2]http://dx31.wzdr.cn/forum.php?mod=post&action=reply&fid=2&tid={发布提交1参数1}&extra=page%3D1&replysubmit=yes&infloat=yes&handlekey=fastpost&inajax=1[/发布提交网址2]
[发布提交数据2]message={公用词库1}&posttime=1439991863&formhash={登录后提交1参数1}&usesig=1&subject=++[/发布提交数据2]
==========================================================================================
@刺客
这个是案例,如果采集当前页面没有课回复的,就是回复数都是大于2次的。那么这个值{发布提交1参数1}就是空值,过滤库对比都能通过,后面拼接链接进入这个空值的帖子回复就会出错了。是否有可以判断的功能,如果没有采集到可以回复的帖子,软件停止然后进入下一次采集。
@刺客 |
|