本文共 341 字,大约阅读时间需要 1 分钟。
通过正则表达式作为规则,筛检白名单和黑名单以控制访问网页路径,不断自动访问符合条件的网址。可附带下载资源文件。
此程序适合挂机伪装普通用户、挂机博客互踩、挂机论坛下载图片、附件等应用。
使用方法:
首先建立白名单访问规则,比如我们要爬CnBeta的网页,就这样设置,然后点击“在页面中验证”按钮测试符合规则的链接:
然后,如果我们不希望重复爬到编辑推荐的内容的话,就在黑名单中这样设置并验证:
然后点击“开始获取”,程序就开始自动爬了。
其他设置自行尝试吧,都比较简单了。
程序下载:
源代码下载:
本文转自斯克迪亚博客园博客,原文链接:http://www.cnblogs.com/SkyD/archive/2010/03/18/1688990.html,如需转载请自行联系原作者