鸠摩智(多进程版)简介

前几天看到 http://doc.shenjianshou.cn/ 觉得不错,就省下几天守望开车时间照着文档用php实现了一遍,下面是对比shenjianshou的不足,改进和使用上的区别

不足:

没有js渲染 没有验证码识别 暂时没有自动换代理 暂时没有图片本地化/托管云 暂时没有模拟登录 暂时没有录入数据库 (已加)

特点/改进:

多进程,现在只能在liunx下使用了,单进程很容易内存耗尽- - 使用curl multi"多线程",可以自定义"线程"数,速度刷刷刷的 支持css选择器,xpath,正则3种选择器

使用上的区别:

查看SiteConfig目录下 数字.php 具体配置,因为用php搞的,各种传递参数啥的都不一样,但看起来大体一样; 用Xpath取回来的是innerHtml jsonpath没怎么弄 contentUrlRegexes helperUrlRegexes 规则里没带域名

如何安装

git clone https://github.com/ketle/jiumozhi.git cd jiumozhi composer install

如何开始

配置config.php下db,redis设置 Usage: php index.php <1-n> <test|start|stop|restart> 比如: php index.php 1 test 手动停止请Ctrl+c SiteConfig目录下自带了5个例子; 第一个例子入库2599条数据 时间从2016-08-22 22:15:13 - 2016-08-22 22:17:48 才用时2分半

为啥叫"鸠摩智"

拍脑袋想出来的,哈哈哈

版权声明:

1、该文章(资料)来源于互联网公开信息,我方只是对该内容做点评,所分享的下载地址为原作者公开地址。
2、网站不提供资料下载,如需下载请到原作者页面进行下载。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考学习用!
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。