雅荷心语博客
雅荷心语
心之所向便是光
  • 首页
  • 前端之旅
  • 后端之路
  • 软件工具
  • 心灵鸡汤
  • 心路历程
  • 视频资料
  • 关于我们
    • 关于我
    • 关于我
  • 微信平台
    • 业务合作
  • 首页
  • 前端之旅
  • 后端之路
  • 软件工具
  • 心灵鸡汤
  • 心路历程
  • 视频资料
  • 关于我们
    • 关于我
    • 关于我
  • 微信平台
    • 业务合作
  • 关注本站
    • 微信
    • 微博
    • 腾讯微博
    • Twitter
    • Facebook
    • RSS订阅
Hi, 请登录     我要注册     找回密码

使用PHP的QueryList来写一个小爬虫玩玩~

2016-05-24 分类:后端之路 阅读(5547) 评论(0)

00:00/00:00

今天早上比较无聊,就玩了玩这个东西,简单爬了一下公司的房源列表,
Qlist的使用文档: http://doc.querylist.cc/site/index/doc/3
先看看代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
public function actionIndex(){
        header("Content-type:text/html;charset=utf-8");
        Includes('Query/QueryList.php');Includes('Query/phpQuery.php');
        $option = array(
            "title"=>array('.liebiao h1','text'),
            'money'=>array('.liebiao .zm_money span','text'),
            'xiaoqu'=>array('.liebiao ul li.info p:nth-child(2)','text'),
            'dizhi'=>array('.liebiao ul li.info p:nth-child(3)','text'),
            'huxin'=>array('.liebiao ul li.info p:nth-child(4)','text'),
            'uodateTime'=>array('.liebiao ul li.info p:nth-child(5)','text'),
        );
        $page = isset($_GET['page'])?$_GET['page']:'1';
        $hj = QueryList::Query('http://www.kuaiyoujia.com/zufangs/house/quyu-i'.$page,$option);
        $result = $hj->data;
        $TempArr = [];
        foreach($result as $key=>$value){
            $SetArr = [];
            foreach($value as $k=>$v){
                $SetArr[$k] = trimall($v);
            }
            $TempArr[$key] = $SetArr;
        }
        $ArrTemp = [];
        for ($i = 0; $i <10 ; $i++) {
            $ArrTemp[$i] = $TempArr[$i];
        }
        file_put_contents($_SERVER['DOCUMENT_ROOT'].'/uploads/HouseInfo_'.$page.'.json',json_encode($ArrTemp).PHP_EOL, FILE_APPEND);
        if($page <= 10){
            p('第'.$page.'次');
            $page = $page+1;
            Header('Location:http://127.0.0.1/index.php/wechat?page='.$page);
        }else{
            p('爬完了...');
        }
    }


刚开始想的是,每次走一遍,就给page+1,然后让浏览器跳转一下,结果~~~
爬完了也并没有出现我想要的跳转…..
只看到本地目录蹭蹭蹭的出现一堆数据文件,
QQ截图20160524111154

刚开始,page+1是写在Header的地址里,结果每次只走一次就不走了,后来改成这样:
$page = $page+1;
Header(‘Location:http://127.0.0.1/index.php/wechat?page=’.$page);
就顺利的跑起来~
中间用到的删除空格方法:

1
2
3
4
5
6
//删除空格
function trimall($str){
    $qian=array(" "," ","\t","\n","\r");
    $hou=array("","","","","");
    return str_replace($qian,$hou,$str);
}

1
2
3
4
/*载入指定的扩展文件*/
function Includes($name){
    require_once $_SERVER['DOCUMENT_ROOT'].'/common/extend/'.$name;
}

喜欢 (1) 赏 讨厌 (0)
分享到:更多 ()
标签:数据处理

相关推荐

  • 关于PHP实现守护进程的方式总结
  • JS输出格式化的json字符串
  • krpano xml 文件参数详解
  • Js子页面调用父页面方法涉及到的跨域问题及处理
  • 关于mysql主键自增变成非1的解决办法
  • PHP的反射类 ReflectionClass、ReflectionMethod 使用方法探索
  • 微信公公众号系统单条文字消息触发后台程序进行多次数据交互解决方案
  • jquery 如何给动态插入的元素绑定 hover事件
关于我

小天明 北京·朝阳 前端搬砖工程师

碎碎念):(来自公众号)

热门文章

  • 踩坑记录——iphone上safari开启隐身模式时localStorage变为只读-雅荷心语博客踩坑记录——iphone上safari开启隐身模式时localStorage变为只读2017-02-21评论(4)
  • 程序员是怎样一群人-雅荷心语博客程序员是怎样一群人2015-12-08评论(3)
  • 百度你个大毒瘤 - 吐糟博客这几天打不开事情-雅荷心语博客百度你个大毒瘤 – 吐糟博客这几天打不开事情2015-12-28评论(2)
  • PHP 非对称加密 openssl 加密及解密方法-雅荷心语博客PHP 非对称加密 openssl 加密及解密方法2016-05-17评论(2)
  • PHPStorm10 下载安装破解汉化-雅荷心语博客PHPStorm10 下载安装破解汉化2015-12-15评论(2)
2025年7月
一 二 三 四 五 六 日
« 六    
 123456
78910111213
14151617181920
21222324252627
28293031  

最新评论

  • 前端小武 8年前 (2017-04-06)说:
    我看到了layer
  • 丁艳平 8年前 (2017-03-03)说:
  • Dawn 9年前 (2016-09-16)说:
    call_user_func_array最后的例子是错哦,你用bc方法去调用类里 另外一个方法就知道问题所在了。情况1.调用非静态方法 第一个参数应该传[类的实例,调用方法] (既然有类实例了直接-&
  • Dawn 9年前 (2016-06-21)说:
    tp框架设置了全局捕获异常的,这也没什么。坑的是 他捕获了异常。然后全部返回404。。。不知道的 还以为自己网站被删除了
  • Dawn 9年前 (2016-05-17)说:
    构造函数里的判断 用异常机制可能更好一些

其他类型

  • 芊云全景
  • 配音兔AI配音神器

博客类型

  • 芊云全景
  • 配音兔AI配音神器

左邻右舍

  • 易水寒
  • 楼教主
  • 芊云全景
  • 贤心
  • 配音兔AI配音神器

雅荷心语博客 -心之所向便是光

联系我们关于我们

© 2025 雅荷心语博客   网站地图