php基于Snoopy解析网页html的方法

5年以前  |  阅读数:850 次  |  编程语言:PHP 

本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下:


    set_time_limit(0);
    $user = array('20517', '20518');
    header("content-Type: text/html; charset=utf-8");
    require_once './Snoopy.php';
    $snoopy = new Snoopy();
    //$uri = 'http://www.juzimi.com/meitumeiju';
    $uri = 'http://www.juzimi.com/meitumeiju?page=1';
    $snoopy->fetch($uri);
    $con = $snoopy->getResults();
    $doc = new DOMDocument();
    $doc->loadHTML($con);
    /* make a result array ... */
    $result = [];
    /* go through all nodes which have class="baby" ... */
    $i = 0;
    foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
      $row = $doc->saveHTML($element);
      $start = stripos($row, '{');
      $end = stripos($row, '}');
      $len = $end - $start + 1;
      $json = substr($row, $start, $len);
      $json = str_replace("'", '"', $json);
      $obj = json_decode($json);
      $pic = $obj->pic;
      $desc = $obj->desc;
      $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
      $file = '/alidata/www/test' . $filename;
      $image = file_get_contents($pic);
      file_put_contents($file, $image);
    }

希望本文所述对大家的php程序设计有所帮助。

 相关文章:
PHP分页显示制作详细讲解
SSH 登录失败:Host key verification failed
获取IMSI
将二进制数据转为16进制以便显示
获取IMEI
文件下载
贪吃蛇
双位运算符
PHP自定义函数获取搜索引擎来源关键字的方法
Java生成UUID
发送邮件
年的日历图
提取后缀名
在Zeus Web Server中安装PHP语言支持
让你成为最历害的git提交人
Yii2汉字转拼音类的实例代码
再谈PHP中单双引号的区别详解
指定应用ID以获取对应的应用名称
Python 2与Python 3版本和编码的对比
php封装的page分页类完整实例