国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 PHP 函式庫 其它類別庫 phP的抓取網(wǎng)站類別庫
phP的抓取網(wǎng)站類別庫
<?php
header("Content-Type: text/html; charset=UTF-8");
require("phpQuery.php");
$hj = QueryList::Query('http://mobile.csdn.net/',array("title"=>array('.unit h1','text')));
//dump($hj->data);
$data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',array(
    'image' => array('img','src')
    ))->data;
//
$data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',array(
    'link' => array('a','href')
    ))->data;
$page = 'http://cms.querylist.cc/news/566.html';
$reg = array(
    'title' => array('h1','text'),
    'date' => array('.pt_info','text','-span -a',function($content){
        $arr = explode(' ',$content);
        return $arr[0];
    }),
    'content' => array('.post_content','html','a -.content_copyright -script',function($content){
     
            $doc = phpQuery::newDocumentHTML($content);
            $imgs = pq($doc)->find('img');
            foreach ($imgs as $img) {
                $src = 'http://cms.querylist.cc'.pq($img)->attr('src');
                $localSrc = 'w/'.md5($src).'.jpg';
                $stream = file_get_contents($src);
                file_put_contents($localSrc,$stream);
                pq($img)->attr('src',$localSrc);
            }
            return $doc->htmlOuter();
    })
    );
$rang = '.content';
$ql = QueryList::Query($page,$reg,$rang);
$data = $ql->getData();
dump($data);

支援抓取網(wǎng)站,進行爬蟲,非常強大,是一個基於PHP的服務(wù)端開源項目,它可以讓PHP開發(fā)人員輕鬆處理DOM文檔內(nèi)容,例如獲取某新聞網(wǎng)站的頭條信息。更有趣的是,它採用了jQuery的思想,你可以像使用jQuery一樣處理頁面內(nèi)容,獲得你想要的頁面資訊。

免責(zé)聲明

本站所有資源皆由網(wǎng)友貢獻或各大下載網(wǎng)站轉(zhuǎn)載。請自行檢查軟體的完整性!本站所有資源僅供學(xué)習(xí)參考。請不要將它們用於商業(yè)目的。否則,一切後果都由您負(fù)責(zé)!如有侵權(quán),請聯(lián)絡(luò)我們刪除。聯(lián)絡(luò)方式:admin@php.cn

相關(guān)文章

如何從不同的 PHP 類別正確存取 MySQLi 資料庫連線? 如何從不同的 PHP 類別正確存取 MySQLi 資料庫連線?

18 Dec 2024

從 PHP 中的其他類別存取 MySQLi 連線從 PHP 5.6 升級到 7.0 時,必須從 MySQL 過渡到 MySQLi。這...

為什麼要從 Python 中的「object」繼承:一個類別繼承問題 為什麼要從 Python 中的「object」繼承:一個類別繼承問題

24 Dec 2024

了解 Python 類別繼承在 Python 中,類別可以從其他類別繼承,這使它們能夠存取父類別的屬性並...

PHP Simple HTML DOM 抓取啟用緩存的網(wǎng)站返回亂碼的解決方案 PHP Simple HTML DOM 抓取啟用緩存的網(wǎng)站返回亂碼的解決方案

18 Aug 2025

本文旨在解決在使用 PHP Simple HTML DOM 庫抓取啟用了 WordPress 內(nèi)部緩存的網(wǎng)站時,遇到的返回亂碼問題。通過使用 cURL 並設(shè)置 CURLOPT_ACCEPT_ENCODING 選項,或使用 gzdecode() 函數(shù),可以有效解決首次抓取正常,後續(xù)抓取出現(xiàn)亂碼的情況,確保數(shù)據(jù)抓取的準(zhǔn)確性。

PHP Simple HTML DOM 抓取開啟緩存的網(wǎng)站返回亂碼的解決方案 PHP Simple HTML DOM 抓取開啟緩存的網(wǎng)站返回亂碼的解決方案

16 Aug 2025

本文針對使用 PHP Simple HTML DOM 庫抓取開啟緩存的網(wǎng)站時,出現(xiàn)首次抓取正常,後續(xù)抓取返回亂碼的問題,提供了一種基於 cURL 並設(shè)置 CURLOPT_ACCEPT_ENCODING 的解決方案,以及使用 gzdecode() 函數(shù)進行解碼的思路,幫助開發(fā)者解決類似問題。

如何在 Linux 上建立和使用動態(tài)共用 C 類別庫? 如何在 Linux 上建立和使用動態(tài)共用 C 類別庫?

05 Dec 2024

在 Linux 上建立和使用動態(tài)共用 C 類別庫建立共用類別庫要建立共用 C 類別庫,您可以依照...

為什麼無法在字段初始化程序中初始化非靜態(tài)字段? 為什麼無法在字段初始化程序中初始化非靜態(tài)字段?

03 Jan 2025

了解欄位初始化問題在您的程式碼中,您有一個儲存庫類別 (DinnerRepository) 和一個服務(wù)類別 (Service),它使用...

See all articles