IT貓撲網(wǎng):您身邊最放心的安全下載站! 最新更新|軟件分類|軟件專題|手機版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當前所在位置: 首頁網(wǎng)絡(luò)編程PHP編程 → 如何使用PHP服務(wù)端代理抓取網(wǎng)頁內(nèi)容

如何使用PHP服務(wù)端代理抓取網(wǎng)頁內(nèi)容

時間:2015-06-28 00:00:00 來源:IT貓撲網(wǎng) 作者:網(wǎng)管聯(lián)盟 我要評論(0)

最近公司暫時斷開外網(wǎng),只開放公司自己所有的站點允許訪問,說實在的,做WEB開發(fā)的斷網(wǎng),真是讓人哭笑不得......

由于需要查找資料,只好簡單寫了一個PHP的服務(wù)端代理頁面來用一下!

簡單框架頁面:

以下為引用的內(nèi)容:
















PHP代理頁面:

      1. 以下為引用的內(nèi)容:

        //使用Snoopy的抓頁功能
        include "Snoopy.class.php";
        //目標URL
        $url = $_REQUEST['targeturl'];
        //將所有傳遞過來的參數(shù)列出來
        $par = array();
        $GetPost = array_merge($_POST,$_GET);
        foreach($GetPost As $Key=>$Value){
        ?if($Key!='targeturl'){
        ? $Value = str_replace("%25","%",$Value);
        ? array_push($par,($Key . "=" . $Value));
        ?}
        }
        //判斷目標URL是否帶有?(即是否帶有參數(shù))
        $cc = strpos($url,"?") ? "&" : "?";
        //重組URL
        $geturl = !$par ? $url : $url.$cc.implode("&",$par);
        //抓取重組后的URL頁面內(nèi)容
        $snoopy = new Snoopy;
        $snoopy->fetch($geturl);
        //替換目標內(nèi)容中腳本里有可能替換父窗口地址的代碼
        $org = str_replace("top.location","top.title",$snoopy->results);
        //嘗試轉(zhuǎn)換目標內(nèi)容編碼到UTF-8
        $opt = iconv("gbk","utf-8",$org);
        //判斷目標內(nèi)容編碼為GBK或UTF-8
        $ec = strlen($opt)?"gbk":"utf-8";

        ?>

        相關(guān)閱讀

        文章評論
        發(fā)表評論

        熱門文章 plsql developer怎么連接數(shù)據(jù)庫-plsql developer連接數(shù)據(jù)庫方法 plsql developer怎么連接數(shù)據(jù)庫-plsql developer連接數(shù)據(jù)庫方法 2021年最好用的10款php開發(fā)工具推薦 2021年最好用的10款php開發(fā)工具推薦 php利用淘寶IP庫獲取用戶ip地理位置 php利用淘寶IP庫獲取用戶ip地理位置 在 PHP 中使用命令行工具 在 PHP 中使用命令行工具

        相關(guān)下載

        人氣排行 詳解ucenter原理及第三方應(yīng)用程序整合思路、方法 plsql developer怎么連接數(shù)據(jù)庫-plsql developer連接數(shù)據(jù)庫方法 PHP中防止SQL注入攻擊 PHP會話Session的具體使用方法解析 PHP運行出現(xiàn)Notice : Use of undefined constant 的解決辦法 PHP如何清空mySQL數(shù)據(jù)庫 CakePHP程序員必須知道的21條技巧 PHP采集圖片實例(PHP采集)