分享PHP源碼批量抓取遠(yuǎn)程網(wǎng)頁圖片并保存到本地的實(shí)現(xiàn)方法
做為一個(gè)仿站工作者,當(dāng)遇到網(wǎng)站有版權(quán)時(shí)甚至加密的時(shí)候,WEBZIP也熄火,怎么扣取網(wǎng)頁上的圖片和背景圖片呢。有時(shí)候,可能會想到用火狐,這款瀏覽器好像一個(gè)強(qiáng)大的BUG,文章有版權(quán),屏蔽右鍵,火狐絲毫也不會被影響。
但是作為一個(gè)熱愛php的開發(fā)者來說,更多的是喜歡自己動手。所以,我就寫出了下面的一個(gè)源碼,php遠(yuǎn)程抓取圖片小程序??梢宰x取css文件并抓取css代碼中的背景圖片,下面這段代碼也是針對抓取css中圖片而編寫的。
<?php
header("Content-Type: text/html; charset=utf-8");
error_reporting(E_ERROR|E_WARNING);
//全局配置
$fromFile = "aaa.css"; //要抓取的文件
$savePath = "ttttttttt"; //保存路徑
$fromDomain = "http://www.xxx.com/"; //要抓取的域名
//讀取css樣式并且分離出所有image的url
$str = file_get_contents($fromFile);
$strArr = explode("url(",$str);
$i = 0;
foreach($strArr as $val){
$val1 = explode(")",$val);
if(strpos($val1[0],'jpg')||strpos($val1[0],'png')||strpos($val1[0],'gif'))
$imgUrl[$i++] = $val1[0];
}
//PS:上面可以用正則的,但是我覺得這樣也不錯(cuò)
//開始抓取
foreach($imgUrl as $url){
if($url=="") continue;
$filename = $savePath.$url;
$url = $fromDomain.$url;
getImage($url,$filename);
}
function getImage($url,$filename){
ob_start();
$context = stream_context_create(
array (
'http' => array (
'follow_location' => false // don't follow redirects
)
)
);
//請確保php.ini中的fopen wrappers已經(jīng)激活
readfile( $url,false,$context);
$img = ob_get_contents();
ob_end_clean();
$fp2 = @fopen($filename,"a");
fwrite($fp2,$img);
fclose($fp2);
echo $filename." ok √<br/>";
}
?>
然后沒有意外的話,你會發(fā)現(xiàn),你指定的文件夾下面已經(jīng)滿滿的都是圖片了,哈哈..
ps:php獲取遠(yuǎn)程圖片并下載保存到本地
分享一個(gè)利用php獲取遠(yuǎn)程圖片并將遠(yuǎn)程圖片下載保存到本地的函數(shù)代碼:
/*
*功能:php完美實(shí)現(xiàn)下載遠(yuǎn)程圖片保存到本地
*參數(shù):文件url,保存文件目錄,保存文件名稱,使用的下載方式
*當(dāng)保存文件名稱為空時(shí)則使用遠(yuǎn)程文件原來的名稱
*/
function getImage($url,$save_dir='',$filename='',$type=0){
if(trim($url)==''){
return array('file_name'=>'','save_path'=>'','error'=>1);
}
if(trim($save_dir)==''){
$save_dir='./';
}
if(trim($filename)==''){//保存文件名
$ext=strrchr($url,'.');
if($ext!='.gif'&&$ext!='.jpg'){
return array('file_name'=>'','save_path'=>'','error'=>3);
}
$filename=time().$ext;
}
if(0!==strrpos($save_dir,'/')){
$save_dir.='/';
}
//創(chuàng)建保存目錄
if(!file_exists($save_dir)&&!mkdir($save_dir,0777,true)){
return array('file_name'=>'','save_path'=>'','error'=>5);
}
//獲取遠(yuǎn)程文件所采用的方法
if($type){
$ch=curl_init();
$timeout=5;
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
$img=curl_exec($ch);
curl_close($ch);
}else{
ob_start();
readfile($url);
$img=ob_get_contents();
ob_end_clean();
}
//$size=strlen($img);
//文件大小
$fp2=@fopen($save_dir.$filename,'a');
fwrite($fp2,$img);
fclose($fp2);
unset($img,$url);
return array('file_name'=>$filename,'save_path'=>$save_dir.$filename,'error'=>0);
}
以上內(nèi)容是小編給大家分享的PHP源碼批量抓取遠(yuǎn)程網(wǎng)頁圖片并保存到本地的實(shí)現(xiàn)方法,希望大家喜歡。
相關(guān)文章
php中simplexml_load_string使用實(shí)例分享
這篇文章主要介紹了php中simplexml_load_string使用實(shí)例,需要的朋友可以參考下2014-02-02
安裝PHP擴(kuò)展時(shí)解壓官方 tgz 文件后沒有configure文件無法進(jìn)行配置編譯的問題
這篇文章主要介紹了安裝PHP擴(kuò)展時(shí)解壓官方 tgz 文件后沒有configure文件無法進(jìn)行配置編譯的問題,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2020-08-08
PHP+FastCGI+Nginx配置PHP運(yùn)行環(huán)境
Nginx不支持對外部程序的調(diào)用,所以必須通過FastCGI接口實(shí)現(xiàn)對外部程序的調(diào)用從而實(shí)現(xiàn)對客戶端動態(tài)頁面請求的處理。2014-08-08
詳解Yii2高級版引入bootstrap.js的一個(gè)辦法
本篇文章主要介紹了詳解Yii2高級版引入bootstrap.js的一個(gè)辦法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。2017-03-03
php設(shè)計(jì)模式之備忘模式分析【星際爭霸游戲案例】
這篇文章主要介紹了php設(shè)計(jì)模式之備忘模式,結(jié)合星際爭霸游戲案例形式分析了PHP備忘模式相關(guān)原理、使用技巧與操作注意事項(xiàng),需要的朋友可以參考下2020-03-03
淺析Yii2 GridView實(shí)現(xiàn)下拉搜索教程
這篇文章主要介紹了淺析Yii2 GridView實(shí)現(xiàn)下拉搜索教程的相關(guān)資料,需要的朋友可以參考下2016-04-04
PHP SPL標(biāo)準(zhǔn)庫之接口(Interface)詳解
這篇文章主要介紹了PHP SPL標(biāo)準(zhǔn)庫之接口(Interface)詳解,本文分別講解了Coutable接口、OuterIterator接口、RecursiveIterator接口、SeekableIterator接口、SplObserver和SplSubject接口等內(nèi)容,需要的朋友可以參考下2015-05-05
CodeIgniter配置之routes.php用法實(shí)例分析
這篇文章主要介紹了CodeIgniter配置之routes.php用法,結(jié)合實(shí)例形式分析了routes.php中常用配置參數(shù)的含義及具體使用技巧,需要的朋友可以參考下2016-01-01

