PHP判斷搜索引擎蜘蛛并自動(dòng)記憶到文件的代碼
更新時(shí)間:2012年02月04日 14:51:18 作者:
為了記憶百度蜘蛛的行蹤,寫了以下的PHP函數(shù),分兩個(gè)函數(shù),一個(gè)是判斷蜘蛛名稱,一個(gè)是記憶蜘蛛到文件,可以自己看一下
復(fù)制代碼 代碼如下:
function write_naps_bot(){
$useragent=get_naps_bot();
// echoExit($useragent);
if ($useragent=="false") return FALSE ;
date_default_timezone_set("Asia/Shanghai");
$date=date("Y-m-d H:i:s");
$ip=$_SERVER[REMOTE_ADDR];
$url="http://".$_SERVER[HTTP_HOST].$_SERVER[REQUEST_URI];
// echoExit($url);轉(zhuǎn)載注明www.chhua.com
if (!file_exists("./log/bot.html")){
$botfile=fopen("./log/bot.html", "w");
$fileHeader="<head>
<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />
<title>訪問查看</title>
</head>
<a href=\"../?action=delbot\">刪除日志</a><hr>
";
// echoExit($botfile);轉(zhuǎn)載注明www.chhua.com
fputs($botfile, $fileHeader);
fclose($botfile);
}else
{ $filesize=filesize("./log/bot.html");
if ($filesize>=100000){
$botfile=fopen("./log/bot.html", "w");
$fileHeader="<head>
<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />
<title>訪問查看</title>
</head>
<a href=\"../?action=delbot\">刪除日志</a><hr>
";
fputs($botfile, $fileHeader);
fclose($botfile);
}else {
$botfile=fopen("./log/bot.html", "a+");
}
//$size="<b>當(dāng)前文件大小為:</b>".$filesize."<br>";轉(zhuǎn)載注明www.chhua.com
$useragent="<b>USER:</b>".$useragent."<Br>";
$date="<b>TIME:</b>".$date."<Br>";
$ip="<b>IP:</b>".$ip."<Br>";
$url="<b>URL:</b><a href='$url' target='_blank'>".$url."</a><Br><Br>";
$fileStr=$useragent.$date.$ip.$url;
fputs($botfile, $fileStr);
fclose($botfile);
}
}
function get_naps_bot() {
$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
if(strpos($useragent, 'googlebot') !== false){
return '<font color=blue>Googlebot</font>';
}
if(strpos($useragent, 'msnbot') !== false){
return 'MSNbot';
}
if(strpos($useragent, 'slurp') !== false){
return '<font color=green>Yahoobot</font>';
}
if(strpos($useragent, 'baiduspider') !== false){
return '<font color=red>Baiduspider</font>';
}
if(strpos($useragent, 'sohu-search') !== false){
return 'Sohubot';
}
if(strpos($useragent, 'lycos') !== false){
return 'Lycos';
}
if(strpos($useragent, 'robozilla') !== false){
return 'Robozilla';
}
return "false";
}
您可能感興趣的文章:
- PHP寫的獲取各搜索蜘蛛爬行記錄代碼
- php 判斷訪客是否為搜索引擎蜘蛛的函數(shù)代碼
- PHP屏蔽蜘蛛訪問代碼及常用搜索引擎的HTTP_USER_AGENT
- 用php實(shí)現(xiàn)讓頁(yè)面只能被百度gogole蜘蛛訪問的方法
- 發(fā)款php蜘蛛統(tǒng)計(jì)插件只要有mysql就可用
- 使用PHP實(shí)現(xiàn)蜘蛛訪問日志統(tǒng)計(jì)
- PHP判斷來(lái)訪是搜索引擎蜘蛛還是普通用戶的代碼小結(jié)
- 發(fā)款php蜘蛛統(tǒng)計(jì)插件只要有mysql就可用
- 根據(jù)user-agent判斷蜘蛛代碼黑帽跳轉(zhuǎn)代碼(js版與php版本)
- 利用php抓取蜘蛛爬蟲痕跡的示例代碼
相關(guān)文章
php中3種方法統(tǒng)計(jì)字符串中每種字符的個(gè)數(shù)并排序
3種方法,統(tǒng)計(jì)字符串中每種字符的個(gè)數(shù)并排序,多種解法喲~ str_split()函數(shù)很重要2012-08-08
PHP調(diào)用QQ互聯(lián)接口實(shí)現(xiàn)QQ登錄網(wǎng)站功能示例
這篇文章主要介紹了PHP調(diào)用QQ互聯(lián)接口實(shí)現(xiàn)QQ登錄網(wǎng)站功能,結(jié)合實(shí)例形式分析php調(diào)用QQ互聯(lián)接口實(shí)現(xiàn)QQ登錄網(wǎng)站的相關(guān)操作技巧,需要的朋友可以參考下2019-10-10
php過(guò)濾htmlspecialchars() 函數(shù)實(shí)現(xiàn)把預(yù)定義的字符轉(zhuǎn)換為 HTML 實(shí)體用法分析
這篇文章主要介紹了php過(guò)濾htmlspecialchars() 函數(shù)實(shí)現(xiàn)把預(yù)定義的字符轉(zhuǎn)換為 HTML 實(shí)體用法,結(jié)合實(shí)例形式分析了htmlspecialchars()函數(shù)針對(duì)HTML進(jìn)行字符轉(zhuǎn)義的相關(guān)操作技巧,需要的朋友可以參考下2019-06-06
PHP解析目錄路徑的3個(gè)函數(shù)總結(jié)
這篇文章主要介紹了PHP解析目錄路徑的3個(gè)函數(shù)總結(jié),本文總結(jié)了basename、dirname、pathinfo3個(gè)函數(shù),它們分別處理路徑的不同部分,需要的朋友可以參考下2014-11-11
php基于socket實(shí)現(xiàn)SMTP發(fā)送郵件的方法
這篇文章主要介紹了php基于socket實(shí)現(xiàn)SMTP發(fā)送郵件的方法,實(shí)例分析了php采用socket實(shí)現(xiàn)smtp發(fā)送郵件的原理與技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-03-03
現(xiàn)在很多網(wǎng)站都存在跨站腳本攻擊漏洞,讓黑客有機(jī)可乘.跨站攻擊很容易就可以構(gòu)造,而且非常隱蔽,不易被查覺(通常盜取信息后馬上跳轉(zhuǎn)回原頁(yè)面)。如何攻擊,在此不作介紹,主要談?wù)勅绾畏婪丁?/div> 2015-09-09
php實(shí)現(xiàn)數(shù)組按拼音順序排序的方法
這篇文章主要介紹了php實(shí)現(xiàn)數(shù)組按拼音順序排序的方法,涉及php漢字與拼音的轉(zhuǎn)換及數(shù)組遍歷、排序相關(guān)操作技巧,需要的朋友可以參考下2017-05-05最新評(píng)論

