PHP統(tǒng)計(jì)nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑

更新時(shí)間：2014年06月30日 09:59:26 投稿：junjie

這篇文章主要介紹了PHP統(tǒng)計(jì)nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑,可以對每個(gè)搜索引擎單獨(dú)統(tǒng)計(jì),需要的朋友可以參考下

我在服務(wù)器上有每天切割nginx日志的習(xí)慣，所以針對每天各大搜索引擎來訪，總能記錄一些404頁面信息，傳統(tǒng)上我只是偶爾分析下日志，但是對于很多日志信息的朋友，人工來篩選可能不是一件容易的事情，這不我個(gè)人自己慢慢研究了一點(diǎn)點(diǎn)，針對谷歌、百度、搜搜、360搜索、宜搜、搜狗、必應(yīng)等搜索引擎的404訪問生成為一個(gè)txt文本文件，直接上代碼test.php。

復(fù)制代碼代碼如下:

<?php

//訪問test.php?s=google

$domain='http://www.dhdzp.com';

$spiders=array('baidu'=>'Baiduspider','360'=>'360Spider',

'google'=>'Googlebot','soso'=>'Sosospider','sogou'=>

'Sogou web spider','easou'=>'EasouSpider','bing'=>'bingbot');

$path='/home/nginx/logs/'.date('Y/m/').(date('d')-1).'/access_www.txt';

$s=$_GET['s'];

if(!array_key_exists($s,$spiders)) die();

$spider=$spiders[$s];

$file=$s.'_'.date('ym').(date('d')-1).'.txt';

if(!file_exists($file)){

    $in=file_get_contents($path);

    $pattern='/GET (.*) HTTP\/1.1" 404.*'.$spider.'/';

    preg_match_all ( $pattern , $in , $matches );

    $out='';

    foreach($matches[1] as $k=>$v){

        $out.=$domain.$v."\r\n";

    }

    file_put_contents($file,$out);

}

$url=$domain.'/silian/'.$file;

echo $url;

好就這樣了。沒有什么高深的技術(shù)，只有動(dòng)手寫的過程。

您可能感興趣的文章:

相關(guān)文章

今天小編就為大家分享一篇Laravel find in set排序?qū)嵗?，具有很好的參考價(jià)值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-10-10

基于PHP常用函數(shù)的用法詳解

本篇文章對PHP中的一些常用函數(shù)的用法進(jìn)行了詳細(xì)的分析介紹。需要的朋友參考下

2013-05-05

ThinkPHP菜單無極分類實(shí)例講解

這篇文章主要介紹了ThinkPHP菜單無極分類實(shí)例講解，文中將代碼列舉了出來，有感興趣的同學(xué)可以借鑒參考下

2021-03-03

微信公眾平臺(tái)實(shí)現(xiàn)獲取用戶OpenID的方法

這篇文章主要介紹了微信公眾平臺(tái)實(shí)現(xiàn)獲取用戶OpenID的方法,需要開發(fā)人員經(jīng)過微信授權(quán)后獲取高級接口才能使用此功能,用戶OpenID對于微信公眾平臺(tái)建設(shè)有著非常廣泛的用途,需要的朋友可以參考下

2015-04-04

Laravel框架模板繼承操作示例

這篇文章主要介紹了Laravel框架模板繼承操作,結(jié)合實(shí)例形式分析了Laravel框架模板繼承的實(shí)現(xiàn)方法及相關(guān)操作注意事項(xiàng),需要的朋友可以參考下

2018-06-06

PHP不使用遞歸的無限級分類簡單實(shí)例

下面小編就為大家?guī)硪黄狿HP不使用遞歸的無限級分類簡單實(shí)例。小編覺得挺不錯(cuò)的，現(xiàn)在就分享給大家，也給大家做個(gè)參考。一起跟隨小編過來看看吧

2016-11-11

ThinkPHP3.1新特性之查詢條件預(yù)處理簡介

相比于ThinkPHP3.0版本對數(shù)組方式的查詢條件會(huì)進(jìn)行安全過濾而不支持字符串條件的安全過濾的情況，ThinkPHP3.1版本則增加了對條件字符串進(jìn)行預(yù)處理的支持，讓ORM的安全性更加得以保證。這篇文章主要介紹了ThinkPHP3.1的查詢條件預(yù)處理,需要的朋友可以參考下

2014-06-06

Yii2中cookie用法示例分析

這篇文章主要介紹了Yii2中cookie用法,結(jié)合實(shí)例形式簡單分析了Yii2中cookie的設(shè)置、讀取、配置等相關(guān)操作技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下

2016-07-07

實(shí)例講解php數(shù)據(jù)訪問

這篇文章主要以實(shí)例講解的方式為大家詳細(xì)介紹了php數(shù)據(jù)訪問，數(shù)據(jù)訪問有兩種方式，本文為大家揭曉，感興趣的小伙伴們可以參考一下

2016-05-05

PHP中is_file()函數(shù)使用指南

php中is_file()函數(shù)是用來判斷文件是否存在，使用方法也非常的簡單，有需要的小伙伴可以參考下。

2015-05-05

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

PHP統(tǒng)計(jì)nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线 免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

PHP統(tǒng)計(jì)nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕