Asp.Net、asp實現(xiàn)的搜索引擎網(wǎng)址收錄檢查程序
使用asp.net或者asp檢查某個url地址,某篇文章是否被搜索引擎,如百度,谷歌,搜狗收錄。
實現(xiàn)原理:直接搜索你那篇文章的url地址(不帶協(xié)議,但上協(xié)議也行,代碼會自動去掉協(xié)議內(nèi)容),如果被索引會返回搜索結(jié)果,否則會提示找不到信息。
Asp.Net檢查百度,谷歌,搜狗搜索引擎是否收錄文章網(wǎng)址源代碼:
using System;
using System.Net;
using System.Text;
using System.IO;
using System.Web;
public class SearchEngineIndex
{
public static string[] urls = { //搜索引擎檢查地址
"http://www.baidu.com/s?ie=utf-8&wd=",//百度索引url檢查地址
"https://www.google.com.hk/search?q=",//谷歌索引url檢查地址
"http://www.sogou.com/web?ie=utf8&query="http://搜狗索引url檢查地址
}
, noFindKeyword = { "抱歉,沒有找到與", "找不到和您的查詢", "未收錄?" };//搜索引擎未索引url地址時的關(guān)鍵字
/// <summary>
/// 獲取響應(yīng)的編碼
/// </summary>
/// <param name="contenttype"></param>
/// <returns></returns>
private static Encoding GetEncoding(string contenttype)
{
if (!string.IsNullOrEmpty(contenttype))
{
contenttype = contenttype.ToLower();
if (contenttype.IndexOf("gb2312") != -1 || contenttype.IndexOf("gbk") != -1) return Encoding.GetEncoding(936);
if (contenttype.IndexOf("big5") != -1) return Encoding.GetEncoding(950);
}
return Encoding.UTF8;
}
/// <summary>
/// 使用HttpWebRequest對象,自動識別字符集
/// </summary>
/// <param name="url"></param>
/// <param name="addUseragent">是否添加UserAgent,采集其他網(wǎng)站時防止被攔截</param>
/// <returns></returns>
public static string GetHtml(string url, bool addUseragent)
{
HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(url);
if (addUseragent) request.UserAgent = "Googlebot|Feedfetcher-Google|Baiduspider";
string html = null;
try
{
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
StreamReader srd = new StreamReader(response.GetResponseStream(), GetEncoding(response.ContentType));
html = srd.ReadToEnd();
srd.Close();
response.Close();
}
catch { }
return html;
}
/// <summary>
/// 檢查某個url是否被搜索引擎索引
/// </summary>
/// <param name="url">url地址</param>
/// <param name="engin">0:百度 1:谷歌 2:搜狗,其他搜索引擎如bing和360直接查網(wǎng)址顯示的結(jié)果不是直接得到網(wǎng)址的,有些出入,不做檢查</param>
/// <returns></returns>
public static bool CheckIndex(string url, int engin)
{
if (string.IsNullOrEmpty(url)) return false;
if (engin < 0 || engin > 2) engin = 0;
url = urls[engin] + HttpUtility.UrlEncode(url.ToLower().Replace("http://", "").Replace("https://", ""));
bool r = true;
string html = GetHtml(url, true);
if (html == null || html.IndexOf(noFindKeyword[engin]) != -1) r = false;
return r;
}
}
//調(diào)用方法示例
SearchEngineIndex.CheckIndex("www.dhdzp.com/article/20101014/2902.aspx", 0);//檢查百度索引
SearchEngineIndex.CheckIndex("www.dhdzp.com/article/20101014/2902.aspx", 1);//檢查谷歌索引
SearchEngineIndex.CheckIndex("www.dhdzp.com/article/20101014/2902.aspx", 2);//檢查搜狗索引
Asp檢查百度,谷歌,搜狗搜索引擎是否收錄文章網(wǎng)址源代碼:
<%
class SearchEnginIndex
dim urls,noFindKeyword
private sub Class_Initialize
'百度,谷歌,搜狗url地址索引查詢地址
urls=array("http://www.baidu.com/s?ie=utf-8&wd=","https://www.google.com.hk/search?q=","http://www.sogou.com/web?ie=utf8&query=")
'搜索引擎未索引url地址時的關(guān)鍵字
NoFindKeyword=array("抱歉,沒有找到與", "找不到和您的查詢", "未收錄?")
End sub
private function GetEncoding(contenttype)
contenttype=lcase(contenttype)
if instr(contenttype,"gb2312")<>0 and instr(contenttype,"gbk")<>0 then
GetEncoding="gb2312"
elseif instr(contenttype,"big5")<>0 then
GetEncoding="big5"
else
GetEncoding="utf-8"
end if
end function
private function BinToString(bin,encoding)'將2進制流數(shù)據(jù)依據(jù)編碼轉(zhuǎn)為對應(yīng)的字符串內(nèi)容
dim obj
set obj=Server.CreateObject("Adodb.Stream")
obj.Type=1:obj.Mode=3:obj.Open
obj.Write bin
obj.Position=0:obj.Type=2:obj.Charset=encoding
BinToString=obj.ReadText
obj.Close:set obj=nothing
end function
public function GetHtml(url)
dim xhr
set xhr=server.CreateObject("microsoft.xmlhttp")
xhr.open "get",url,false
xhr.send
encoding=GetEncoding(xhr.getResponseHeader("content-type"))
response.CharSet=encoding
GetHtml=BinToString(xhr.responsebody,encoding)
set xhr=nothing
end function
public function CheckIndex(url,engin)
if len(url)=0 then exit function
if engin<0 or engin>2 then engin=1
url=urls(engin)&server.URLEncode(url)
dim html
html=GetHtml(url)
CheckIndex=instr(html,NoFindKeyword(engin))=0
End function
end Class
set sei=new SearchEnginIndex
response.Write sei.CheckIndex("www.dhdzp.com/article/20101014/2902.aspx",0)'百度索引
response.Write sei.CheckIndex("www.dhdzp.com/article/20101014/2902.aspx",1)'谷歌索引
response.Write sei.CheckIndex("www.dhdzp.com/article/20101014/2902.aspx",2)'搜狗索引
set sei=nothing
%>
相關(guān)文章
詳解Spring Boot 中使用 Java API 調(diào)用 lucene
這篇文章主要介紹了詳解Spring Boot 中使用 Java API 調(diào)用 lucene,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-11-11
在.NET?MAUI應(yīng)用中配置應(yīng)用生命周期事件
本文詳細(xì)講解了在.NET?MAUI應(yīng)用中配置應(yīng)用生命周期事件的方法,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-03-03
sql server中批量插入與更新兩種解決方案分享(asp.net)
xml和表值函數(shù)的相對復(fù)雜些這里簡單貼一下bcp和SqlDataAdapter進行批量跟新插入方法,未經(jīng)整理還望見諒2012-05-05
TreeView無刷新獲取text及value實現(xiàn)代碼
這篇文章介紹了TreeView無刷新獲取text及value實現(xiàn)代碼,有需要的朋友可以參考一下2013-10-10
在.NET Core中用最原生的方式讀取Nacos的配置方法(推薦)
這篇文章主要介紹了在.NET Core中用最原生的方式讀取Nacos的配置方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-04-04
ASP.NET MVC中為DropDownListFor設(shè)置選中項的方法
這篇文章主要介紹了ASP.NET MVC中為DropDownListFor設(shè)置選中項的方法,需要的朋友可以參考下2014-10-10
MVC HtmlHelper擴展類(PagingHelper)實現(xiàn)分頁功能
這篇文章主要為大家詳細(xì)介紹了MVC HtmlHelper擴展,實現(xiàn)分頁功能,具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-05-05
MVC+Bootstrap+Drapper使用PagedList.Mvc支持多查詢條件分頁
這篇文章主要介紹了MVC+Bootstrap+Drapper使用PagedList.Mvc支持多查詢條件分頁,需要的朋友可以參考下2017-05-05

