mysql中使用sphinx搜索子域名需注意的問題
搜索子域名
比如搜索jb51.net會把www.dhdzp.com、jb51.net、host.jb51.net等都搜索出來。
如果使用mysql用like的話效率是非常低的,幾百萬甚至上千萬的數(shù)據(jù)那是沒有辦法使用的,于是采取sphinx來做。
在使用的過程中發(fā)現(xiàn)了諸多問題,這里將其總結(jié)起來,也讓不知道的朋友注意下這些字符。
分析:
sphinx是全文索引,它搜索的是包含的記錄。
首先如果我們不做任何設(shè)置的話,搜索jb51.net會出現(xiàn)把a(bǔ)ajb51.net、jb51.a.cn、jb51.net.com(當(dāng)然這個域名后綴不存在,但是會有符合相應(yīng)規(guī)則的域名,這里只舉例)等等。
為什么會出現(xiàn)這種情況呢?
我們使用./search -c 配置文件 -i 索引名 'jb51.net' 搜索的時候會發(fā)現(xiàn)下面words部分被分成了兩部分'jb51'和'cn',默認(rèn)以.作為分隔符,如果我們不想讓它做為分隔符,就需要把.添加到charset_table里面,這里需要說的是我們搜索域名只需要有字母、數(shù)字、"-"等字符,其他的不需要。設(shè)置如下:
charset_table = 0..9,A..Z->a..z, a..z,U+002e,U+002d,U+0040,U+0060 #其中U+002e代表".",U+002d代表"-",U+0040代表"@",U+0060代表"`",這里為ascii碼值。
這樣會解決掉搜出jb51.a.cn這類域名。
那么jb51.net.com這類呢?我們可以在索引的字段中增加惟一后綴比如“XXXXX”,concat(search,'XXXXX')這樣,就不會出來了。
現(xiàn)在就剩下aajb51.net這類域名,我們使用關(guān)鍵字“ '".jb51.net"' ”(注意是單引號里面套雙引號)這樣來搜索,主域名單獨加上,但是使用的過程中發(fā)現(xiàn)這樣搜出了與這個域名無關(guān)的域名,比如aa.bb.cn這樣,經(jīng)后來研究是"."的問題,后來把"."替換成"@",來搜索又出現(xiàn)12306等好多域名無法讀取到的問題,后來經(jīng)研究估計這些特殊字符在sphinx中都有特殊的意義,于是找到了"`"這個字符,換成這個以后一切才算正常了。
注意:將"."替換成"`"等相應(yīng)字符后需在charset_table里增加這個字符,不然是被忽略的。
所以在搜索的過程中我們需要注意下這些特殊字符。
- Mysql全文搜索match against的用法
- mysql 模糊搜索的方法介紹
- Mysql Binlog快速遍歷搜索記錄及binlog數(shù)據(jù)查看的方法
- mysql全文搜索 sql命令的寫法
- mysql 搜索之簡單應(yīng)用
- php利用scws實現(xiàn)mysql全文搜索功能的方法
- php mysql like 實現(xiàn)多關(guān)鍵詞搜索的方法
- 詳細(xì)介紹基于MySQL的搜索引擎MySQL-Fullltext
- mysql 全文搜索 技巧
- MySQL多層級結(jié)構(gòu)-樹搜索介紹
- 在MySQL中使用Sphinx實現(xiàn)多線程搜索的方法
- MySQL高效模糊搜索之內(nèi)置函數(shù)locate instr position find_in_set使用詳解
相關(guān)文章
mysql zip archive 版本(5.7.19)安裝教程詳細(xì)介紹
這篇文章主要介紹了mysql zip archive 版本(5.7.19)安裝教程詳細(xì)介紹,需要的朋友可以參考下2017-10-10
解決windows下mysql8修改my.ini設(shè)置datadir后無法啟動問題
在修改MySQL的my.ini文件以更改數(shù)據(jù)目錄后,可能會遇到無法啟動的問題,這通常是因為字符編碼被改變或新路徑權(quán)限不足,正確的做法是備份my.ini文件,確保使用ANSI字符編碼修改datadir,并確保新路徑有足夠的權(quán)限,特別是SYSTEM或NETWORKSERVICE權(quán)限2025-01-01
為什么MySQL數(shù)據(jù)庫索引選擇使用B+樹?
今天小編就為大家分享一篇關(guān)于為什么MySQL數(shù)據(jù)庫索引選擇使用B+樹?,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-03-03

