基于mysql全文索引的深入理解
前言:本文簡單講述全文索引的應(yīng)用實(shí)例,MYSQL演示版本5.5.24。
Q:全文索引適用于什么場合?
A:全文索引是目前實(shí)現(xiàn)大數(shù)據(jù)搜索的關(guān)鍵技術(shù)。
至于更詳細(xì)的介紹請自行百度,本文不再闡述。
--------------------------------------------------------------------------------
一、如何設(shè)置?
![]()
如圖點(diǎn)擊結(jié)尾處的{全文搜索}即可設(shè)置全文索引,不同MYSQL版本名字可能不同。
二、設(shè)置條件
1.表的存儲引擎是MyISAM,默認(rèn)存儲引擎InnoDB不支持全文索引(新版本MYSQL5.6的InnoDB支持全文索引)
2.字段類型:char、varchar和text
三、配置
my.ini配置文件中添加
# MySQL全文索引查詢關(guān)鍵詞最小長度限制
[mysqld]
ft_min_word_len = 1
保存后重啟MYSQL,執(zhí)行SQL語句
SHOW VARIABLES
查看ft_min_word_len是否設(shè)置成功,如果沒設(shè)置成功請確保
1.確認(rèn)my.ini正確配置,注意不要搞錯my.ini的位置
2.確認(rèn)mysql已經(jīng)重啟,實(shí)在不行重啟電腦
其他相關(guān)配置請自行百度。
注:重新設(shè)置配置后,已經(jīng)設(shè)置的索引需要重新設(shè)置生成索引
四、SQL語法
首先生成temp表
CREATE TABLE IF NOT EXISTS `temp` ( `id` int(11) NOT NULL AUTO_INCREMENT, `char` char(50) NOT NULL, `varchar` varchar(50) NOT NULL, `text` text NOT NULL, PRIMARY KEY (`id`), FULLTEXT KEY `char` (`char`), FULLTEXT KEY `varchar` (`varchar`), FULLTEXT KEY `text` (`text`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=2 ; INSERT INTO `temp` (`id`, `char`, `varchar`, `text`) VALUES (1, 'a bc 我 知道 1 23', 'a bc 我 知道 1 23', 'a bc 我 知道 1 23');
搜索`char`字段 'a' 值
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a')
但是你會發(fā)現(xiàn)查詢無結(jié)果?!
這時你也許會想:哎呀怎么回事,我明明按照步驟來做的啊,是不是那里漏了或者錯了?
你不要著急,做程序是這樣的,出錯總是有的,靜下心來,著急是不能解決問題的。
如果一個關(guān)鍵詞在50%的數(shù)據(jù)出現(xiàn),那么這個詞會被當(dāng)做無效詞。
如果你想去除50%的現(xiàn)在請使用IN BOOLEAN MODE搜索
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a' IN BOOLEAN MODE)
這樣就可以查詢出結(jié)果了,但是我們不推薦使用。
全文索引的搜索模式的介紹自行百度。
我們先加入幾條無用數(shù)據(jù)已解除50%限制
INSERT INTO `temp` ( `id` , `char` , `varchar` , `text` ) VALUES ( NULL , '7', '7', '7' ), ( NULL , '7', '7', '7' ), ( NULL , 'a,bc,我,知道,1,23', 'a,bc,我,知道,1,23', 'a,bc,我,知道,1,23' ), ( NULL , 'x', 'x', 'x' );
這時你執(zhí)行以下SQL語句都可以查詢到數(shù)據(jù)
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('bc');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('我');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('知道');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('1');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('23');
以下SQL搜索不到數(shù)據(jù)
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('b');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('c');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('知');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('道');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('2');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('3');
如果搜索多個詞,請用空格或者逗號隔開
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a x');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a,x');
上面的SQL都可以查詢到三條數(shù)據(jù)
五、分詞
看到這里你應(yīng)該發(fā)現(xiàn)我們字段里的值也是分詞,不能直接插入原始數(shù)據(jù)。
全文索引應(yīng)用流程:
1.接收數(shù)據(jù)-數(shù)據(jù)分詞-入庫
2.接收數(shù)據(jù)-數(shù)據(jù)分詞-查詢
現(xiàn)在有個重要的問題:怎么對數(shù)據(jù)分詞?
數(shù)據(jù)分詞一般我們會使用一些成熟免費(fèi)的分詞系統(tǒng),當(dāng)然如果你有能力也可以自己做分詞系統(tǒng),這里我們推薦使用SCWS分詞插件。
首先下載
1.php_scws.dll 注意對應(yīng)版本
2.XDB詞典文件
3.規(guī)則集文件
下載地址
安裝scws
1.先建一個文件夾,位置不限,但是最好不要中文路徑。
2.解壓{規(guī)則集文件},把xdb、三個INI文件全部扔到 D:\scws
3.把php_scws.dll復(fù)制到你的PHP目錄下的EXT文件夾里面
4.在 php.ini 的末尾加入以下幾行:
[scws]
;
; 注意請檢查 php.ini 中的 extension_dir 的設(shè)定值是否正確, 否則請將 extension_dir 設(shè)為空,
; 再把 php_scws.dll 指定為絕對路徑。
;
extension = php_scws.dll
scws.default.charset = utf8
scws.default.fpath = "D:\scws"
5.重啟你的服務(wù)器
測試
$str="測試中文分詞"; $so = scws_new(); $so->send_text($str); $temp=$so->get_result(); $so->close(); var_dump($temp);
如果安裝未成功,請參照官方說明文檔
--------------------------------------------------------------------------------
這樣我們就可以使用全文索引技術(shù)了。
相關(guān)文章
MySQL AUTO_INCREMENT 主鍵自增長的實(shí)現(xiàn)
本文主要介紹了MySQL AUTO_INCREMENT 主鍵自增長的實(shí)現(xiàn),每增加一條記錄,主鍵會自動以相同的步長進(jìn)行增長,具有一定的參考價(jià)值,感興趣的可以了解一下2023-11-11
解決mysql報(bào)錯ERROR 1049 (42000): Unknown dat
對于錯誤代碼1049(42000):Unknown database ‘?dāng)?shù)據(jù)庫‘,這個錯誤通常表示您正在嘗試訪問一個不存在的數(shù)據(jù)庫,本文給出了解決方法,您可以按照文中步驟進(jìn)行操作,需要的朋友可以參考下2024-01-01
使用MySQL實(shí)現(xiàn)高效的用戶昵稱模糊搜索
在大型系統(tǒng)中,用戶表中的昵稱字段需要支持高效的模糊搜索,并且必須處理包含特殊字符的查詢,本文將介紹一種在MySQL中實(shí)現(xiàn)高效模糊搜索的解決方案,能夠支持特殊字符,并且利用MySQL自身的全文索引機(jī)制來優(yōu)化搜索性能,需要的朋友可以參考下2024-05-05
Mysql 9.0.0創(chuàng)新MSI安裝的實(shí)現(xiàn)
本文提供了MySQL 9.0.0版本的MSI安裝方法,包括安裝前的下載鏈接,安裝過程中的選項(xiàng)介紹,以及安裝完成后的配置指南,具有一定的參考價(jià)值,感興趣的可以了解一下2024-10-10
MySQL快速復(fù)制數(shù)據(jù)庫數(shù)據(jù)表的方法
有些時候,我們?yōu)榱丝焖俅罱ㄒ粋€測試環(huán)境,或者說是克隆一個網(wǎng)站,需要復(fù)制已經(jīng)存在的mysql數(shù)據(jù)庫。下面小編給大家介紹mysql快速復(fù)制數(shù)據(jù)庫數(shù)據(jù)表的方法,小伙伴們跟著小編一起學(xué)習(xí)吧2015-10-10
解析SQL 表結(jié)構(gòu)信息查詢 含主外鍵、自增長
本篇文章是對SQL 表結(jié)構(gòu)信息查詢 含主外鍵、自增長進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06

