Mysql全文搜索match against的用法

全文檢索在 MySQL 中就是一個 FULLTEXT 類型索引。FULLTEXT 索引用于 MyISAM 表,可以在 CREATE TABLE 時或之后使用 ALTER TABLE 或 CREATE INDEX 在 CHAR、 VARCHAR 或 TEXT 列上創建

對于大的數據庫,將數據裝載到一個沒有 FULLTEXT 索引的表中,然后再使用 ALTER TABLE (或 CREATE INDEX) 創建索引,這將是非??斓?。將數據裝載到一個已經有 FULLTEXT 索引的表中,將是非常慢的。
1.使用Mysql全文檢索fulltext的先決條件
表的類型必須是MyISAM
建立全文檢索的字段類型必須是char,varchar,text

2.建立全文檢索先期配置
由于Mysql的默認配置是索引的詞的長度是4,所以要支持中文單字的話,首先更改這個.
*Unix用戶要修改my.cnf,一般此文件在/etc/my.cnf,如果沒有找到,先查找一下find / -name ‘my.cnf’
在 [mysqld] 位置內加入:
ft_min_word_len = 2
其它屬性還有
ft_wordlist_charset = gbk
ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt
ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt
稍微解釋一下:
ft_wordlist_charset 表示詞典的字符集, 目前支持良好的有(UTF-8, gbk, gb2312, big5)
ft_wordlist_file 是詞表文件, 每行包括一個詞及其詞頻(用若干制表符或空格分開,消岐專用)
ft_stopword_file 表示過濾掉不索引的詞表, 一行一個.
ft_min_word_len 加入索引的詞的最小長度, 缺省是 4, 為了支持中文單字故改為 2

3.建立全文檢索
在建表中用FullText關鍵字標識字段,已存在的表用 ALTER TABLE (或 CREATE INDEX) 創建索引
CREATE fulltext INDEX index_name ON table_name(colum_name);

4.使用全文檢索
在SELECT的WHERE字句中用MATCH函數,索引的關鍵詞用AGAINST標識,IN BOOLEAN MODE是只有含有關鍵字就行,不用在乎位置,是不是起啟位置.
SELECT * FROM articles WHERE MATCH (tags) AGAINST (‘旅游’ IN BOOLEAN MODE);

5.詳細的說明請參數Mysql官方網站

這是Mysql 5.1的,不過4.X也可以做為參考,基本一置.我用的就是Mysql 4.1.

MySQL全文索引與中文分詞總結及一般的關鍵詞搜索流程

mysql 全文檢索 中文分詞

支持中文的MySQL 5.1+ 全文檢索分詞插件

家用一下搜索引擎就會發現,分詞的情況只是出現在當整詞命中為0的情況下。
而具體怎樣分詞,大家可以參考一下baidu搜索試驗結果:

·如果搜“徐祖寧寧”,結果為“徐祖”+“寧寧”。(搜人名的情況下,它可能有一個百家姓詞典,自動將姓后第一個字歸前)
·搜“徐寧愿”,結果為“徐寧愿”。(說明“寧愿”歸“徐”所有。同上。因為徐是姓。)
·搜“徐祖寧愿”,結果為“徐祖”+“寧愿”。(因為“寧愿”是詞,故“徐”只帶“祖”。)
·搜“徐祖寧高”,結果為“徐祖寧”。(因為“寧高”不是關鍵字,所以“寧”歸前詞所有。而“高”可能因為是單字,為提高前詞搜索效率故被省略。)

? 版權聲明
THE END
喜歡就支持一下吧
點贊10 分享