17370845950

mysql如何使用全文索引
MySQL全文索引通过MATCH()...AGAINST()语法在CHAR、VARCHAR、TEXT字段上实现高效关键词搜索,支持自然语言和布尔模式,需配合ngram解析器处理中文分词,并定期优化表以提升性能。

MySQL 中的全文索引(FULLTEXT)主要用于在文本字段中高效地进行关键词搜索,特别适用于 MyISAMInnoDB 存储引擎(InnoDB 从 MySQL 5.6 开始支持)。它比 LIKE 配合 % 更高效,尤其在大数据量下表现更优。

1. 创建全文索引

你可以在创建表时或对已有表添加全文索引。

创建表时添加:
CREATE TABLE articles (
    id INT PRIMARY KEY AUTO_INCREMENT,
    title VARCHAR(200),
    content TEXT,
    FULLTEXT (title, content) -- 对 title 和 content 建立全文索引
) ENGINE=InnoDB;

对已有表添加:

ALTER TABLE articles ADD FULLTEXT(title, content);

也可以只对单个字段建立全文索引。

2. 使用 MATCH() AGAINST() 查询

全文索引必须配合 MATCH() ... AGAINST() 语法使用,不能用普通的 WHERE 条件。

基本用法(自然语言模式):
SELECT * FROM articles 
WHERE MATCH(title, content) AGAINST('数据库教程' IN NATURAL LANGUAGE MODE);

上面语句会查找包含“数据库”或“教程”关键词的记录,按相关性排序。

布尔模式(支持逻辑操作):

SELECT * FROM articles 
WHERE MATCH(title, content) AGAINST('+数据库 -mysql' IN BOOLEAN MODE);
  • +数据库:必须包含“数据库”
  • -mysql:不能包含“mysql”
  • 不加符号表示可选词
  • 可用 * 做前缀匹配,如 '数据*' 可匹配“数据库”“数据结构”等

3. 注意事项与限制

  • 全文索引仅支持 CHAR、VARCHAR 和 TEXT 类型字段
  • 查询关键词默认长度至少 4 个字符(可通过 ft_min_word_len 配置修改)
  • 英文按单词分词,中文需借助外部工具或使用支持中文分词的插件(如 ngram)
  • MySQL 原生不支持中文分词,建议启用 ngram 解析器处理中文

启用 ngram 支持中文(配置示例):

-- 在 my.cnf 中设置
[mysqld]
ngram_token_size=2

-- 创建索引时自动使用 ngram CREATE FULLTEXT INDEX idx_content ON articles(content) WITH PARSER ngram;

4. 提高查询效率的小技巧

  • 避免在短词(如“的”“是”)上搜索,它们通常被停用词表忽略
  • 可通过查看结果的相关性得分优化排序:
    SELECT *, MATCH(title, content) AGAINST('数据库') AS score 
    FROM articles 
    WHERE MATCH(title, content) AGAINST('数据库');
    
  • 定期优化表以维护索引性能:OPTIMIZE TABLE articles;

基本上就这些。全文索引适合做简单的关键词检索,复杂搜索建议结合 Elasticsearch 等专用搜索引擎。