【该文章就是坑】mysql使用中文的全文索引（注意只有5.7.6以上的版本支持） - 查问我看

转【该文章就是坑】mysql使用中文的全文索引（注意只有5.7.6以上的版本支持）

PHPer 2020-04-08 2616 0 0

说是mysql5.7.6以上支持中文的全文索引，是不是说错了，我用5.7.21试试 20200408 0028
我用5.7.21 测了失败，然后安装了 mysql8.0.19，结果测试还是无结果array(0) { }，被坑了
$sql='select * from w_note where match(content) against("全文")';//全文搜索就有结果
$command = Yii::$app->db->createCommand($sql);
$res = $command->queryAll();
var_dump($res);die;

前言

其实全文检索在MySQL里面很早就支持了，只不过一直以来只支持英文。缘由是他从来都使用空格来作为分词的分隔符，而对于中文来讲，显然用空格就不合适，需要针对中文语义进行分词。这不，从MySQL 5.7开始，MySQL内置了ngram全文检索插件，用来支持中文分词，并且对MyISAM和InnoDB引擎有效。

在使用中文检索分词插件ngram之前，先得在MySQL配置文件里面设置他的分词大小，比如，

[mysqld]
ngram_token_size=2
这里把分词大小设置为2。要记住，分词的SIZE越大，索引的体积就越大，所以要根据自身情况来设置合适的大小。

示例表结构：

CREATE TABLE articles (
id INTUNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
titleVARCHAR(200),
body TEXT,
FULLTEXT (title,body) WITH PARSER ngram
) ENGINE=InnoDBCHARACTER SET utf8mb4;
示例数据，有6行记录。

mysql> select * from articles\G
**********************1. row **********************
id: 1
title: 数据库管理
body: 在本教程中我将向你展示如何管理数据库
**********************2. row **********************
id: 2
title: 数据库应用开发
body: 学习开发数据库应用程序
**********************3. row **********************
id: 3
title: MySQL完全手册
body: 学习MySQL的一切
**********************4. row **********************
id: 4
title: 数据库与事务处理
body: 系统的学习数据库的事务概论
**********************5. row **********************
id: 5
title: NoSQL精髓
body: 学习了解各种非结构化数据库
**********************6. row **********************
id: 6
title: SQL 语言详解
body: 详细了解如果使用各种SQL
6 rows inset (0.00 sec)
显式指定全文检索表源

mysql> SETGLOBAL innodb_ft_aux_table=”new_feature/articles”;
Query OK, 0 rows affected (0.00 sec)
通过系统表，就可以查看到底是怎么划分articles里的数据。

mysql> SELECT *FROM information_schema.INNODB_FT_INDEX_CACHE LIMIT 20,10;
+——+————–+————-+———–+——–+———-+
| WORD | FIRST_DOC_ID | LAST_DOC_ID | DOC_COUNT | DOC_ID| POSITION |
+——+————–+————-+———–+——–+———-+
| 中我 | 2 | 2 | 1 | 2 | 28 |
| 习m | 4 | 4 | 1 | 4 | 21 |
| 习了 | 6 | 6 | 1 | 6 | 16 |
| 习开 | 3 | 3 | 1 | 3 | 25 |
| 习数 | 5 | 5 | 1 | 5 | 37 |
| 了解 | 6 | 7 | 2 | 6 | 19 |
| 了解 | 6 | 7 | 2 | 7 | 23 |
| 事务 | 5 | 5 | 1 | 5 | 12 |
| 事务 | 5 | 5 | 1 | 5 | 40 |
| 何管 | 2 | 2 | 1 | 2 | 52 |
+——+————–+————-+———–+——–+———-+
10 rows in set (0.00 sec)
这里可以看到，把分词长度设置为2，所有的数据都只有两个一组。上面数据还包含了行的位置，ID等等信息。
接下来，我来进行一系列检索示范，使用方法和原来英文检索一致。

一、自然语言模式下检索：
1、得到符合条件的个数，
mysql>SELECT COUNT(*) FROM articles
-> WHERE MATCH (title,body) AGAINST (‘数据库’ IN NATURALLANGUAGE MODE);
+———-+
| COUNT(*) |
+———-+
| 4 |
+———-+
1 row in set (0.05 sec)
2、得到匹配的比率，
mysql>SELECT id, MATCH (title,body) AGAINST (‘数据库’ IN NATURAL LANGUAGE MODE)
AS score FROM articles;
+—-+———————-+
| id| score |
+—-+———————-+
| 1 | 0.12403252720832825 |
| 2 | 0.12403252720832825 |
| 3 | 0 |
| 4 | 0.12403252720832825 |
| 5 | 0.062016263604164124|
| 6 | 0 |
+—-+———————-+
6rows in set (0.00 sec)
二、布尔模式下搜索，这个就相对于自然模式搜索来的复杂些：
1、匹配既有管理又有数据库的记录，
mysql> SELECT * FROM articles WHERE MATCH (title,body)
-> AGAINST (‘+数据库 +管理’ IN BOOLEAN MODE);
+—-+————+————————————–+
| id| title | body |
+—-+————+————————————–+
| 1 | 数据库管理 | 在本教程中我将向你展示如何管理数据库 |
+—-+————+————————————–+
1 rowin set (0.00 sec)
2、匹配有数据库，但是没有管理的记录，
mysql> SELECT * FROM articles WHERE MATCH (title,body)
-> AGAINST (‘+数据库 -管理’ IN BOOLEAN MODE);
+—-+——————+—————————-+
| id| title | body |
+—-+——————+—————————-+
| 2 | 数据库应用开发 | 学习开发数据库应用程序 |
| 4 | 数据库与事务处理 | 系统的学习数据库的事务概论 |
| 5 | NoSQL 精髓 | 学习了解各种非结构化数据库 |
+—-+——————+—————————-+
3 rows in set (0.00 sec)
3、匹配MySQL，但是把数据库的相关性降低，
mysql> SELECT * FROM articles WHERE MATCH (title,body)
-> AGAINST (‘>数据库 +MySQL’ INBOOLEAN MODE);
+—-+—————+—————–+
| id| title | body |
+—-+—————+—————–+
| 3 | MySQL完全手册 |学习MySQL的一切 |
+—-+—————+—————–+
1 rowin set (0.00 sec)
三、查询扩展模式，比如要搜索数据库，那么MySQL，oracle，DB2也都将会被搜索到，
mysql> SELECT * FROM articles
-> WHERE MATCH (title,body)
-> AGAINST (‘数据库’ WITH QUERY EXPANSION);
+—-+——————+————————————–+
| id| title | body |
+—-+——————+————————————–+
| 1 | 数据库管理 | 在本教程中我将向你展示如何管理数据库 |
| 4 | 数据库与事务处理 | 系统的学习数据库的事务概论 |
| 2 | 数据库应用开发 | 学习开发数据库应用程序 |
| 5 | NoSQL 精髓 | 学习了解各种非结构化数据库 |
| 6 | SQL 语言详解 | 详细了解如果使用各种SQL |
| 3 | MySQL完全手册 | 学习MySQL的一切 |
+—-+——————+————————————–+
6 rows in set (0.01 sec)
...

浏览更多内容请先登录。 立即注册

分享的网址网站均收集自搜索引擎以及互联网，非查问网运营，查问网并没有提供其服务，请勿利用其做侵权以及违规行为。

mysql, 全文索引

更新于：2020-04-08 03:49:26

您需要登录后才可以评论。立即注册

转 【该文章就是坑】mysql使用中文的全文索引（注意只有5.7.6以上的版本支持）

7

1326

166w+

229

服务器搭建

WEB

个人爱好

游戏

linux

互联网

操作系统

mysql

Python

Yii2

php

WEB后端

采集

网站建设

WEB前端

Centos

工具

经济

生活

内容整理

数据库

资源

OS

电影

JS

常用命令

保险

php项目

问题整理

IT

网站

魔兽世界

composer

NodeJs

观点

AI

欧美电影

Yii扩展

美女

学习

LAMP

全文索引

Apache

前端

发现

Windows

Android

影评

服务器维护

国产电影

uwow

PHP框架

邮件服务器

音乐

评测

随笔

服务器

历史

推荐内容

转【该文章就是坑】mysql使用中文的全文索引（注意只有5.7.6以上的版本支持）