`
pxczy
  • 浏览: 6045 次
  • 性别: Icon_minigender_2
  • 来自: 深圳
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

mysql全文索引之停止词(stopword)

 
阅读更多

本文IT技术学习网将给大家讲述什么是mysql全文索引中的停止词(stopword也有的翻译做停止字)。

stopword

在全文索引中,如果一个词被认为是太普通或者太没价值,那么它将会被搜索索引和搜索查询忽略。innodb和myisam分别有两组不同的设置,控制着对应的stopword。

全文检索时,停止词列表将会被读取和检索,在不同的字符集和排序方式下(character_set_server and collation_server 系统变量),可能会导致在搜索时的停止词的不匹配。

停止词是否大小写敏感,取决于不同的排序方式,比如:latin1_swedish_ci下停止词是大小写敏感的,latin1_general_cs 或 latin1_bin下停止词是大小写不敏感的。

innodb的索引停止词

innodb的默认停止词列表很短。查询INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD表来查看默认的innodb停止词表。

      mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD;

 

      +-------+

 

      | value |

 

      +-------+

 

      | a     |

 

      | about |

 

      | an    |

 

      | are   |

 

      | as    |

 

      | at    |

 

      | be    |

 

      | by    |

 

      | com   |

 

      | de    |

 

      | en    |

 

      | for   |

 

      | from  |

 

      | how   |

 

      | i     |

 

      | in    |

 

      | is    |

 

      | it    |

 

      | la    |

 

      | of    |

 

      | on    |

 

      | or    |

 

      | that  |

 

      | the   |

 

      | this  |

 

      | to    |

 

      | was   |

 

      | what  |

 

      | when  |

 

      | where |

 

      | who   |

 

      | will  |

 

      | with  |

 

      | und   |

 

      | the   |

 

      | www   |

 

      +-------+

 

    36 rows in set (0.00 sec)

myisam索引的停止词

myisam索引的停止词列表与innodb不同,默认的myisam停止词列表是直接在mysql程序源码中已写入。设置ft_stopword_file系统变量来指定停止词文件,从而覆盖默认设置。

在mysql源程序的 storage/myisam/ft_static.c file文件中,你可以找到默认的myisam停止词列表:

      a's able about above according

 

      accordingly across actually after afterwards

 

      again against ain't all allow

 

      allows almost alone along already

 

      also although always am among

 

      amongst an and another any

 

      anybody anyhow anyone anything anyway

 

      anyways anywhere apart appear appreciate

 

      appropriate are aren't around as

 

      aside ask asking associated at

 

      available away awfully be became

 

      because become becomes becoming been

 

      before beforehand behind being believe

 

      below beside besides best better

 

      between beyond both brief but

 

      by c'mon c's came can

 

      can't cannot cant cause causes

 

      certain certainly changes clearly co

 

      com come comes concerning consequently

 

      consider considering contain containing contains

 

      corresponding could couldn't course currently

 

      definitely described despite did didn't

 

      different do does doesn't doing

 

      don't done down downwards during

 

      each edu eg eight either

 

      else elsewhere enough entirely especially

 

      et etc even ever every

 

      everybody everyone everything everywhere ex

 

      exactly example except far few

 

      fifth first five followed following

 

      follows for former formerly forth

 

      four from further furthermore get

 

      gets getting given gives go

 

      goes going gone got gotten

 

      greetings had hadn't happens hardly

 

      has hasn't have haven't having

 

      he he's hello help hence

 

      her here here's hereafter hereby

 

      herein hereupon hers herself hi

 

      him himself his hither hopefully

 

      how howbeit however i'd i'll

 

      i'm i've ie if ignored

 

      immediate in inasmuch inc indeed

 

      indicate indicated indicates inner insofar

 

      instead into inward is isn't

 

      it it'd it'll it's its

 

      itself just keep keeps kept

 

      know known knows last lately

 

      later latter latterly least less

 

      lest let let's like liked

 

      likely little look looking looks

 

      ltd mainly many may maybe

 

      me mean meanwhile merely might

 

      more moreover most mostly much

 

      must my myself name namely

 

      nd near nearly necessary need

 

      needs neither never nevertheless new

 

      next nine no nobody non

 

      none noone nor normally not

 

      nothing novel now nowhere obviously

 

      of off often oh ok

 

      okay old on once one

 

      ones only onto or other

 

      others otherwise ought our ours

 

      ourselves out outside over overall

 

      own particular particularly per perhaps

 

      placed please plus possible presumably

 

      probably provides que quite qv

 

      rather rd re really reasonably

 

      regarding regardless regards relatively respectively

 

      right said same saw say

 

      saying says second secondly see

 

      seeing seem seemed seeming seems

 

      seen self selves sensible sent

 

      serious seriously seven several shall

 

      she should shouldn't since six

 

      so some somebody somehow someone

 

      something sometime sometimes somewhat somewhere

 

      soon sorry specified specify specifying

 

      still sub such sup sure

 

      t's take taken tell tends

 

      th than thank thanks thanx

 

      that that's thats the their

 

      theirs them themselves then thence

 

      there there's thereafter thereby therefore

 

      therein theres thereupon these they

 

      they'd they'll they're they've think

 

      third this thorough thoroughly those

 

      though three through throughout thru

 

      thus to together too took

 

      toward towards tried tries truly

 

      try trying twice two un

 

      under unfortunately unless unlikely until

 

      unto up upon us use

 

      used useful uses using usually

 

      value various very via viz

 

      vs want wants was wasn't

 

      way we we'd we'll we're

 

      we've welcome well went were

 

      weren't what what's whatever when

 

      whence whenever where where's whereafter

 

      whereas whereby wherein whereupon wherever

 

      whether which while whither who

 

      who's whoever whole whom whose

 

      why will willing wish with

 

      within without won't wonder would

 

      wouldn't yes yet you you'd

 

      you'll you're you've your yours

 

      yourself yourselves zero



分享到:
评论

相关推荐

    linux基础进阶笔记

    linux基础进阶笔记,配套视频:https://www.bilibili.com/list/474327672?sid=4493093&spm_id_from=333.999.0.0&desc=1

    IMG20241115211541.jpg

    IMG20241115211541.jpg

    Sen2_ARI_median.txt

    GEE训练教程——Landsat5、8和Sentinel-2、DEM和各2哦想指数下载

    毕业设计&课设_基于 flask-whoosh-jieba 的代码,涉及文件管理及问题修复.zip

    该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过严格测试运行成功才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

    基于springboot家政预约平台源码数据库文档.zip

    基于springboot家政预约平台源码数据库文档.zip

    Ucharts添加stack和折线图line的混合图

    Ucharts添加stack和折线图line的混合图

    基于springboot员工在线餐饮管理系统源码数据库文档.zip

    基于springboot员工在线餐饮管理系统源码数据库文档.zip

    2015-2021年新能源汽车分地区、分类型、分级别销量逐月数据和进出口数据-最新出炉.zip

    新能源汽车进出口数据 1、时间跨度:2018-2020年 2、指标说明:包含如下指标的进出口数据:混合动力客车(10座及以上)、纯电动客车(10座及以上)、非插电式混合动力乘用车、插电式混合动力乘用车、纯电动乘用车 二、新能源汽车进出口月销售数据(分地区、分类型、分 级别) 1、数据来源:见资料内说明 2、时间跨度:2014年1月-2021年5月 4、指标说明: 包含如下指标 2015年1月-2021年5月新能源乘用车终端月度销量(分类型)部分内容如下: 新能源乘用车(单月值、累计值 )、插电式混合动力 月度销量合计(狭义乘用车轿车、SUV、MPV、交叉型乘用车); 月度销量同比增速(狭义乘用车轿车、SUV、MPV、交叉型乘用车); 累计销量合计(狭义乘用车轿车、SUV、IPV、交叉型乘用车); 累计销量同比增速(狭义乘用车轿车、SUV、MPV、交叉型乘用车); 累计结构变化(狭义乘用车轿车、SUV、IPV、交叉型乘用车); 2015年1月-2021年5月新能源乘用车终端月度销量(分地区)内容如下: 更多见资源内

    中心主题-241121215200.pdf

    中心主题-241121215200.pdf

    蓝奏云下载链接与密码整理

    内容概要:本文档提供了多个蓝奏云下载链接及其对应解压密码,帮助用户快速获取所需文件。 适合人群:需要从蓝奏云下载文件的互联网用户。 使用场景及目标:方便地记录并分享蓝奏云上文件的下载地址和密码,提高下载效率。 阅读建议:直接查看并使用提供的链接和密码即可。若遇到失效情况,请尝试联系上传者确认更新后的链接。

    Javaweb仓库管理系统项目源码.zip

    基于Java web 实现的仓库管理系统源码,适用于初学者了解Java web的开发过程以及仓库管理系统的实现。

    Python-文件重命名-自定义添加文字-重命名

    资源名称:Python-文件重命名-自定义添加文字-重命名 类型:windows—exe可执行工具 环境:Windows10或以上系统 功能: 1、点击按钮 "源原文"【浏览】表示:选择重命名的文件夹 2、点击按钮 "保存文件夹"【浏览】表示:保存的路径(为了方便可选择保存在 源文件中 ) 3、功能①:在【头部】添加自定义文字 4、功能②:在【尾部】添加自定义文字 5、功能③:输入源字符 ;输入替换字符 可以将源文件中的字符替换自定义的 6、功能④:自动加上编号_1 _2 _3 优点: 1、非常快的速度! 2、已打包—双击即用!无需安装! 3、自带GUI界面方便使用!

    JDK8安装包,为各位学习的朋友免费提供

    JDK8安装包

    Centos-7yum的rpm包

    配合作者 一同使用 作者地址没有次下载路径 https://blog.csdn.net/weixin_52372189/article/details/127471149?fromshare=blogdetail&sharetype=blogdetail&sharerId=127471149&sharerefer=PC&sharesource=weixin_45375332&sharefrom=from_link

    setup_python_geospatial_analysis.ipynb

    GEE训练教程

    毕业设计&课设_文成公主微信公众号全栈工程,含技术栈、架构及部署流程等内容.zip

    该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过严格测试运行成功才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

    基于springboot交通感知与车路协同系统源码数据库文档.zip

    基于springboot交通感知与车路协同系统源码数据库文档.zip

    基于springboot+vue 雅妮电影票购买系统源码数据库文档.zip

    基于springboot+vue 雅妮电影票购买系统源码数据库文档.zip

    使用 HTML5 实现拖放交互:音效与提示功能的完整实现

    为了更好地理解 HTML5 的拖放功能,我们设计了一个简单有趣的示例:将水果从水果区拖放到购物笼中,实时更新数量和价格,并在所有水果被成功放置后,播放音效并显示提示。

    毕业设计&课设_基于 SSM 的大学生综合成绩测评系统(含信息及数据库脚本,体现系统架构及功能设计).zip

    该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过严格测试运行成功才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

Global site tag (gtag.js) - Google Analytics