`
骑猪逛街666
  • 浏览: 141775 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

PostgreSQL里的17种文本相似算法与GIN索引_-_pg_similarity

阅读更多
阅读原文:http://click.aliyun.com/m/22329/
摘要: 标签 PostgreSQL , 文本相似 , pg_similarity , pg_trgm , rum , fuzzymatch gin , smlar 背景 文本相似算法,结合PostgreSQL的开放索引框架GIN,可以实现各种相似算法的文本高效检索。

标签

PostgreSQL , 文本相似 , pg_similarity , pg_trgm , rum , fuzzymatch gin , smlar

背景

文本相似算法,结合PostgreSQL的开放索引框架GIN,可以实现各种相似算法的文本高效检索。

PostgreSQL中常见的文本相似搜索插件:rum, pg_trgm, fuzzymatch, pg_similarity, smlar。

其中pg_similarity支持的算法达到了17种。

Introduction

pg_similarity is an extension to support similarity queries on PostgreSQL.

The implementation is tightly integrated in the RDBMS in the sense that it defines operators
so instead of the traditional operators (= and <>) you can use ~~~ and ! (any of these
operators represents a similarity function).

pg_similarity has three main components:

Functions:

a set of functions that implements similarity algorithms available in the literature.

These functions can be used as UDFs and, will be the base for implementing the similarity operators;

Operators:

a set of operators defined at the top of similarity functions.

They use similarity functions to obtain the similarity threshold and,
compare its value to a user-defined threshold to decide if it is a match or not;

Session Variables:

a set of variables that store similarity function parameters. Theses variables can be defined at run time.
阅读原文:http://click.aliyun.com/m/22329/
分享到:
评论

相关推荐

    oracle_fdw-2.2.0-pg12-win64.zip

    【标题】"oracle_fdw-2.2.0-pg12-win64.zip" 提供的是一个在 PostgreSQL 数据库环境中使用的 Oracle 外接框架(Foreign Data Wrapper, FDW)的版本,具体为 2.2.0 版本,适用于 PostgreSQL 12 并且是针对 Windows 64...

    postgresql之pg_dump命令详解 - wling_89的专栏 - 博客频道 - CSDN_NET.mht

    PG导入导出命令详解

    pg_similarity:一组用于执行相似性查询的函数和运算符

    pg_similarity是对支持相似性查询的扩展。 就实现而言,该实现紧密地集成在RDBMS中,因为它定义了运算符,因此可以使用~~~代替传统的运算符(=和&lt;&gt;)。 ! (这些运算符中的任何一个都代表相似性函数)。 pg_...

    pgRouting-1.03_pg-8.4.2.zip

    【pgRouting-1.03_pg-8.4.2.zip】这个压缩包文件是针对PostgreSQL数据库系统的一个扩展——pgRouting的特定版本,适用于PostGIS 8.4.2环境。pgRouting是一个强大的开源工具,它将PostGIS的空间数据库功能与图论算法...

    postgresql数据库--psql、pg_dump命令带密码执行sql语句

    pg_dump: pg_dump -a -t tbl_test "host=127.0.0.1 hostaddr=127.0.0.1 port=5432 user=postgres password=123456 dbname=postgres" &gt; /userdir/tbl_data a 参数是表示只导出数据,其他的额外信息不需要,该参数也...

    dbExpress_driver_for_PostgreSQL__Windows_version_3.6.8__17-Apr-2015.exe

    dbExpress_driver_for_PostgreSQL__Windows_version_3.6.8__17-Apr-2015.exe

    pg_bigm-1.2-20200228.gz

    《pg_bigm: PostgreSQL 模糊查询加速利器》 在数据库管理系统中,高效的数据查询是提升业务性能的关键因素之一。PostgreSQL,作为一个强大且开源的关系型数据库系统,提供了丰富的功能来满足不同场景的需求。其中...

    linux搭建postgresql、postgis、pg_pathman环境步骤以及需要的软件包

    sudo apt install postgis postgresql-contrib-postgis-NN 或 sudo yum install postgresql-server-postgis-NN ``` - 配置PostgreSQL以启用PostGIS扩展: ```bash sudo -u postgres createdb -E UTF8 template_...

    pg_activity-master_made_python_pg_

    标题 "pg_activity-master_made_python_pg_" 暗示我们关注的是一个与PostgreSQL数据库相关的项目,该项目可能是用Python编写的,并且与监控或管理PostgreSQL活动有关。在这个场景下,"pg_activity"可能是一个用于...

    PostgreSQL分区插件pg_pathman1.5.11的RPM格式安装包

    PostgreSQL12/PostgreSQL11/PostgreSQL10分区插件pg_pathman1.5.11的RPM格式安装包,文件中包含了3个文件: pg_pathman10-1.5.11-1.rhel7.x86_64.rpm pg_pathman11-1.5.11-1.rhel7.x86_64.rpm pg_pathman12-1.5.11-1...

    postgresql索引类型区别

    本文将详细介绍 PostgreSQL 中的多种索引类型,包括 Hash 索引、B-tree 索引、GiST 索引、GIN 索引和 SP-GiST 索引,帮助读者更好地理解和选择合适的索引类型。 Hash 索引 --------- Hash 索引是一种特殊的索引...

    timescaledb-postgresql-12_1.7.1-windows-amd64.zip

    1. 解压"timescaledb-postgresql-12_1.7.1-windows-amd64.zip"压缩包,找到并运行"setup.exe",按照向导进行安装。 2. 安装完成后,将解压目录下的"timescaledb"文件夹复制到PostgreSQL的"share\extension"目录下。 ...

    postgresql dba学习与工作 软件合集

    postgresql-10.16.tar.gz postgresql-11.11.tar.gz postgresql-12.6.tar.gz postgresql-13.2-2-windows-x64-binaries.zip postgresql-13.2.tar.gz postgresql-9.4.26.tar.gz postgresql-9.6.21.tar.gz ...

    pg_statsinfo-12.0.tar.gz

    《pg_statsinfo-12.0:为PostgreSQL 12优化的数据监控工具》 PostgreSQL,简称PG,是一款开源的关系型数据库管理系统,以其高度的稳定性和强大的功能深受广大开发者和企业的喜爱。随着版本的不断迭代,PG12带来了...

    postgres_exporter-0.9.0.linux-amd64.tar.gz

    PostgreSQL是一种强大的开源关系型数据库管理系统,它支持SQL标准并提供许多高级特性,如事务处理、复制和复杂的查询。在企业级应用中,PostgreSQL因其稳定性和可靠性而被广泛采用。 然后,Prometheus是云原生计算...

    GPU数据库PG_strom的安装及使用

    - 下载 PostgreSQL 版本 9.5.10 的源码包 `postgresql-9.5.10.tar.gz`。 - 解压缩源码包: `tar -xzf postgresql-9.5.10.tar.gz`。 - 进入解压后的目录 `cd postgresql-9.5.10`。 ##### 2. 编译 PostgreSQL 源码 - ...

    PostgreSQL(postgresql14-devel-14.1-1PGDG.rhel7.x86_64.rpm)

    PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),是以加州大学计算机系开发的POSTGRES,4.2版本为基础的对象关系型数据库管理系统。POSTGRES的许多领先概念只是在比较迟的时候才出现...

    linux中pg11的包

    - 启动:`systemctl start postgresql-11`,停止:`systemctl stop postgresql-11`,查看状态:`systemctl status postgresql-11`。 4. **配置文件**: - 主要配置文件位于`/etc/postgresql/11/main/postgresql....

    PostgreSQL_8.2.3.rar_postgresql_windows 8

    PostgreSQL是一种开源关系型数据库管理系统(RDBMS),它的版本8.2.3是该系统的一个重要里程碑。这个版本在2006年发布,带来了许多改进和新特性,使得PostgreSQL在当时更加稳定和功能强大。对于Windows 8用户来说,...

    PostgreSQL中文手册9.2

    五、 pg_auth_members: pg_auth_members: pg_auth_members: pg_auth_members:pg_auth_members: pg_auth_members:pg_auth_members:pg_auth_members:pg_auth_members: .64 七、 pg_tablespace: pg_tablespace: pg_...

Global site tag (gtag.js) - Google Analytics