`
Gavin.Chen
  • 浏览: 325761 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论

Postgresql数据库的一些字符串操作函数

阅读更多

  今天做项目遇到客户反映了一个麻烦的事情,有一些数据存在,但就是在程序中搜索不出来,后来分析,发现问题为数据前面有几个空白字符,后来用SQL查询了一下,发现八九个数据表中,数千万条数据中有将近三百万条数据存在相同的问题,本想着在查询时添加匹配符'%',后来试运行了一下,发现不可行,因为尚有很多其它页面存在类似的搜索问题,并且这样会极大地影响到查询的速度,再加上客户迫切需要解决这个问题,由于在白天程序需不间断访问,并且不能对其运行速度产生较大的影响,所以排除了JDBC进行修改的方案,也排除了修改程序搜索代码的方案,头痛不己

 

  后来仔细想了一下,并尝试去查找相关sql字符串操作函数,确认有没有快捷的方式去解决空白字符串问题,很快,我们找到了合适的解决方案,对其中一个测试数据库进行了测试,结果非常令人满意,三百多万的数据只用了数分种,便去掉了所有的无用空格问题,为之兴奋不己。。。用法如下

 

update property set memorial_no = btrim(memorial_no, ' ') where memorial_no like ' %'

update property set memorial_no = trim(both ' ' from memorial_no) where memorial_no like ' %'

 

btrim()方法为删除字符串两边的某类字符,可以同时指定多个,在上面为' ',意为空格

trim()方法可以实现所有btrim()能实现的功能,事实上btrim()即为删除两边的某类字符串,trim()可以只指定某一边,当然也可以为两边

 

  现把Postgresql的字符串操作函数罗列在以,以便日方使用

函数:string || string 
说明:String concatenation 字符串连接操作
例子:'Post' || 'greSQL' = PostgreSQL

 

函数:string || non-string or non-string || string
说明:String concatenation with one non-string input 字符串与非字符串类型进行连接操作
例子:'Value: ' || 42 = Value: 42

 

函数:bit_length(string)
说明:Number of bits in string 计算字符串的位数
例子:bit_length('jose') = 32

 

函数:char_length(string) or character_length(string)
说明:Number of characters in string 计算字符串中字符个数
例子:char_length('jose') = 4

 

函数:lower(string)
说明:Convert string to lower case 转换字符串为小写
例子:bit_length('jose') = 32

 

函数:octet_length(string)
说明:Number of bytes in string 计算字符串的字节数
例子:octet_length('jose') = 4


函数:overlay(string placing string from int [for int])
说明:Replace substring 替换字符串中任意长度的子字串为新字符串
例子:overlay('Txxxxas' placing 'hom' from 2 for 4) = 4


函数:position(substring in string)
说明:Location of specified substring 子串在一字符串中的位置
例子:position('om' in 'Thomas') = 3


函数:substring(string [from int] [for int])
说明:Extract substring 截取任意长度的子字符串
例子:substring('Thomas' from 2 for 3) = hom


函数:substring(string from pattern)
说明:Extract substring matching POSIX regular expression. See Section 9.7 for more information on pattern matching. 利用正则表达式对一字符串进行任意长度的字串的截取
例子:substring('Thomas' from '...$') = mas


函数:substring(string from pattern for escape)
说明:Extract substring matching SQL regular expression. See Section 9.7 for more information on pattern matching. 利于正则表达式对某类字符进行删除,以得到子字符串
例子:trim(both 'x' from 'xTomxx') = Tom


函数:trim([leading | trailing | both] [characters] from string)
说明:Remove the longest string containing only the characters (a space by default) from the start/end/both ends of the string 去除尽可能长开始,结束或者两边的某类字符,默认为去除空白字符,当然可以自己指定,可同时指定多个要删除的字符串
例子:trim(both 'x' from 'xTomxx') = Tom


函数:upper(string)
说明:Convert string to uppercase 将字符串转换为大写
例子:upper('tom') = TOM


函数:ascii(string)
说明:ASCII code of the first character of the argument. For UTF8 returns the Unicode code point of the character. For other multibyte encodings. the argument must be a strictly ASCII character. 得到某一个字符的Assii值
例子:ascii('x') = 120


函数:btrim(string text [, characters text])
说明:Remove the longest string consisting only of characters in characters (a space by default) from the start and end of string 去除字符串两边的所有指定的字符,可同时指定多个字符
例子:btrim('xyxtrimyyx', 'xy') = trim


函数:chr(int)
说明:Character with the given code. For UTF8 the argument is treated as a Unicode code point. For other multibyte encodings the argument must designate a strictly ASCII character. The NULL (0) character is not allowed because text data types cannot store such bytes. 得到某ACSII值对应的字符
例子:chr(65) = A


函数:convert(string bytea, src_encoding name, dest_encoding name)
说明:Convert string to dest_encoding. The original encoding is specified by src_encoding. The string must be valid in this encoding. Conversions can be defined by CREATE CONVERSION. Also there are some predefined conversions. See Table 9-7 for available conversions. 转换字符串编码,指定源编码与目标编码
例子:convert('text_in_utf8', 'UTF8', 'LATIN1') = text_in_utf8 represented in ISO 8859-1 encoding


函数:convert_from(string bytea, src_encoding name)
说明:Convert string to the database encoding. The original encoding is specified by src_encoding. The string must be valid in this encoding. 转换字符串编码,自己要指定源编码,目标编码默认为数据库指定编码,
例子:convert_from('text_in_utf8', 'UTF8') = text_in_utf8 represented in the current database encoding


函数:convert_to(string text, dest_encoding name)
说明:Convert string to dest_encoding.转换字符串编码,源编码默认为数据库指定编码,自己要指定目标编码,
例子:convert_to('some text', 'UTF8') = some text represented in the UTF8 encoding


函数:decode(string text, type text)
说明:Decode binary data from string previously encoded with encode. Parameter type is same as in encode. 对字符串按指定的类型进行解码
例子:decode('MTIzAAE=', 'base64') = 123\000\001


函数:encode(data bytea, type text)
说明:Encode binary data to different representation. Supported types are: base64, hex, escape. Escape merely outputs null bytes as \000 and doubles backslashes. 与decode相反,对字符串按指定类型进行编码
例子:encode(E'123\\000\\001', 'base64') = MTIzAAE=


函数:initcap(string)
说明:Convert the first letter of each word to uppercase and the rest to lowercase. Words are sequences of alphanumeric characters separated by non-alphanumeric characters. 将字符串所有的单词进行格式化,首字母大写,其它为小写
例子:initcap('hi THOMAS') = Hi Thomas


函数:length(string)
说明:Number of characters in string 讲算字符串长度
例子:length('jose') = 4


函数:length(stringbytea, encoding name )
说明:Number of characters in string in the given encoding. The string must be valid in this encoding. 计算字符串长度,指定字符串使用的编码
例子:length('jose', 'UTF8') = 4


函数:lpad(string text, length int [, fill text])
说明:Fill up the string to length length by prepending the characters fill (a space by default). If the string is already longer than length then it is truncated (on the right). 对字符串左边进行某类字符自动填充,即不足某一长度,则在左边自动补上指定的字符串,直至达到指定长度,可同时指定多个自动填充的字符
例子:lpad('hi', 5, 'xy') = xyxhi


函数:ltrim(string text [, characters text])
说明:Remove the longest string containing only characters from characters (a space by default) from the start of string 删除字符串左边某一些的字符,可以时指定多个要删除的字符
例子:trim


函数:md5(string)
说明:Calculates the MD5 hash of string, returning the result in hexadecimal 将字符串进行md5编码
例子:md5('abc') = 900150983cd24fb0 d6963f7d28e17f72


函数:pg_client_encoding()
说明:Current client encoding name 得到pg客户端编码
例子:pg_client_encoding() = SQL_ASCII


函数:quote_ident(string text)
说明:Return the given string suitably quoted to be used as an identifier in an SQL statement string. Quotes are added only if necessary (i.e., if the string contains non-identifier characters or would be case-folded). Embedded quotes are properly doubled. 对某一字符串加上两引号
例子:quote_ident('Foo bar') = "Foo bar"


函数:quote_literal(string text)
说明:Return the given string suitably quoted to be used as a string literal in an SQL statement string. Embedded single-quotes and backslashes are properly doubled. 对字符串里两边加上单引号,如果字符串里面出现sql编码的单个单引号,则会被表达成两个单引号
例子:quote_literal('O\'Reilly') = 'O''Reilly'


函数:quote_literal(value anyelement)
说明:Coerce the given value to text and then quote it as a literal. Embedded single-quotes and backslashes are properly doubled. 将一数值转换为字符串,并为其两边加上单引号,如果数值中间出现了单引号,也会被表示成两个单引号
例子:quote_literal(42.5) = '42.5'


函数:regexp_matches(string text, pattern text [, flags text])
说明:Return all captured substrings resulting from matching a POSIX regular expression against the string. See Section 9.7.3 for more information. 对字符串按正则表达式进行匹配,如果存在则会在结果数组中表示出来
例子:regexp_matches('foobarbequebaz', '(bar)(beque)') = {bar,beque}


函数:regexp_replace(string text, pattern text, replacement text [, flags text])
说明:Replace substring(s) matching a POSIX regular expression. See Section 9.7.3 for more information. 利用正则表达式对字符串进行替换
例子:regexp_replace('Thomas', '.[mN]a.', 'M') = ThM


函数:regexp_split_to_array(string text, pattern text [, flags text ])
说明:Split string using a POSIX regular expression as the delimiter. See Section 9.7.3 for more information. 利用正则表达式将字符串分割成数组
例子:regexp_split_to_array('hello world', E'\\s+') = {hello,world}


函数:regexp_split_to_table(string text, pattern text [, flags text])
说明:Split string using a POSIX regular expression as the delimiter. See Section 9.7.3 for more information. 利用正则表达式将字符串分割成表格
例子:regexp_split_to_table('hello world', E'\\s+') =
hello
world
(2 rows)


函数:repeat(string text, number int)
说明:Repeat string the specified number of times 重复字符串一指定次数
例子:repeat('Pg', 4) = PgPgPgPg


函数:replace(string text, from text, to text)
说明:Replace all occurrences in string of substring from with substring to 将字符的某一子串替换成另一子串
例子:('abcdefabcdef', 'cd', 'XX') = abXXefabXXef


函数:rpad(string text, length int [, fill text])
说明:Fill up the string to length length by appending the characters fill (a space by default). If the string is already longer than length then it is truncated. 对字符串进行填充,填充内容为指定的字符串
例子:rpad('hi', 5, 'xy') = hixyx


函数:rtrim(string text [, characters text])
说明:Remove the longest string containing only characters from characters (a space by default) from the end of string
去除字符串右边指定的字符
例子:rtrim('trimxxxx', 'x') = trim


函数:split_part(string text, delimiter text, field int)
说明:Split string on delimiter and return the given field (counting from one)  对字符串按指定子串进行分割,并返回指定的数值位置的值
例子:split_part('abc~@~def~@~ghi', '~@~', 2) = def


函数:strpos(string, substring)
说明:Location of specified substring (same as position(substring in string), but note the reversed argument order) 指定字符串在目标字符串的位置
例子:strpos('high', 'ig') = 2


函数:substr(string, from [, count])
说明:Extract substring (same as substring(string from from for count)) 截取子串
例子:substr('alphabet', 3, 2) = ph


函数:to_ascii(string text [, encoding text])
说明:Convert string to ASCII from another encoding (only supports conversion from LATIN1, LATIN2, LATIN9, and WIN1250 encodings) 将字符串转换成ascii编码字符串
例子:to_ascii('Karel') = Karel


函数:to_hex(number int or bigint)
说明:Convert number to its equivalent hexadecimal representation  对数值进行十六进制编码
例子:to_hex(2147483647) = 7fffffff


函数:translate(string text, from text, to text)
说明:Any character in string that matches a character in the from set is replaced by the corresponding character in the to set 将字符串中某些匹配的字符替换成指定字符串,目标字符与源字符都可以同时指定多个
例子:translate('12345', '14', 'ax') = a23x5

 

分享到:
评论

相关推荐

    Postgresql的字符串操作函数

    在PostgreSQL数据库系统中,字符串操作函数是进行数据处理和查询时不可或缺的一部分。这些函数提供了对文本字符串的各种操作,如拼接、截取、查找、替换等,极大地丰富了SQL语句的功能。以下是对PostgreSQL字符串...

    postgresql数字结尾字符串分割排序说明

    本文档旨在详细介绍如何通过自定义函数在PostgreSQL数据库中实现一种特殊的排序方式:对于以数字结尾的字符串,首先将其分为两部分,一部分为非数字字符串,另一部分为数字;然后根据这两部分分别进行排序。具体而言...

    Matlab与PostgreSQL数据库的连接

    使用 Matlab 连接 PostgreSQL 数据库需要使用连接字符串。连接字符串的格式为:jdbc:postgresql://localhost:5432/database_name,其中,localhost 是服务器的地址,5432 是 PostgreSQL 数据库的默认端口号,...

    PostgreSQL数据库对象名大小写敏感的解决方法

    ### PostgreSQL数据库对象名大小写敏感的解决方法 在IT领域,特别是数据库管理中,了解不同数据库管理系统(DBMS)对大小写敏感性的处理方式至关重要。本文将深入探讨PostgreSQL数据库对象名大小写敏感的问题,以及...

    postgresql数据库

    标题中的"postgresql数据库"指的是这个系统,而描述中的"postgresql-9.2.1-1-windows.exe"是PostgreSQL的一个特定版本,专为Windows操作系统设计。 PostgreSQL 9.2.1是在2012年发布的一个稳定版本,包含了多项改进...

    postgresql的类似sqlserver的isdate方法

    而在PostgreSQL数据库系统中,并没有内置与SQL Server完全相同的`ISDATE`功能。然而,我们可以自定义一个类似的函数来实现这一功能。下面将详细介绍如何在PostgreSQL中创建一个类似于SQL Server `ISDATE`的函数,并...

    postgresql汉字转拼音首字母函数,用于批量生成助记码、拼音码,包含两万多个汉字

    postgresql汉字转拼音首字母函数,用于批量生成助记码、拼音码,包含两万多个汉字。

    SQL语句中设置多个字符串

    本实例将深入探讨如何在SQL语句中设置多个字符串条件,这对于初学者掌握数据库操作至关重要。 首先,让我们了解SQL的基本结构。SQL主要用于与关系型数据库进行交互,其基本查询语句包括SELECT,FROM,WHERE等部分。...

    postgresql整理,包含窗口函数

    字符串函数是用于执行字符串操作的函数,例如字符串连接、字符串长度、字符串转换、字符串小写、字符串替换和字符串抽取等。 PostgreSQL 的数据类型和数学函数提供了强大的功能,使得开发者可以轻松地执行各种数学...

    常用SQL字符串函数集锦.

    本篇将详细讲解一些常用的SQL字符串函数,以便你在数据库操作中更加得心应手。 1. **CONCAT()** `CONCAT()` 函数用于连接两个或多个字符串。例如: ```sql SELECT CONCAT('Hello', ' ', 'World') AS ...

    postgresql 兼容 oracle 函数

    2. **字符串函数**:诸如 INITCAP、SUBSTR、INSTR等在PostgreSQL中也有相应的实现,方便进行字符串操作。 3. **数学和转换函数**:如ROUND、TRUNC、TO_CHAR、TO_DATE等,这些在数据转换和计算中十分常用。 4. **...

    greenplum常用函数-基础

    在字符串处理方面,Greenplum提供了一系列内置的字符串函数,如CONCAT()用于连接字符串,SUBSTR()用于截取子串,以及TRIM()用于去除字符串两端的特定字符等。字符串函数在进行文本数据处理时非常有用,可以帮助我们...

    PostgreSQL数据库的基本使用

    假设我们想要创建一个名为`test1`的表,该表包含一个整数列`myID`、一个几何类型列`pt`以及一个字符串类型列`myName`。 ```sql CREATE TABLE test1 ( myID int4, pt geometry, myName varchar ); ``` 然后我们...

    PostgreSQL数据库.rar

    它支持SQL标准,提供事务处理、多版本并发控制(MVCC)、以及丰富的数据类型,包括字符串、数字、日期/时间、数组和JSON等。 **一、PostgreSQL内核架构** PostgreSQL的内核是其核心部分,负责数据的存储、查询处理...

    C语言使用libpq访问PostgresQL数据库

    本篇主要介绍如何使用C语言结合libpq库来访问PostgreSQL数据库,这在需要进行高效、低级别的数据库操作时尤其有用。 libpq是PostgreSQL官方提供的C语言接口,它提供了丰富的API函数,使得开发者能够方便地与...

    字符串处理示例_pgsql_

    本示例将聚焦于PostgreSQL中的字符串处理函数以及`CASE WHEN`语句的运用。 一、字符串处理函数 1. `length(str)`:返回字符串`str`的长度,以字符为单位。 2. `lower(str)` / `upper(str)`:将字符串转换为小写或...

    PostgreSQL数据库学习手册之libpq.doc

    《PostgreSQL数据库学习手册之libpq》是一份深入讲解如何使用C语言接口libpq与PostgreSQL数据库进行交互的文档。libpq是PostgreSQL提供给C程序员的API,它允许应用程序发送SQL查询到PostgreSQL服务器并接收返回的...

    java验证字符串是否符合json格式

    在本场景中,我们可能需要一个函数或方法来检查传递的字符串是否符合JSON的标准格式,以确保数据的有效性和正确性。 首先,我们需要了解JSON的基本结构。一个有效的JSON字符串必须满足以下条件: 1. 数据是键值对,...

    postgresql 数据库 10.4 正式版源码

    此外,PostgreSQL 提供了丰富的数据类型,包括字符串、数字、日期时间、数组、JSON等,满足了复杂的数据存储需求。其强大的查询能力得益于内置的SQL解析器和查询优化器,支持复杂的JOIN操作、窗口函数、递归查询等...

    postgresql数据库的使用

    - **字符串函数**: 如 `concat()`, `substring()`, `upper()` 等。 - **日期时间函数**: 如 `now()`, `current_date`, `extract()` 等。 - **转换函数**: 如 `cast()`, `convert()` 等。 #### 七、表的操作 - **...

Global site tag (gtag.js) - Google Analytics