本文最初发表于赖勇浩(恋花蝶)的博客(http://blog.csdn.net/lanphaday),如蒙转载,敬请保留全文完整,切勿去除本声明和作者信息。
在编程中,几乎90% 以上的代码都是关于整数或字符串操作,所以与整数一样,Python 的字符串实现也使用了许多拿优化技术,使得字符串的性能达到极致。与 C++ 标准库(STL)中的 std::string 不同,python 字符串集合了许多字符串相关的算法,以方法成员的方式提供接口,使用起来非常方便。 字符串方法大约有几十个,这些方法可以分为如下几类(根据 manuals 整理):
类型
方法
注解
填充
center(width[, fillchar]) ,
ljust(width[, fillchar]),
rjust(width[, fillchar]),
zfill(width),
expandtabs([tabsize])
l fillchar 参数指定了用以填充的字符,默认为空格
l 顾名思义,zfill()即是以字符0进行填充,在输出数值时比较常用
l expandtabs()的tabsize 参数默认为8。它的功能是把字符串中的制表符(tab)转换为适当数量的空格。
删减
strip([chars]),
lstrip([chars]),
rstrip([chars])
*strip()函数族用以去除字符串两端的空白符,空白符由string.whitespace常量定义。
变形
lower(),
upper(),
capitalize(),
swapcase(),
title()
title()函数是比较特别的,它的功能是将每一个单词的首字母大写,并将单词中的非首字母转换为小写(英文文章的标题通常是这种格式)。
>>> 'hello wORld!'.title()
'Hello World!'
因为title() 函数并不去除字符串两端的空白符也不会把连续的空白符替换为一个空格,所以建议使用string 模块中的capwords(s)函数,它能够去除两端的空白符,再将连续的空白符用一个空格代替。
>>> ' hello world!'.title()
' Hello World!'
>>> string.capwords(' hello world!')
'Hello World!'
分切
partition(sep),
rpartition(sep),
splitlines([keepends]),
split([sep [,maxsplit]]),
rsplit([sep[,maxsplit]])
l *partition()函数族是2.5版本新增的方法。它接受一个字符串参数,并返回一个3个元素的 tuple 对象。如果sep没出现在母串中,返回值是 (sep, ‘’, ‘’);否则,返回值的第一个元素是 sep 左端的部分,第二个元素是 sep 自身,第三个元素是 sep 右端的部分。
l 参数 maxsplit 是分切的次数,即最大的分切次数,所以返回值最多有 maxsplit+1 个元素。
l s.split() 和 s.split(‘ ‘)的返回值不尽相同
>>> ' hello world!'.split()
['hello', 'world!']
>>> ' hello world!'.split(' ')
['', '', 'hello', '', '', 'world!']
产生差异的原因在于当忽略 sep 参数或sep参数为 None 时与明确给 sep 赋予字符串值时 split() 采用两种不同的算法。对于前者,split() 先去除字符串两端的空白符,然后以任意长度的空白符串作为界定符分切字符串(即连续的空白符串被当作单一的空白符看待);对于后者则认为两个连续的 sep 之间存在一个空字符串。因此对于空字符串(或空白符串),它们的返回值也是不同的:
>>> ''.split()
[]
>>> ''.split(' ')
['']
连接
join(seq)
join() 函数的高效率(相对于循环相加而言),使它成为最值得关注的字符串方法之一。它的功用是将可迭代的字符串序列连接成一条长字符串,如:
>>> conf = {'host':'127.0.0.1',
... 'db':'spam',
... 'user':'sa',
... 'passwd':'eggs'}
>>> ';'.join("%s=%s"%(k, v) for k, v in conf.iteritems())
'passswd=eggs;db=spam;user=sa;host=127.0.0.1'
判定
isalnum(),
isalpha(),
isdigit(),
islower(),
isupper(),
isspace(),
istitle(),
startswith(prefix[, start[, end]]),
endswith(suffix[,start[, end]])
这些函数都比较简单,顾名知义。需要注意的是*with()函数族可以接受可选的 start, end 参数,善加利用,可以优化性能。
另,自 Py2.5 版本起,*with() 函数族的 prefix 参数可以接受 tuple 类型的实参,当实参中的某人元素能够匹配,即返回 True。
查找
count( sub[, start[, end]]),
find( sub[, start[, end]]),
index( sub[, start[, end]]),
rfind( sub[, start[,end]]),
rindex( sub[, start[, end]])
find()函数族找不到时返回-1,index()函数族则抛出ValueError异常
另,也可以用 in 和 not in 操作符来判断字符串中是否存在某个模板。
替换
replace(old, new[,count]),
translate(table[,deletechars])
l replace()函数的 count 参数用以指定最大替换次数
l translate() 的参数 table 可以由 string.maketrans(frm, to) 生成
l translate() 对 unicode 对象的支持并不完备,建议不要使用。
编码
encode([encoding[,errors]]),
decode([encoding[,errors]])
这是一对互逆操作的方法,用以编码和解码字符串。因为str是平台相关的,它使用的内码依赖于操作系统环境,而unicode是平台无关的,是Python内部的字符串存储方式。unicode可以通过编码(encode)成为特定编码的str,而str也可以通过解码(decode)成为unicode。
附注:
1)C++ 中可以通过 boost.string_algo 库来获得同样方便的字符串处理能力。
2)这些字符串方法在 python1.6 版本才开始提供,如果你使用的python版本非常老,可能需要使用string模块来获得这些方便的算法。
分享到:
相关推荐
Python 字符串方法
Python 字符串方法详解 Python 中的字符串方法是非常重要的,它们可以帮助开发者快速地处理和操作字符串。在本文中,我们将介绍 31 个必备的 Python 字符串方法,这些方法涵盖了字符串的基本操作、字符串的修改、...
C语言字符串转换为Python字符串的方法 C语言字符串转换为Python字符串是指将C语言中的字符串数据转换为Python中的字符串对象,以便在Python环境中使用。下面详细介绍了C语言字符串转换为Python字符串的方法。 使用...
在Python编程语言中,字符串是不可变的数据类型,但提供了丰富的操作方法来处理字符串。这里我们将深入探讨在Python 3.1版本中的字符串调用方法,包括大小写转换、输出对齐、检索、分割与组合以及字符串的更改。 1....
Python 提供了多种字符串模糊匹配方法,可以使用编辑距离、FuzzyWuzzy 库等技术来实现字符串模糊匹配。在实际应用中,字符串模糊匹配技术可以广泛应用于搜索引擎、自然语言处理、信息检索等领域。
Python字符串是编程中常用的数据类型,用于存储和处理文本信息。在Python中,字符串是由一个或多个字符组成的序列,它们可以被单引号(' ')或双引号(" ")包围。以下是一些关于Python字符串的重要知识点: 1. **字符...
Python字符串是编程中常用的数据类型,它用于存储和处理文本信息。字符串方法是Python提供的一系列内置函数,方便我们对字符串进行操作。本文将详细讲解几种主要的字符串方法分类,包括填充、删减、变形、分切、替代...
学习python字符串方法的使用,对书中列举的每种方法都做一个试用,将结果记录,方便以后查询。 (1) s.capitalize() ;功能:返回字符串的的副本,并将首字母大写。使用如下: >>> s = 'wwwwww' >>> scap = s....
### Python 字符串操作方法详解 #### 一、概述 在 Python 编程语言中,字符串是最常用的数据类型之一。由于其广泛的应用场景,掌握字符串的各种操作方法对于提高编程效率至关重要。本文档提供了全面的 Python 字符...
本教程主要围绕Python字符串的两种重要特性——f-string和内置方法展开。 一、f-string简介 f-string,也称为格式化字符串字面值,是Python 3.6引入的一种新特性,用于方便地在字符串中嵌入表达式。它的主要优点是...
删除字符串中的子串pta习常见的 Python 字符串方法比听起来更容易。Python 是一种动态类型的解释型语言,数据类型非常灵活。Python也内建了很多字符串方法,了解常见的 Python 字符串方法,能让我们在学习和工作的...
在给定的文件内容中,我们可以看到有关Python字符串操作的知识点。这些操作涉及到C语言风格的字符串函数模拟,但它们实际上并不是Python原生的字符串操作方法。Python语言本身就拥有强大的字符串处理能力,不过,...
Python字符串操作常用函数,包含了检索、统计、分割、替换、大小写转换、对齐,空格删除、字符串判断(头尾+组成)
Python 字符串处理实例 Python 中的字符串处理是 Python 编程语言中非常重要的一部分。...Python 中的字符串处理提供了多种方法来对齐、转义、连接和截取字符串,为 Python 编程提供了强大的字符串处理能力。
Python 字符串拼接方法详解 Python 中的字符串拼接方法有多种,本文将通过实例详细讲解这几种方法的使用及各自的特点。 字符串拼接方法一:使用“+”连接 Python 中最简单的字符串拼接方法是使用“+”连接。例如...
字符串逆序 python字符串逆序方法 python字符串逆序方法 python字符串逆序方法 python字符串逆序方法
实例如下: # bytes object b = bexample # str object s = example ...以上这篇python字符串str和字节数组相互转化方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多
三、字符串方法 Python字符串提供了一系列内置方法,如`lower()`、`upper()`、`title()`用于大小写转换,`split()`用于分割字符串,`join()`用于合并字符串列表,`replace()`用于替换子串,`strip()`用于去除两侧的...