python判断文本显示长度

canlynet

浏览: 697794 次
性别:
来自: 北京

最近访客更多访客>>

hellotianty

conan1986

Scorpio117

18802218523

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

python

在实际应用中我们难免遇到某些显示位置最多只能显示比如4个中文加1个英文，一共9个字节的gbk编码文字，但是我们文本是utf-8的，如果转换GBK，担心里面有非GBK文字，那么我们如何截取来控制显示字符个数呢？

思路是这样子：首先文本用unicode表示，python中用u"汉字和English"表示；如果是字母或数字，计数宽度单位为1，否则计数2，这样来判断文本显示宽度是否超标，如果超标，利用截取函数，一个一个的往后截取，直到显示宽度越界了，回退一个，截取这么多个unicode字符返回即可。

代码如下：

#coding=utf-8

def is_chinese(uchar):
    '''判断一个unicode是否是汉字'''
    if uchar >= u'\u4e00' and uchar<=u'\u9fa5':
        return True
    return False
def is_number(uchar):
    """判断一个unicode是否是数字"""
    if uchar >= u'\u0030' and uchar<=u'\u0039':
        return True
    return False
def is_alphabet(uchar):
    """判断一个unicode是否是英文字母"""
    if (uchar >= u'\u0041' and uchar<=u'\u005a') \
        or (uchar >= u'\u0061' and uchar<=u'\u007a'):
        return True
    return False
def is_other(uchar):
    """判断是否非汉字，数字和英文字符"""
    if not (is_chinese(uchar) or is_number(uchar) or is_alphabet(uchar)):
        return True
    return False

# gbk宽度可用于对齐，中文占两个字符位置
def gbkwordlen(u):
    if is_number(u) or is_alphabet(u):
        return 1
    return 2

# 计算文本显示宽度
def gbkwordslen(uw):
    i = 0
    for u in uw:
        i += gbkwordlen(u)
    return i

def trunc_word(uw, len):
    l = 0
    i = 1
    for u in uw:
        l += gbkwordlen(u)
        if l > len:
            return uw[:i-1]
        i += 1
    return uw

a = u"更新a至1209期"
print trunc_word(a, 6)
print gbkwordslen(a)

分享到：

C的正则匹配 | Centos 6.3 安装fcitx小企鹅中文输入法

2012-09-13 17:36
浏览 4793
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

python判断文本显示长度

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

python判断文本显示长度

评论

发表评论

相关推荐

python获取简拼全拼模块（修正版）

python的sqlite3连接模块用法

Python全局变量

python unittest用法

python时间函数和常用格式化

python 传递字典转换成变量

python实现百分比和进度条

python实现的ftp自动上传下载程序（支持目录递归操作）

python求时间差

python字符串操作（连接、比较、格式化等）

最近访客更多访客>>