`

Unicode spaces

阅读更多

http://www.cs.tut.fi/~jkorpela/chars/spaces.html

 

 

Space characters in Unicode Code Name of the character Sample Width of the character
U+0020 SPACE  空格 foo bar Depends on font, often adjusted (see below)
U+00A0 NO-BREAK SPACE foo  bar As a space, but often not adjusted
U+2000 EN QUAD foo  bar 1 en (= 1/2 em)
U+2001 EM QUAD foobar 1 em (nominally, the height of the font)
U+2002 EN SPACE foobar 1 en (= 1/2 em)
U+2003 EM SPACE foobar 1 em
U+2004 THREE-PER-EM SPACE foobar 1/3 em
U+2005 FOUR-PER-EM SPACE foobar 1/4 em
U+2006 SIX-PER-EM SPACE foobar 1/6 em
U+2007 FIGURE SPACE foobar “Tabular width”, the width of digits
U+2008 PUNCTUATION SPACE foobar The width of a period “.”
U+2009 THIN SPACE foobar 1/5 em (or sometimes 1/6 em)
U+200A HAIR SPACE foobar Narrower than THIN SPACE
U+200B ZERO WIDTH SPACE foobar Nominally no width, but may expand
U+202F NARROW NO-BREAK SPACE foobar Narrower than NO-BREAK SPACE (or SPACE )
U+205F MEDIUM MATHEMATICAL SPACE foobar 4/18 em
U+3000 IDEOGRAPHIC SPACE foo  bar The width of ideographic (CJK ) characters.
U+FEFF ZERO WIDTH NO-BREAK SPACE foo bar

No width (the character is invisible)

 

' ' 相当于\u0020 空格<SP>
'\n' 相当于\u000a 换行<LF>
'\r' 相当于\u000d 回车<CR>
'\t' 相当于\u0009 水平制表符<TAB>
'\f' 相当于\u000c 换页
'\x0b' 垂直制表符<VT>
'\xa0' 相当于\u0160,亦即'&#160;' 就即'&nbsp;' 不断行的空白(1个字符宽度)<NBSP> No-break Space
'\2002'..'\u200a' 定宽空格Fixed width spaces
\u2002即'&ensp;'半个空白(1个字符宽度)
\u2003即'&emsp;'一个空白(2个字符宽度)
'\u200b' 零宽空格Zero-width Space
'\u2028' 行分隔符 <LS> (我们使用word打文章时每行后出现的小符号)
'\u2029' 段落分隔符<PS>(类推)

分享到:
评论

相关推荐

    Yabai-Spaces:一个* crazy *可自定义的Bitbar插件,可显示空格总数并突出显示当前空格

    用户可自定义的颜色,数字,unicode图标,字体和大小。 有据可查。 即使是新手用户也可以轻松进行更改。 表情符号支持! 支持一串相同的图标。 例如SPACES =“••••••••••••• 支持无限数量的空格 ...

    exceptions1-spaces.ru.zip_Java编程_Java_

    标题中的"exceptions1-spaces.ru.zip"可能是一个包含了关于Java异常处理的文档集合,而"Java编程_Java"标签则进一步确认了这一点。这些文档可能详细解释了Java中的一些常见异常类型以及如何有效地处理它们。以下是...

    Microsoft CDIMAGE v2.52

    -l volume label, no spaces (e.g. -lMYLABEL) -t time stamp for all files and directories, no spaces, any delimiter (e.g. -t12/31/2000,15:01:00) -g encode GMT time for files rather than local time ...

    CDIMAGE 2.52

    -l volume label, no spaces (e.g. -lMYLABEL) -t time stamp for all files and directories, no spaces, any delimiter (e.g. -t12/31/2000,15:01:00) -g encode GMT time for files rather than local time ...

    sdf_atlas:SDF字体图集生成工具

    SDF字体图集生成工具 用于Atlas生成工具。 描述的算法。 主要是出于教学目的,因为该算法的性能足以在运行时生成字体... -ur 'ranges' unicode ranges 'start1:end1,start:end2,single_codepoint' without spaces,

    sqlcmd 参数详解

    * -u unicode output:指定 Unicode 输出。 五、查询选项 * -q "cmdline query":执行查询语句。 * -Q "cmdline query" and exit:执行查询语句并退出。 * -e echo input:回显输入语句。 六、变量选项 * -v var...

    jad 最新版java反编译

    jad 最新版java反编译,最好的java反编译工具 Jad v1.5.8g. Usage: jad [option(s)] (s)&gt; Options: -a - generate JVM ... -8 - convert Unicode strings into ANSI strings (ansi) -& - redirect STDERR to STDOUT

    ExactAudioCopy_1.0_Beta1_XiaZaiBa.exe

    + Unicode support for all fields (but not CD -Text) + New database engine for storing CD information (old databases can be imported) + Metadata plugin support, for now there is a freedb plugin ...

    xss跨站脚本攻击汇总

    9. 7 位的 UTF-8 的 Unicode 编码:省略..S'&gt;,攻击者可以使用 7 位的 UTF-8 的 Unicode 编码 inject 恶意脚本。 10. 十六进制编码:省略..&#x58&#x53&#x53&#x27&#x29&gt;,攻击者可以使用十六进制编码 inject 恶意...

    jad.exe+readme.txt

    java反编译工具 Jad accepts the following options: ... -8 - convert UNICODE strings into 8-bit strings using the current ANSI code page (Win32 only) -& - redirect STDERR to STDOUT (Win32 only)

    java反编译工具FrontEnd和jad

    java反编译工具 Jad accepts the following options: ... -8 - convert UNICODE strings into 8-bit strings using the current ANSI code page (Win32 only) -& - redirect STDERR to STDOUT (Win32 only)

    match:在原始的,未标记的,通常是凌乱的文本中匹配标记化的单词和短语

    您可能会说:“大不了”,但是如果原始文本足够凌乱,更不用说Unicode字符泛滥了,这实际上是一项艰巨的任务。 考虑一些存储在变量original_text中的文本,例如: I am writing a letter ! Sometimes,I forget ...

    C_中字符串常用的处理方法

    此外,可以使用Unicode值(如`\u0027`)来表示特殊字符。使用`@`符号前缀创建的字符串(称为字面量字符串)可以避免大部分转义,除非是双引号。 10. **字符串比较和操作方法**: - `Compare`和`CompareOrdinal`...

    python 文本空格处理

    6. **`normalize()`**:对于Unicode字符串,`unicodedata` 模块的`normalize()` 函数可以帮助处理不同的空格字符,如全角空格、非断行空格等: ```python import unicodedata normalized_text = unicodedata....

    Notepad++_编辑工具tab空格_Tabú_

    通过安装如"Spaces and Tabs"这样的插件,用户可以更直观地查看和管理文档中的空格和Tab。这些插件提供了可视化的指示,使开发者能够一眼看出哪些部分使用了Tab,哪些部分使用了空格,有助于找出潜在的格式问题。 ...

    一些用于测试xsspayload.docx

    - `(7)` 到 `(10)` 使用了字符编码,如Unicode和ASCII编码,绕过过滤机制。 - `(11)` 到 `(14)` 展示了将JavaScript代码分散在多个位置,以避开简单的过滤。 - `(15)` 利用多行注入JavaScript。 5. **解决限制...

    escape、encodeURI 和 encodeURIComponent 的区别

    The escape method returns a string value (in Unicode format) that contains the contents of [the argument]. All spaces, punctuation, accented characters, and any other non-ASCII characters are replaced...

    php去除字符串中空字符的常用方法小结

    这些空白字符包括空格、制表符(\t)、换行符(\n)、回车符(\r)以及Unicode空白字符。例如: ```php $text = " \t jb51.net! \t "; $trimmed = trim($text); echo "trimmed = ($trimmed)"; ``` 这将输出:...

    vue中如何去掉空格的方法实现

    这一方法简单易用,但需要注意的是,它只能去除普通的空格,对于一些特殊的空白字符(如Unicode中的零宽度空白字符\u200B)则无能为力。 为了处理这些特殊字符,可以通过查看v-model.trim修饰符的源码来了解其工作...

Global site tag (gtag.js) - Google Analytics