Bash字符串处理(与Java对照) - 8.计算字符串长度
In Java
取字符数量
一个汉字算1个字符。
int len = s.length();
JavaDoc class String 写道
public int length()
Returns the length of this string. The length is equal to the number of Unicode code units in the string.
Specified by:
length in interface CharSequence
Returns:
the length of the sequence of characters represented by this object.
取字节数量
一个汉字算几个字节,取决于编码方式。
int numOfBytes = s.getBytes().length;
JavaDoc class String 写道
byte[] getBytes()
Encodes this String into a sequence of bytes using the
platform's default charset, storing the result into a new byte array.
byte[] getBytes(Charset charset)
Encodes this String into a sequence of bytes using the given charset, storing the result into a new byte array.
byte[] getBytes(String charsetName)
Encodes this String into a sequence of bytes using the named charset, storing the result into a new byte array.
In Bash
取变量STR的长度(推荐方式)
格式:${#STR}
[root@jfht ~]# STR="Hello World"
[root@jfht ~]# echo ${#STR}
11
使用expr length命令取字符串长度
用expr命令,也可以取到字符串长度,但都没有上面的高效,因为上面的方式是Bash内置的方式,而expr命令是外部命令。
格式:expr length $STR
man expr 写道
length STRING
length of STRING
使用expr match命令取字符串长度
格式1:expr "$STR" : ".*"
格式2:expr match "$STR" ".*"
man expr 写道
STRING : REGEXP
anchored pattern match of REGEXP in STRING
match STRING REGEXP
same as STRING : REGEXP
[root@jfht ~]# STR="Hello World"
[root@jfht ~]# expr length $STR
expr: 语法错误
因为STR中包含空白,造成了问题,要加上双引号。
[root@jfht ~]# expr length "$STR"
11
[root@jfht ~]# expr "$STR" : ".*"
11
[root@jfht ~]# expr match "$STR" ".*"
11
用wc命令取字符串长度
使用wc命令也可以实现字符串长度计算。
格式1:wc -c <<<"$STR"
比实际的字节数多1,会多输出一个换行,等同于 echo "$STR" | wc -c 而不是下面这个
格式2:echo -n "$STR" | wc -c
上面是计算字节数,如果是中文的话,每个中文为2个字节(当LANG=zh_CN.GB18030)。
格式3:wc -m <<<"$STR"
比实际的字符数多1,会多输出一个换行,等同于 echo "$STR" | wc -m 而不是下面这个
格式4:echo -n "$STR" | wc -m
上面是计算字符数,与${#STR}相同,每个汉字是按1个字符计算。
man wc 写道
-c, --bytes
print the byte counts
-m, --chars
print the character counts
[root@jfht ~]# STR=123456789
[root@jfht ~]# echo ${#STR}
9
[root@jfht ~]# wc -c <<<"$STR
"
10
[root@jfht ~]# echo -n "$STR" | wc -c
9
[root@jfht ~]# wc -m <<<"$STR"
10
[root@jfht ~]# echo -n "$STR" | wc -m
9
[root@jfht ~]# STR=今年是2011年
[root@jfht ~]# echo ${#STR}
8
[root@jfht ~]# wc -c <<<"$STR"
13
[root@jfht ~]# echo -n "$STR" | wc -c
12
[root@jfht ~]# wc -m <<<"$STR"
9
[root@jfht ~]# echo -n "$STR" | wc -m
8
[root@jfht ~]# STR="Hello World"
[root@jfht ~]# echo ${#STR}
11
[root@jfht ~]# wc -c <<<"$STR"
12
[root@jfht ~]# echo -n "$STR" | wc -c
11
[root@jfht ~]# wc -m <<<"$STR"
12
[root@jfht ~]# echo -n "$STR" | wc -m
11
、
本文链接:http://codingstandards.iteye.com/blog/1173125
(转载请注明出处)
返回目录:Java程序员的Bash实用指南系列之字符串处理(目录)
上节内容:Bash字符串处理(与Java对照) - 7.字符串与默认值
下节内容:Bash字符串处理(与Java对照) - 9.获取字符串指定位置的字符、遍历字符串中的字符
分享到:
相关推荐
MySQL Connector/J是MySQL数据库与Java应用程序之间的桥梁,它是一个实现了JDBC(Java Database Connectivity)标准的MySQL驱动程序。"mysql-connector-java-5.1.40.tar.gz" 是这个驱动程序的一个特定版本,版本号为...
bash-3.1-MSYS-1.0.11-snapshot.tar.bz2 ffmpeg 安装用包!
在Mac上,安装完成后通常需要手动配置环境变量,通过修改"~/.bash_profile"或"~/.zshrc"文件,添加类似"export JAVA_HOME=/path/to/jdk11.0.8"的语句,确保系统可以找到Java命令。 Java 11作为长期支持(LTS)版本...
```bash rpm -ivh libaio-devel-0.3.106-3.2.i386.rpm ``` 而对于 x86_64 系统,则是: ```bash rpm -ivh libaio-devel-0.3.106-3.2.x86_64.rpm ``` 安装完成后,libaio-devel 提供的头文件(如 `libaio.h`)和开发...
-bash: /usr/local/jdk/jdk1.8.0_181/bin/java: /lib/ld-linux.so.2: bad ELF interpreter: No such file or directory 安装完后 java -version 查看版本出现: 原因是:没有那个文件或目录,找了很久发现需要...
MySQL Connector/J 8.0.13 是MySQL数据库与Java应用程序之间的重要桥梁,它是Oracle官方提供的用于Java平台的MySQL驱动程序。这个jar包允许开发者在Java应用中执行SQL语句,进行数据的读取、写入和管理MySQL数据库。...
在Linux系统中,字体管理是实现正确显示各种字符集,包括中文字符,的关键部分。`fontconfig`是一个开源的字体配置库,它负责管理和查找系统中的字体,为应用程序提供统一的接口来处理字体问题。在没有互联网连接...
修复redhat6 bash远程执行任意代码漏洞CVE-2014-6271
4. **动态类型字面量**:允许在字符串模板中使用`#{}`,使得表达式计算更为直观。 5. **文本块(Text Blocks)**:改进了多行字符串的表示,减少了转义字符的使用。 6. **改进的JShell(Java REPL)**:增强了交互式...
修复bash远程执行漏洞,支持redhat linux 64位操作系统 CVE-2014-6271
总的来说,rlwrap提供了一种更高效、更易用的方式来与sqlplus交互,尤其是在处理字符编码问题时。对于需要频繁使用sqlplus的数据库管理员和开发者来说,rlwrap是一个非常实用的工具。通过正确配置和使用rlwrap,可以...
4. **文本块(Text Blocks)**:新语法特性,用于处理多行字符串,减少转义字符的使用,提高代码可读性。 5. **改进的垃圾收集器**:包括ZGC(Z Garbage Collector)和Shenandoah,提供了更低的暂停时间,适合大...
综上所述,`protoc.exe`和`protobuf-java-2.5.0.jar`是protobuf工具链的关键组成部分,它们一起帮助开发者在Java环境中定义、编译和处理protobuf数据结构。为了充分利用protobuf,开发者需要了解如何编写.proto文件...
《TFTP服务器在RHEL5系统中的应用与配置详解》 TFTP(Trivial File Transfer Protocol,简单文件传输协议)是一种轻量级的文件传输协议,常用于设备初始化、固件更新、网络诊断等场景。在RHEL5(Red Hat Enterprise...
尽管Tomcat不是完整的Java EE应用服务器,但它与Java EE的其他组件(如EJB)可以通过与其他服务器(如JBoss或Glassfish)集成来支持。 **Linux系统**: Linux是一种自由和开放源代码的操作系统,广泛应用于服务器...
为了让系统知道新的交叉编译器的位置,需要在用户或系统的`~/.bashrc`或`/etc/bash.bashrc`文件中添加以下内容: ```bash export CC=/usr/local/arm-linux-gcc-4.4.3/bin/arm-linux-gcc export CXX=/usr/local/arm-...
同时,对于需要处理中欧语言的环境,ISO 8859-2字体的提供则至关重要,因为它包含了那些区域的特殊字符,使得文本可以正确地被识别和打印。 总的来说,这两个rpm包提供了必要的字体资源,增强了CentOS系统对中文和...
Java开发工具包(Java Development Kit,简称JDK)是Java编程语言的核心组件,它提供了编译、调试和运行Java应用程序所需的所有工具。标题中的"jdk-8u121-linux-x64.tar.gz"是一个针对64位Linux系统的JDK 8更新121...
rhel 6.4 64位 bash漏洞更新包
5. **文本块(Text Blocks)**:Java 11引入了文本块(多行字符串字面量)的预览特性,允许程序员方便地处理多行文本,减少字符串连接操作和转义字符的使用。 6. **其他语言特性和API增强**:包括对TLS协议的更新、...