`
simohayha
  • 浏览: 1400092 次
  • 性别: Icon_minigender_1
  • 来自: 火星
社区版块
存档分类
最新评论

glibc中strlen的实现

阅读更多
glibc中的strlen的实现主要的思想就是每次检测4个字节(long int)。这样的话就降低了循环的次数,从而从整体上提高了效率。

这里它使用了两个技巧,一个是由于传进来的字符串的地址有可能不是4字节(long int)对其的,因此首先需要遍历字符串从而找到4字节对其的那个地址。然后再进行比较.

第二个技巧就是如何高效的判断4个字节中是否有字节为0.

下来来看源码,这个源码的注释还是满详细的。这里主要都是一些位计算的技巧:

size_t
strlen (str)
     const char *str;
{
  const char *char_ptr;
  const unsigned long int *longword_ptr;
  unsigned long int longword, himagic, lomagic;

  /* Handle the first few characters by reading one character at a time.
     Do this until CHAR_PTR is aligned on a longword boundary.  */

  for (char_ptr = str; ((unsigned long int) char_ptr
			& (sizeof (longword) - 1)) != 0;
       ++char_ptr)
    if (*char_ptr == '\0')
      return char_ptr - str;

  /* All these elucidatory comments refer to 4-byte longwords,
     but the theory applies equally well to 8-byte longwords.  */

  longword_ptr = (unsigned long int *) char_ptr;

  /* Bits 31, 24, 16, and 8 of this number are zero.  Call these bits
     the "holes."  Note that there is a hole just to the left of
     each byte, with an extra at the end:

     bits:  01111110 11111110 11111110 11111111
     bytes: AAAAAAAA BBBBBBBB CCCCCCCC DDDDDDDD

     The 1-bits make sure that carries propagate to the next 0-bit.
     The 0-bits provide holes for carries to fall into.  */
  himagic = 0x80808080L;
  lomagic = 0x01010101L;
  if (sizeof (longword) > 4)
    {
      /* 64-bit version of the magic.  */
      /* Do the shift in two steps to avoid a warning if long has 32 bits.  */
      himagic = ((himagic << 16) << 16) | himagic;
      lomagic = ((lomagic << 16) << 16) | lomagic;
    }
  if (sizeof (longword) > 8)
    abort ();

  /* Instead of the traditional loop which tests each character,
     we will test a longword at a time.  The tricky part is testing
     if *any of the four* bytes in the longword in question are zero.  */
  for (;;)
    {
      longword = *longword_ptr++;

      if (((longword - lomagic) & ~longword & himagic) != 0)
	{
	  /* Which of the bytes was the zero?  If none of them were, it was
	     a misfire; continue the search.  */

	  const char *cp = (const char *) (longword_ptr - 1);

	  if (cp[0] == 0)
	    return cp - str;
	  if (cp[1] == 0)
	    return cp - str + 1;
	  if (cp[2] == 0)
	    return cp - str + 2;
	  if (cp[3] == 0)
	    return cp - str + 3;
	  if (sizeof (longword) > 4)
	    {
	      if (cp[4] == 0)
		return cp - str + 4;
	      if (cp[5] == 0)
		return cp - str + 5;
	      if (cp[6] == 0)
		return cp - str + 6;
	      if (cp[7] == 0)
		return cp - str + 7;
	    }
	}
    }
}


代码比较长,不过注释也比较详细,这里主要分析下两个位运算:


  for (char_ptr = str; ((unsigned long int) char_ptr
			& (sizeof (longword) - 1)) != 0;
       ++char_ptr)
    if (*char_ptr == '\0')
      return char_ptr - str;


这里是做一个循环来判断4-byte对齐的那个地址,这里一般的编译器传递进来的字符串指针都是4-byte对其的,因此这步在很多编译器都是跳过的.

下来来看如何在4字节的数字中判断是否有某个字节为0.

  himagic = 0x80808080L;
  lomagic = 0x01010101L;
if (((longword - lomagic) & ~longword & himagic) != 0)


这里分两个部分看.

第一部分(longword - lomagic) 这个表达式是用来判断最高位的,它的意思是: 如果longword的任何一个字节如果大于0x80或者等于0的情况下,它的这个字节的最高位的值都会是不等于0的.

第二部分(~longword & himagic)这个表达式是用来判断longword的每个字节的最高位的设置,也就是判断longword是否小于0x80,如果小于0x80则这个表达式的值是himagic(0x80808080).否则就是0.


因此这两部分合并起来刚好就是如果longword的某个字节小于0x80,并且某个字节为0,则整个表达式的值不为0.

而我们知道传进来的字符串的每个字符的大小的ascii码的范围就是[0,127],也就是肯定是小于0x80的.所以这个表达式就刚好是我们所要的.
4
0
分享到:
评论
13 楼 Mr.Me 2010-03-24  
可能是数学不太好,还是无法理解
  himagic = 0x80808080L;
  lomagic = 0x01010101L;
if (((longword - lomagic) & ~longword & himagic) != 0)
12 楼 archerzz 2010-02-28  
meta 写道
joshzhu 写道
谢谢simohayha兄的考古挖掘工作 下面是我的几个观点:

1、if (((longword - lomagic) & himagic) != 0) 和 if (((longword - lomagic) & ~longword & himagic) != 0) 这两种写法都是对的,也就是说,先前的glibc没有bug!而新版本的glibc多出的& ~longword从效率上看更慢。因此这个fix是个倒退。

2、两种写法的strlen都可以正确处理值大于128的情况。


第一种写法会将字节>128或=0的情况做同样处理.
第二种写法由 ~longword & himagic保证剔除了字节longword >= 128的被选中特殊处理的情况, 剩余的 & (longword - lowmagic)只需要从 < 128中判断出 = 0的情况做处理即可.

这两种写法应该都没啥太大问题, 因为最终特殊处理代码中还是会去试图找到那个=0的字节.

这个strlen貌似不仅仅统计ASCIId字符长度吧....

第一种写法,等于是跳到后面的if else来剔出 〉128的情况,逻辑上不错,但是性能是不是略为差一点呢?我估计那个bug是performance的improvement吧,毕竟在Bug系统里不一定就是bug。
另外,有点好奇,这个实现,真的会快很多吗?其代码里又是for又是if,效率真的快?
11 楼 meta 2010-02-27  
joshzhu 写道
谢谢simohayha兄的考古挖掘工作 下面是我的几个观点:

1、if (((longword - lomagic) & himagic) != 0) 和 if (((longword - lomagic) & ~longword & himagic) != 0) 这两种写法都是对的,也就是说,先前的glibc没有bug!而新版本的glibc多出的& ~longword从效率上看更慢。因此这个fix是个倒退。

2、两种写法的strlen都可以正确处理值大于128的情况。


第一种写法会将字节>128或=0的情况做同样处理.
第二种写法由 ~longword & himagic保证剔除了字节longword >= 128的被选中特殊处理的情况, 剩余的 & (longword - lowmagic)只需要从 < 128中判断出 = 0的情况做处理即可.

这两种写法应该都没啥太大问题, 因为最终特殊处理代码中还是会去试图找到那个=0的字节.

这个strlen貌似不仅仅统计ASCIId字符长度吧....
10 楼 ajonjun 2010-01-15  
简单明了,谢谢楼主分享。有机会请教下
9 楼 linac 2009-08-10  
这里数学原理:
a-1如果不进位,则最高位不变, ~a的最高位与a相反,
因此(a-1) & ~a的最高位为0。
仅当a=0时,a-1进位,最高位改变,与~a的最高位一致,则(a-1)&~a的最高位为1


明显的一个bug。
8 楼 simohayha 2009-08-05  
joshzhu 写道
谢谢simohayha兄的考古挖掘工作 下面是我的几个观点:

1、if (((longword - lomagic) & himagic) != 0) 和 if (((longword - lomagic) & ~longword & himagic) != 0) 这两种写法都是对的,也就是说,先前的glibc没有bug!而新版本的glibc多出的& ~longword从效率上看更慢。因此这个fix是个倒退。

2、两种写法的strlen都可以正确处理值大于128的情况。

3、这段注释也应该去掉
/* Bits 31, 24, 16, and 8 of this number are zero.  Call these bits
     the "holes."  Note that there is a hole just to the left of
     each byte, with an extra at the end:

     bits:  01111110 11111110 11111110 11111111
     bytes: AAAAAAAA BBBBBBBB CCCCCCCC DDDDDDDD

     The 1-bits make sure that carries propagate to the next 0-bit.
     The 0-bits provide holes for carries to fall into.  */

P.S. 等俺有空给glibc那帮人写封mail?:wink:



哈,我也是觉得有些奇怪,明显多了一次与操作,效率会变慢.

而且去掉~longword,也看不出那里错了,可Ulrich Drepper偏偏就当bug给fix了..支持你发email问他..
7 楼 joshzhu 2009-08-05  
谢谢simohayha兄的考古挖掘工作 下面是我的几个观点:

1、if (((longword - lomagic) & himagic) != 0) 和 if (((longword - lomagic) & ~longword & himagic) != 0) 这两种写法都是对的,也就是说,先前的glibc没有bug!而新版本的glibc多出的& ~longword从效率上看更慢。因此这个fix是个倒退。

2、两种写法的strlen都可以正确处理值大于128的情况。

3、这段注释也应该去掉
/* Bits 31, 24, 16, and 8 of this number are zero.  Call these bits
     the "holes."  Note that there is a hole just to the left of
     each byte, with an extra at the end:

     bits:  01111110 11111110 11111110 11111111
     bytes: AAAAAAAA BBBBBBBB CCCCCCCC DDDDDDDD

     The 1-bits make sure that carries propagate to the next 0-bit.
     The 0-bits provide holes for carries to fall into.  */

P.S. 等俺有空给glibc那帮人写封mail?:wink:
6 楼 andrew913 2009-08-05  
himagic = 0x80808080L;
lomagic = 0x01010101L;

(longword - lomagic) & himagic

貌似比较好理解,不知道为什么被 bug-fix了

如果有中文,貌似和挨个遍历没区别。不知道有没有高效的方法。

另外如果4个字节的并排对比,万一第一个字节就已经是 '\0'了呢?
那不是越界了。


5 楼 andrew913 2009-08-05  
始终认为应届生应该来搞搞这些东西。
比做那种XXXXX系统的项目经验有前途多了。
4 楼 simohayha 2009-08-04  
joshzhu 写道
64位下8字节呢。BTW,还有另一种写法:
if (((longword - lomagic) & himagic) != 0) {
...
}

P.S.楼主看的glibc是什么版本的?



你的这种写法,貌似在2.10当bug被fix了:

http://sourceware.org/ml/glibc-cvs/2009-q1/msg00512.html

http://sources.redhat.com/bugzilla/show_bug.cgi?id=5807


我看的版本是2.10..
3 楼 joshzhu 2009-08-04  
64位下8字节呢。BTW,还有另一种写法:
if (((longword - lomagic) & himagic) != 0) {
...
}

P.S.楼主看的glibc是什么版本的?
2 楼 mryufeng 2009-08-04  
glibc的作者 也就是这位先生 写了如下的书
http://mryufeng.iteye.com/blog/429084
1 楼 andrew913 2009-08-04  
strlen,非常精妙。

相关推荐

    glibc函数手册.zip。

    glibc中的字符串处理函数包括`strlen`、`strcpy`、`strcat`、`strcmp`等,它们提供了对C风格字符串的基本操作。此外,还有`strstr`用于查找子字符串,`strtok`用于分隔字符串,`strncpy`提供安全的字符串复制,以及`...

    glibc-2.2.5.tar.gz

    1. **基本库函数**:glibc提供了大量的C语言标准库函数,如内存管理(malloc、calloc、free等)、字符串操作(strcpy、strcat、strlen等)、输入/输出(printf、scanf系列)、数学运算(sqrt、sin、cos等)等。...

    VC6.0SRC 与 glibc-2.21

    5. **标准库函数实现**:比如strcpy、strlen、printf等,理解其性能优化策略和安全考虑。 6. **兼容性和移植性**:对比两者的实现,可以看到为了跨平台兼容性所做出的设计决策和权衡。 7. **系统调用接口**:glibc...

    glibc-2.3.2.tar.gz

    在本文中,我们将详细探讨glibc 2.3.2版本,以及其在Linux系统中的重要性与功能。 一、glibc简介 glibc作为开源项目GNU的一部分,由自由软件基金会(FSF)维护,其目标是提供一个符合ANSI C和POSIX标准的C库。...

    glibc

    glibc,全称为GNU C Library,是GNU项目中的一个核心组件,为Linux和其他类UNIX系统提供了C语言编程接口。这个库包含了各种标准C函数,以及许多操作系统特定的API,使得开发者可以利用这些功能编写高效、跨平台的...

    glibc开源库源码分享

    glibc不仅包含了C标准库,还包含了POSIX、Unix等标准的实现,是Linux开发中不可或缺的一部分。 glibc-2.23是glibc的一个具体版本,它代表了glibc在2016年发布的一个稳定版本。这个版本包含了对新硬件平台的支持,...

    C语言标准代码库存档(C库、STL库、Glibc库).zip

    通过研究这个压缩包中的源代码,你可以深入理解C语言和C++的底层实现,学习如何高效地使用C库、STL库和Glibc库。这将有助于提升你的编程技能,尤其是在系统级编程和嵌入式领域。了解这些库的工作原理,有助于优化...

    C语言标准库最新源码glibc-2.30.zip

    1. **字符串函数**:glibc中的字符串函数是C语言编程的基础,例如`strlen()`用于计算字符串长度,`strcpy()`和`strncpy()`用于复制字符串,`strcmp()`和`strncmp()`进行字符串比较,`strcat()`和`strncat()`用于连接...

    gnu_libc.pdf

    它是Linux系统中最为广泛使用的C库实现,为应用程序提供了标准C库的各种功能,包括文件I/O流操作、套接字通讯、本地化等。 2. 文件I/O流 glibc中提供了丰富的文件I/O流操作API,允许用户读写文件和进行相关的文件...

    glibc函数手册

    这个“glibc函数手册”是一份非常重要的参考资料,它详尽地列出了glibc库中包含的各种函数,帮助开发者理解和使用这些函数进行高效、可靠的程序开发。 在Linux C编程中,glibc是必不可少的一部分,它不仅包含了...

    C 库函数 glibc-2.7

    8. **string**:包含了一系列处理字符串的函数,如strcpy、strlen、strcat等,是C语言编程中常用的工具。 9. **include**:包含了大量的头文件,定义了各种类型、常量、函数原型等,是编写C程序时必不可少的引用。 ...

    glibc-ports-2.11.tar.gz

    《GNU C 库(glibc)详解及其在Linux系统中的应用》 GNU C 库(GNU C Library),简称 glibc,是 Linux 和其他类 Unix 操作系统中最常用的C语言运行时库,它由自由软件基金会(FSF)的GNU项目开发并维护。glibc-...

    libc.so.6 libc.so.6

    `libc.so.6`是Glibc(GNU C Library)的一个版本标识,Glibc是Linux系统中实现POSIX和C标准的开源C库。Glibc不仅包含了C标准库,还提供了许多与系统接口相关的函数,如网络通信、进程控制、文件系统操作等。`libc.so...

    libc库是本人接下来要重点再次学习的东西

    深入研究glibc-2.31的具体实现,可以帮助开发者了解最新的技术趋势,提高代码质量,确保程序的稳定性和安全性。在实践中,开发者应通过阅读文档、分析源码、参与社区讨论等方式,不断提升对libc库的理解和运用能力。

    GNU C库源码

    GNU C库,简称glibc,是Linux系统中最常用的C语言标准库,它为C程序员提供了大量的系统调用和标准库函数,是理解和开发Linux应用程序的基础。本文将深入探讨glibc-2.25版本的源码,揭示其背后的实现原理和设计思路。...

    Linux_C函数库参考手册[完整版].7z

    在Linux中,glibc不仅实现了C标准库,还添加了许多针对Unix和Linux环境的特定功能。 二、glibc核心组件 1. **标准I/O库**:提供了诸如printf、scanf等格式化输入输出函数。 2. **字符串和内存操作**:如strcpy、...

    C语言库函数源码----

    2. **字符串处理**:`strcpy`、`strcat`、`strcmp`、`strlen`等字符串操作函数的实现,展示了如何高效安全地处理C语言中的字符数组。同时,`strerror`用于将错误代码转化为可读的错误信息。 3. **输入/输出**:`...

    libc 源代码

    在编程领域,特别是在Linux系统中,libc是一个至关重要的组成部分,它是GNU C库的实现,提供了大量的C语言标准库函数,是开发者日常编程的基础。本文将围绕"libc源代码"这一主题,对glibc-2.17这个版本进行深入探讨...

    Linux 函数库 手册

    glibc实现了POSIX标准的函数,如中的`fork`用于创建子进程,`popen`和`pclose`用于与命令行交互,`signal`处理信号等。 3. **System Calls**:Linux内核提供了系统调用来实现对硬件和操作系统服务的访问。glibc将...

    C常用的LinuxC语言函数库

    3. **Berkeley Unix**:包括4.2BSD、4.3BSD、4.4BSD等版本,glibc实现了这些版本中的非标准化函数。 4. **SVID (System V Interface Definition)**:描述AT&T Unix System V操作系统的文档,glibc支持了大部分SVID...

Global site tag (gtag.js) - Google Analytics