`

位运算简介及实用技巧(一):基础篇

阅读更多

http://www.matrix67.com/blog/archives/263

   去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一,很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料,学习到了更多关于位运算的知识,有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章,与其说是原来那篇文章的follow-up,不如说是一个remake。当然首先我还是从最基础的东西说起。

什么是位运算?
    程序中的所有数在计算机内存中都是以二进制的形式储存的。位运算说穿了,就是直接对整数在内存中的二进制位进行操作。比如,and运算本来是一个逻辑运算符,但整数与整数之间也可以进行and运算。举个例子,6的二进制是110,11的二进制是1011,那么6 and 11的结果就是2,它是二进制对应位进行逻辑运算的结果(0表示False,1表示True,空位都当0处理):
     110
AND 1011
———-
    0010  –>  2

    由于位运算直接对内存数据进行操作,不需要转成十进制,因此处理速度非常快。当然有人会说,这个快了有什么用,计算6 and 11没有什么实际意义啊。这一系列的文章就将告诉你,位运算到底可以干什么,有些什么经典应用,以及如何用位运算优化你的程序。


Pascal和C中的位运算符号
    下面的a和b都是整数类型,则:
C语言  |  Pascal语言
——-+————-
a & b  |  a and b
a | b  |  a or b
a ^ b  |  a xor b
  ~a   |   not a
a << b |  a shl b
a >> b |  a shr b

    注意C中的逻辑运算和位运算符号是不同的。520|1314=1834,但520||1314=1,因为逻辑运算时520和1314都相当于True。同样的,!a和~a也是有区别的。


各种位运算的使用
    === 1. and运算 ===
    and运算通常用于二进制取位操作,例如一个数 and 1的结果就是取二进制的最末位。这可以用来判断一个整数的奇偶,二进制的最末位为0表示该数为偶数,最末位为1表示该数为奇数.

    === 2. or运算 ===
    or运算通常用于二进制特定位上的无条件赋值,例如一个数or 1的结果就是把二进制最末位强行变成1。如果需要把二进制最末位变成0,对这个数or 1之后再减一就可以了,其实际意义就是把这个数强行变成最接近的偶数。

    === 3. xor运算 ===
    xor运算通常用于对二进制的特定一位进行取反操作,因为异或可以这样定义:0和1异或0都不变,异或1则取反。
    xor运算的逆运算是它本身,也就是说两次异或同一个数最后结果不变,即(a xor b) xor b = a。xor运算可以用于简单的加密,比如我想对我MM说1314520,但怕别人知道,于是双方约定拿我的生日19880516作为密钥。1314520 xor 19880516 = 20665500,我就把20665500告诉MM。MM再次计算20665500 xor 19880516的值,得到1314520,于是她就明白了我的企图。
    下面我们看另外一个东西。定义两个符号#和@(我怎么找不到那个圈里有个叉的字符),这两个符号互为逆运算,也就是说(x # y) @ y = x。现在依次执行下面三条命令,结果是什么?
x <- x # y
y <- x @ y
x <- x @ y

    执行了第一句后x变成了x # y。那么第二句实质就是y <- x # y @ y,由于#和@互为逆运算,那么此时的y变成了原来的x。第三句中x实际上被赋值为(x # y) @ x,如果#运算具有交换律,那么赋值后x就变成最初的y了。这三句话的结果是,x和y的位置互换了。
    加法和减法互为逆运算,并且加法满足交换律。把#换成+,把@换成-,我们可以写出一个不需要临时变量的swap过程(Pascal)。
procedure swap(var a,b:longint);
begin
   a:=a + b;
   b:=a - b;
   a:=a - b;
end;

    好了,刚才不是说xor的逆运算是它本身吗?于是我们就有了一个看起来非常诡异的swap过程:
procedure swap(var a,b:longint);
begin
   a:=a xor b;
   b:=a xor b;
   a:=a xor b;
end;


    === 4. not运算 ===
    not运算的定义是把内存中的0和1全部取反。使用not运算时要格外小心,你需要注意整数类型有没有符号。如果not的对象是无符号整数(不能表示负数),那么得到的值就是它与该类型上界的差,因为无符号类型的数是用$0000到$FFFF依次表示的。下面的两个程序(仅语言不同)均返回65435。
var
   a:word;
begin
   a:=100;
   a:=not a;
   writeln(a);
end.

#include <stdio.h>
int main()
{
    unsigned short a=100;
    a = ~a;
    printf( "%dn", a );    
    return 0;
}

    如果not的对象是有符号的整数,情况就不一样了,稍后我们会在“整数类型的储存”小节中提到。

    === 5. shl运算 ===
    a shl b就表示把a转为二进制后左移b位(在后面添b个0)。例如100的二进制为1100100,而110010000转成十进制是400,那么100 shl 2 = 400。可以看出,a shl b的值实际上就是a乘以2的b次方,因为在二进制数后添一个0就相当于该数乘以2。
    通常认为a shl 1比a * 2更快,因为前者是更底层一些的操作。因此程序中乘以2的操作请尽量用左移一位来代替。
    定义一些常量可能会用到shl运算。你可以方便地用1 shl 16 – 1来表示65535。很多算法和数据结构要求数据规模必须是2的幂,此时可以用shl来定义Max_N等常量。

    === 6. shr运算 ===
    和shl相似,a shr b表示二进制右移b位(去掉末b位),相当于a除以2的b次方(取整)。我们也经常用shr 1来代替div 2,比如二分查找、堆的插入操作等等。想办法用shr代替除法运算可以使程序效率大大提高。最大公约数的二进制算法用除以2操作来代替慢得出奇的mod运算,效率可以提高60%。


位运算的简单应用
    有时我们的程序需要一个规模不大的Hash表来记录状态。比如,做数独时我们需要27个Hash表来统计每一行、每一列和每一个小九宫格里已经有哪些数了。此时,我们可以用27个小于2^9的整数进行记录。例如,一个只填了2和5的小九宫格就用数字18表示(二进制为000010010),而某一行的状态为511则表示这一行已经填满。需要改变状态时我们不需要把这个数转成二进制修改后再转回去,而是直接进行位操作。在搜索时,把状态表示成整数可以更好地进行判重等操作。这道题是在搜索中使用位运算加速的经典例子。以后我们会看到更多的例子。
    下面列举了一些常见的二进制位的变换操作。

    功能              |           示例            |    位运算
———————-+—————————+——————–
去掉最后一位          | (101101->10110)           | x shr 1
在最后加一个0         | (101101->1011010)         | x shl 1
在最后加一个1         | (101101->1011011)         | x shl 1+1
把最后一位变成1       | (101100->101101)          | x or 1
把最后一位变成0       | (101101->101100)          | x or 1-1
最后一位取反          | (101101->101100)          | x xor 1
把右数第k位变成1      | (101001->101101,k=3)      | x or (1 shl (k-1))
把右数第k位变成0      | (101101->101001,k=3)      | x and not (1 shl (k-1))
右数第k位取反         | (101001->101101,k=3)      | x xor (1 shl (k-1))
取末三位              | (1101101->101)            | x and 7
取末k位               | (1101101->1101,k=5)       | x and (1 shl k-1)
取右数第k位           | (1101101->1,k=4)          | x shr (k-1) and 1
把末k位变成1          | (101001->101111,k=4)      | x or (1 shl k-1)
末k位取反             | (101001->100110,k=4)      | x xor (1 shl k-1)
把右边连续的1变成0    | (100101111->100100000)    | x and (x+1)
把右起第一个0变成1    | (100101111->100111111)    | x or (x+1)
把右边连续的0变成1    | (11011000->11011111)      | x or (x-1)
取右边连续的1         | (100101111->1111)         | (x xor (x+1)) shr 1
去掉右起第一个1的左边 | (100101000->1000)         | x and (x xor (x-1))


    最后这一个在树状数组中会用到。


Pascal和C中的16进制表示
    Pascal中需要在16进制数前加$符号表示,C中需要在前面加0x来表示。这个以后我们会经常用到。

整数类型的储存
    我们前面所说的位运算都没有涉及负数,都假设这些运算是在unsigned/word类型(只能表示正数的整型)上进行操作。但计算机如何处理有正负符号的整数类型呢?下面两个程序都是考察16位整数的储存方式(只是语言不同)。
var
   a,b:integer;
begin
   a:=$0000;
   b:=$0001;
   write(a,' ',b,' ');
   a:=$FFFE;
   b:=$FFFF;
   write(a,' ',b,' ');
   a:=$7FFF;
   b:=$8000;
   writeln(a,' ',b);
end.

#include <stdio.h>
int main()
{
    short int a, b;
    a = 0x0000;
    b = 0x0001;
    printf( "%d %d ", a, b );
    a = 0xFFFE;
    b = 0xFFFF;
    printf( "%d %d ", a, b );
    a = 0x7FFF;
    b = 0x8000;
    printf( "%d %dn", a, b );
    return 0;
}

    两个程序的输出均为0 1 -2 -1 32767 -32768。其中前两个数是内存值最小的时候,中间两个数则是内存值最大的时候,最后输出的两个数是正数与负数的分界处。由此你可以清楚地看到计算机是如何储存一个整数的:计算机用$0000到$7FFF依次表示0到32767的数,剩下的$8000到$FFFF依次表示-32768到-1的数。32位有符号整数的储存方式也是类似的。稍加注意你会发现,二进制的第一位是用来表示正负号的,0表示正,1表示负。这里有一个问题:0本来既不是正数,也不是负数,但它占用了$0000的位置,因此有符号的整数类型范围中正数个数比负数少一个。对一个有符号的数进行not运算后,最高位的变化将导致正负颠倒,并且数的绝对值会差1。也就是说,not a实际上等于-a-1。这种整数储存方式叫做“补码”。

分享到:
评论

相关推荐

    富士通C手册(基础篇,提高篇,精华篇)

    提高篇将深化C语言的掌握,涵盖了更复杂的主题,如结构体与联合体、位运算、动态内存管理、预处理器宏、文件操作。此外,富士通C手册的提高篇可能会专门讨论富士通架构特有的编程技术,例如并行处理、嵌入式系统的...

    计算机考研机试攻略 - 满分篇.pdf

    本书分为四个部分,每部分都包含了一系列实用技巧和核心概念: 1. 技巧之巅: - 输入输出加速外挂:讲解如何高效地读入数据和输出结果,提高程序运行速度。 - 调试技巧:介绍如何快速定位和修复代码错误,提升...

    AutoLISP&DCL;基础篇

    总的来说,AutoLISP&DCL基础篇是一本内容全面、结构清晰、实用性高的专业教材。它不仅适用于AutoCAD初学者,也是中级工程师进一步提升技能的良师益友。通过本书的学习,读者能够掌握使用AutoLISP和DCL大幅提高Auto...

    2021-2022年收藏的精品资料专题01 一个有理数运算的计算方法与拓展 备战中考数学典例精做题集教师版 .doc

    这篇文档主要围绕有理数运算展开,探讨了中学数学中的一种常见题型——有理数的计算与拓展,尤其强调了解题策略和技巧。有理数运算是基础数学中的核心内容,它为后续的数学学习提供了运算基础。文档中提到了几个关键...

    C语言名题精选百则 技巧篇+源码

    《C语言名题精选百则 技巧篇》是一本专为C语言爱好者和学习者设计的书籍,由冼镜光编着。这本书的核心在于通过一百个精心挑选的编程题目,帮助读者深入理解和掌握C语言的技巧。这些题目涵盖了C语言的各个关键领域,...

    三菱PLC QCPU用户手册(功能解说-程序基础篇).zip

    总的来说,"三菱PLC QCPU用户手册(功能解说-程序基础篇)"是一本全面而实用的指南,它不仅讲解了Q系列PLC的基本操作,还涵盖了高级功能和应用策略,对于想要深入了解和使用三菱QCPU的工程师来说,是一份不可多得的...

    matlab零基础数学建模-基础篇:14 矩阵中级阶段.zip

    了解这些运算的规则是中级阶段的基础,特别是矩阵乘法与向量乘法的区别。 3. **矩阵函数**:MATLAB提供丰富的矩阵函数,如行列式(det())、逆矩阵(inv())、特征值与特征向量(eig())、奇异值分解(svd())等。...

    OI,ACM国家集训队2014论文集

    - **何琦的《回归本源——位运算及其应用》**:通过本文,读者可以了解位运算的基本操作及其实用技巧,包括位运算在数据压缩、状态表示等方面的应用。 - **沈洋的《寻找第k优解的几种方法》**:这篇论文总结了几种...

    32位mcu开发攻略(下)技巧篇

    在下册中,作者着重讲解了32位MCU开发中的实用技巧和高级功能,帮助开发者提升项目效率和产品性能。以下将对其中的关键知识点进行详细阐述。 1. **LPC1700系列概述**:LPC1700是NXP半导体公司推出的一系列基于ARM ...

    MATLAB 7.X程序设计--基础篇教程

    本教程“MATLAB 7.X程序设计--基础篇”旨在为初学者提供一个系统且全面的学习路径,帮助他们快速掌握MATLAB的基本操作和编程技巧。 在MATLAB程序设计中,基础概念主要包括以下几个方面: 1. **环境与界面**:...

    SystemView教程(基础篇、提高篇)

    首先,让我们从基础篇开始。基础篇主要涉及以下几个方面: 1. **安装步骤**:了解如何下载和安装SystemView,包括系统需求、安装过程以及注册激活等关键步骤。确保正确安装是后续学习的前提。 2. **界面介绍**:...

    四则运算实用PPT学习教案.pptx

    这篇PPT的学习教案主要聚焦于四则运算,包括加法、减法、乘法和除法,以及它们的运算顺序。四则运算在数学和会计学中是基础且至关重要的,因为它们帮助我们准确地处理数值计算。 首先,我们要理解四则运算的运算...

    基础篇:只需-7-步-从零开始掌握-Python-机器学习(附资源).doc

    ### 基础篇:只需7步从零开始掌握Python机器学习 #### 第一步:基本Python技能 在开始机器学习之旅之前,掌握Python基础知识至关重要。Python作为一种广泛应用的编程语言,在科学计算和机器学习领域有着不可替代的...

    CUDA 编程:基础与实践_樊哲勇1

    总的来说,《CUDA 编程:基础与实践》是一本全面且实用的CUDA编程教程,它不追求涵盖所有的CUDA特性,而是精心挑选了最核心的知识点,旨在帮助读者快速掌握CUDA编程并应用于实际项目中。无论你是初涉GPU计算,还是...

    运算放大器应用设计的几个技巧

    本篇将详细探讨运算放大器应用设计的几个关键技巧,帮助你深入理解并掌握运放的实用技能。 一、基本运放电路 1. 非反相放大器:在非反相输入端加入信号,通过调整反馈电阻比例实现增益控制。这种配置提供了一个...

    C语言编程宝典大全(内含:C语言课程设计案例精编+电脑技巧精彩文章100篇)

    8. **电脑技巧精彩文章100篇**:这部分可能包含各种与计算机科学相关的实用技巧,如代码优化、调试技巧、版本控制工具的使用、软件工程方法论等,旨在拓宽学习者的视野,提升综合技能。 通过阅读《C语言编程宝典...

    一年级数学下册100以内加减混合运算题.doc

    这篇文档是针对小学一年级学生设计的一系列100以内加减混合运算练习题,旨在帮助孩子们巩固基础数学技能,提高他们解决数学问题的能力。在100以内的加减混合运算中,孩子需要掌握基本的算术规则,理解加法和减法的...

    两位数乘以一位数地竖式练习题参考.pdf

    这篇文档是针对小学数学教育中的一个关键概念——两位数乘以一位数的竖式计算进行的练习题集合。竖式计算是一种基本的算术运算方法,尤其在解决涉及多位数乘法的问题时非常实用。以下将对这个知识点进行详细解释: ...

Global site tag (gtag.js) - Google Analytics