Python 图像库手册

lampeter123

浏览: 323300 次
性别:
来自: 广州

最近访客更多访客>>

小卒大兵

AQN_999

cmdjqxclb

luozenglin

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Python FP OS 嵌入式脚本

使用Image类
Python图像库中最重要的类是Image类，在与之同名的模块中定义。有几种方法可以创建Image类的实例；或者从文件载入一个图像，或者处理其它图像，或者凭空创建一个图像。

可以使用Image模块提供的open函数从文件载入一个图像。

>>> import Image
>>> im = Image.open("lena.ppm")

成功的话，这个函数返回一个Image对象。现在就可以使用实例属性来检查文件的内容了。

>>> print im.format, im.size, im.mode
PPM (512, 512) RGB

format属性确定文件的来源。如果图像不是从文件读入的，这个值设为None。size属性是一个包含图像高度和宽度（以像素为单位）的2元元组（tuple）。mode定义了图像的波段的值和名称，以及像素类型和深度。一般的模式有：“L”(luminance—亮度)代表灰度图像，“RGB”代表真彩色图像，和“CMYK”代表印前（pre-press）图像。

不能打开图像会引发（raised）一个IOError异常。

一旦有了一个Image类的实例，你就可以使用该类提供的方法处理和操作图像了。比如，让我们把刚刚导入（loaded）的图像显示出来：

    >>> im.show()
（标准的show函数的效率不是很高，因为它首先要把图像保存到一个临时文件，然后调用xv程序显示图像。如果没有安装xv，这个函数甚至不工作，如果工作的话，这个函数对调试和测试很方便。）

接下来的部分提供了对这个图像库中定义的不同函数的一个概览。

读入和保存图像
Python图像库支持大量的图像文件格式。使用Image模块中的open函数可以从磁盘读入文件。打开文件的时候，你不需要知道文件的格式。图像库根据文件的内容自动决定文件的格式。

要保存文件，可以使用Image类的save方法。保存文件的时候，名称很重要。因为除非你指定了文件的格式，图像库会根据文件的扩展名来决定保存文件使用的格式。

把图像转换为JPEG文件

import os, sys
import Image

for infile in sys.argv[1:]:
    f, e = os.path.splitext(infile)
    outfile = f + ".jpg"
    if infile != outfile:
        try:
            Image.open(infile).save(outfile)
        except IOError:
            print "cannot convert", infile
（译注：似乎输入文件不能是GIF文件）
可以为save方法提供第二个参数来明确指定文件格式。如果使用了非标准的扩展名，必须像下面这样指定文件格式：

创建JPEG缩略图（Thunbnails）

import os, sys
import Image

size = 128, 128

for infile in sys.argv[1:]:
    outfile = os.path.splitext(infile)[0] + ".thumbnail"
    if infile != outfile:
        try:
            im = Image.open(infile)
            im.thumbnail(size)
            im.save(outfile, "JPEG")
        except IOError:
            print "cannot create thumbnail for", infile
注意：除非必要，图像库不会解码或者载入栅格数据，这一点非常重要。打开文件时，文件头会被读入，以确定文件格式，并从中提取诸如模式，大小等内容，以及解码文件需要的其它属性，但是文件剩下的部分放在后面处理。

这意味着打开文件操作执行很快，因为它和文件的大小和压缩格式无关。下面是一个快速识别一组图像文件的脚本：

识别图像文件

import sys
import Image

for infile in sys.argv[1:]:
    try:
        im = Image.open(infile)
        print infile, im.format, "%dx%d" % im.size, im.mode
    except IOError:
        pass

剪切，粘贴，合并图像
Image类包含了对图像中的部分区域（regions）进行操作的方法。crop方法可以提取图像中一个小矩形区域中的内容。

复制图像中一个小矩形部分

    box = (100, 100, 400, 400)
   region = im.crop(box)

矩形区域通过一个4元元组定义，对应的是（左，上，右，下）的坐标。Python图像库使用的坐标系统以左上角的坐标为（0，0）。同时注意，这里坐标指的是像素间的位置，所有上例中刚好指定了一块300x300的区域。

现在可以对这块区域进行各种处理，或者把它再粘贴到原来的图像上。

处理子矩形块，并粘贴回原图

    region = region.transpose(Image.ROTATE_180)
   im.paste(region, box)

在把区域贴回原图时，指定的大小必须与给定的区域匹配。另外，区域不能延伸到图像的外边。但是，原始图像的模式可以和区域的不同。如果它们的模式不一样的话，粘贴之前，区域的格式会自动转换（详见Colour Transforms节）。

下面是另一个例子：

滚动图像

def roll(image, delta):
     "Roll an image sideways"

     xsize, ysize = image.size

     delta = delta % xsize
     if delta == 0: return image
     part1 = image.crop((0, 0, delta, ysize))
     part2 = image.crop((delta, 0, xsize, ysize))
     image.paste(part2, (0, 0, xsize-delta, ysize))
     image.paste(part1, (xsize-delta, 0, xsize, ysize))

     return image

高级技巧，paste方法接受一个透明遮罩（transparency mask）的可选参数。对于这个参数，255表示粘贴的图像是不透明的（即，粘贴的图像和它原来一样）。如果这个参数的值是0，表示粘贴的图像是完全透明的。0-255之间的值表示不同的透明度。

Python还允许你处理多波段图像的某一个波段，比如RGB图像。split函数创建一组图像，每个图像包含了原图像的一个波段。merge函数接受一个模式和一个图像元组参数，并吧它们组成一个新图像。下面的例子交换了一个RGB图像的三个波段：

分离和合并波段

r, g, b = im.split()
im = Image.merge("RGB", (b, g, r))

几何变换
Image类包含了对图像进行缩放（resize）和旋转（rotate）的方法。前一个函数接受一个给出新大小的元组，对于后者，角的单位是度，方向是顺时针方向。

简单的几何变换

out = im.resize((128, 128))
out = im.rotate(45) # degrees counter-clockwise
如果是你90度为步长旋转图像，你即可以使用rotate方法，也可以使用transpose方法。transpose方法也可以在水平或垂直方向上翻转图像。

颠倒（Transposing）图像

out = im.transpose(Image.FLIP_LEFT_RIGHT)
out = im.transpose(Image.FLIP_TOP_BOTTOM)
out = im.transpose(Image.ROTATE_90)
out = im.transpose(Image.ROTATE_180)
out = im.transpose(Image.ROTATE_270)
transpose(ROTATE)和对应rotate操作的性能和结果没有任何区别。

更为一般的图像变换可以通过transform方法实现。详见其参考节。

颜色变换
Python图像库允许你使用convert函数在不同的像素表示（pixel representations）之间转换图像。

不同模式（modes）间的转换

    im = Image.open("lena.ppm").convert("L")
图像库支持每种支持模式到“L”和“RGB”模式之间的转换。其它模式之间的转换，可能会需要中间图像（intermediate image）（一般是“RGB”图像）。

图像增强
Python提供了许多方法和模块用来增强图像。

滤波器
ImageFilter模块包含许多预先定义好的增强滤波器，可以与filter配合使用。

应用滤波器

import ImageFilter
out = im.filter(ImageFilter.DETAIL)

点操作
point方法可以用来改变（translate）一幅图像的像素点值（比如，图像的反色操作）。大多数情况下，带有一个参数的函数对象可以传递给这个函数。每个像素都会按照传入的函数对象被处理处理：

应用点变换

# multiply each pixel by 1.2
out = im.point(lambda i: i * 1.2)
使用上面的技术，你可以快速应用任何简单表达式（变换）到图像上。也可以组合point和paste方法来对图像进行有选择性的修改。

处理单个波段

# split the image into individual bands
source = im.split()

R, G, B = 0, 1, 2

# select regions where red is less than 100
mask = 100 and 255)

# process the green band
out = source[G].point(lambda i: i * 0.7)

# paste the processed band back, but only where red was < 100
source[G].paste(out, None, mask)

# build a new multiband image
im = Image.merge(im.mode, source)
注意创建遮罩层（mask）的语法：

    imout = im.point(lambda i: expression and 255)
Python只计算决定一个逻辑表达式值所需的最少的部分表达式，并且返回检查的最后一个值作为表达式的值。所以如果上面表达式的值为false（0），Python不会再看第二个操作数，直接返回0。不然就返回255。

图像增强
实现更为高级的图像增强操作，可以使用ImageEnhance模块提供的类。一旦创建了一个图像，可以使用增强对象快速尝试不同的设置。

可以使用增强图像对象对象调整图像的对比度，亮度，颜色的平衡度和锐度。

增强图像

import ImageEnhance

enh = ImageEnhance.Contrast(im)
enh.enhance(1.3).show("30% more contrast")

图像序列
Python图像库包含一些对图像序列（所谓的动画（animation）格式）的基本支持。它支持的序列格式包括FLI/FLC，GIF，和一些还处于实验阶段的格式。TIFF也可以包含多个帧（frame）。

打开序列文件的时候，PIL自动加载序列的第一帧。可以使用seek和tell方法在不同的帧之间切换：

读取序列

import Image

im = Image.open("animation.gif")
im.seek(1) # skip to the second frame

try:
    while 1:
        im.seek(im.tell()+1)
        # do something to im
except EOFError:
    pass # end of sequence
正如你在这个例子中看到的，到达序列的末尾时，会得到一个EOFError异常。

注意，当大部分前版本的图像库的驱动只支持查找（seek）下一帧（如上面的例子所示）。要返回前面的帧，可能需要重新打开文件。

下面的迭代器（iterator）类让你可以使用for语句在序列中循环。

一个序列列迭代器类

class ImageSequence:
    def __init__(self, im):
        self.im = im
    def __getitem__(self, ix):
        try:
            if ix:
                self.im.seek(ix)
            return self.im
        except EOFError:
            raise IndexError # end of sequence

for frame in ImageSequence(im):
    # ...do something to frame...

Postscript打印
Python图像库包含了打印图像，文本和图像打印到Postscript打印机的函数。下面是一个例子：

绘制Postscript（没有成功）

import Image
import PSDraw

im = Image.open("lena.ppm")
title = "lena"
box = (1*72, 2*72, 7*72, 10*72) # in points

ps = PSDraw.PSDraw() # default is sys.stdout
ps.begin_document(title)

# draw the image (75 dpi)
ps.image(box, im, 75)
ps.rectangle(box)

# draw centered title
ps.setfont("HelveticaNarrow-Bold", 36)
w, h, b = ps.textsize(title)
ps.text((4*72-w/2, 1*72-h), title)

ps.end_document()

读入图像的更多内容
正如前面提到的，Image模块中的open函数被用来打开文件。很多时候，你只是把文件名作为参数传递给open函数：

im = Image.open("lena.ppm")如果一切正常的话，就返回一个Image对象。不然，就会引发一个IOError异常。

你也可以使用类文件（file-like）对象代替文件名。这个对象必须实现了read，seek和tell方法，并且以二进制模式打开。

从打开的文件中读入图像

fp = open("lena.ppm", "rb")
im = Image.open(fp)
可以使用StringIO类从字符串数据中读入图像。

从字符串中读入图像

import StringIO

im = Image.open(StringIO.StringIO(buffer))
注意，图像库会在读入图像头（image header）之前rewind文件（使用seek（0）函数）（注：就是把引用从新指向文件的开头）。另外，在读取图像数据的时候也会调用seek函数（通过load方法）。如果图像文件是嵌入在一个大文件中，比如tar文件，可以使用ContainerIO或者TarIO模块访问图像文件。

从tar存档文件中读取图像

import TarIO

fp = TarIO.TarIO("Imaging.tar", "Imaging/test/lena.ppm")
im = Image.open(fp)

控制解码器（Decoder）
某些解码器允许你在从文件中读入图像的时候对它进行操作。这些通常被用来在创建缩略图（通常在这个时候速度比质量更重要）以及使用黑白激光打印机打印（这时只需要一个灰度图像）的时候加速解码。

draft方法处理一个打开但是还没有加载的图像，所以它会尽可能的与所给的模式和大小匹配。这些是通过从新配置（reconfiguring）图像解码器实现的。

以草稿（draft）模式打开图像(没有成功)

im = Image.open(file)
print "original =", im.mode, im.size

im.draft("L", (100, 100))
print "draft =", im.mode, im.size
这将打印与下面类似的内容：

original = RGB (512, 512)
draft = L (128, 128)
注意得到的图像的模式和大小可能不与要求的完全匹配。如果要确保得到的图像的大小不比指定的大，可以使用thumbnail函数代替draft。

分享到：

PIL概念 | Java学习从入门到精通

2009-08-08 14:47
浏览 6100
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论