`
kankan1218
  • 浏览: 277639 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

perl 读写文件

    博客分类:
  • perl
阅读更多
用Open() 函数打开文件

打开文件的常用方法是:

open(FH, "< $filename")

or die "Couldn't open $filename for reading: $!";



open() 函数通常带有两个参数,第一个为文件句柄,用于指向打开的文件,第二个参数是文件名及模式(文件的打开模式)的混合体,如果文件被成功打开,open()函数返回true,否则为false。我们用“or”来测试该条件。

上述代码中的模式由小于字符(<)来表示。如果文件不存在,open()将返回false。此时,你可以读文件句柄,但不可以写。

大于字符表示写。如果文件不存在,就会被创建。如果文件存在,文件被清除,以前的数据将会丢失。你可以写入文件句柄,但不可以读入。

# 如果文件不存在,就创建它

open(FH, "> $filename")

or die "Couldn't open $filename for writing: $!";


如果文件不存在,添加模式(用两个大于符号表示)可以用来创建新文件,如果文件存在,该模式并不会清除原来的数据。

同“<”或“读”模式一样,你只能对文件句柄进行写操作。 (所以的写入内容都添加到文件尾)。企图进行读操作,会产生运行错误。

open(FH, ">> $filename")

or die "Couldn't open $filename for appending: $!";


通过“+<”模式,你可以既可以读文件,又可以写文件。你可以通过tell() 函数在文件内部移动,通过seek()函数进行定位。如果文件不存在,就会被创建。如果文件已经存在,原来的数据不会被清除。

如果你打算清除原来的文件内容,或者自己调用truncate() 函数,或者使用“+>”模式。

open(FH, "+> $filename")

or die "Couldn't open $filename for reading and writing: $!";


注意“+<”和“+>”的区别,两者都可以可读可写。前者为非破坏性写,后者为破坏性写。

错误

错误是如何出现的?很多地方都会出现错误:如目录不存在,文件不可写入,你的程序丢失了文件句柄等等。

你应该检查系统调用的结果 (如open() 和sysopen()),看看是否调用成功。

为了帮助用户查错,通常使用“or die()”,你应记住这些用法。首先,应写出系统调用失败(“open”)的信息。其次,应写出文件名的信息,以便修正错误时更容易地定位。第三,要写出打开文件的方式, (“for writing,”“for appending”)。第四,输出操作系统的出错信息(包含在$!中)。这样,一旦出现文件不能打开的问题,使用你的程序的用户会大体上知道为什么不能打开。有时,我们把第一个和第三个合并在一起:

or die "unable to append to $filename: $!";


如果在open() 和出错信息中都写了文件的全名,你会冒改变了open() 的风险,使得出错信息不合时宜或不正确。

# 下面会出现虚假的出错信息

open(FH, "</var/run/file.pid")

or die "Can't open /var/log/file.pod for writing : $!";

用 Sysopen()进行更多的控制
为了更好的控制文件的打开方式,可以使用 sysopen() 函数:

use Fcntl;

sysopen(FH, $filename, O_RDWR|O_CREAT, 0666)

or die "Can't open $filename for reading/writing/creating : $!";


函数 sysopen() 带有四个参数,第一个是同open()函数类似的文件句柄参数,第二个参数是不带模式信息的文件名,第三个参数是模式参数,由Fcntl 模块提供的逻辑OR运算组合起来的常数构成,第四个参数(可选),为八进制属性值(0666表示数据文件, 0777表示程序)。如果文件可以被打开,sysopen() 返回true,如果打开失败,则返回false。

不同于open()函数,sysopen()不提供模式说明的简写方式,而是把一些常数组合起来,而且,每个模式常数有唯一的含义,只有通过逻辑OR运算才能将它们组合起来,你可以设置多个行为的组合。

O_RDONLYRead-only

O_WRONLY Write-only

O_RDWR Reading and writing

O_APPEND Writes go to the end of the file

O_TRUNC Truncate the file if it existed

O_CREAT Create the file if it didn't exist

O_EXCLError if the file already existed (used with O_CREAT)


当你需要小心行事的时候,就使用sysopen() 函数,例如,如果你打算添加内容到文件中,如果文件不存在,不创建新文件,你可以这样写:

sysopen(LOG, "/var/log/myprog.log", O_APPEND, 0666)

or die "Can't open /var/log/myprog.log for appending: $!";

读入单个记录
有一个容易的方法读入filehandles:用 <FH> 操作符。在标量内容下,它返回文件中的下一个记录,或者返回未定义出错信息。我们可以使用它来把一行读入到一个变量中:

$line = <FH>;

die "Unexpected end-of-file" unless defined $line;

在循环语句中,我们可以这样写:

while (defined ($record = <FH>)) { # long-winded

# $record is set to each record in the file, one at a time

}


因为要大量进行这样的工作,通常再进行一下简化,

把记录放到$_ 中,而不是$record中:

while (<FH>) {

# $_ 每次为文件中的一个记录

}

在Perl 5.004_04中,我们可以这样做:

while ($record = <FH>) {

# $record 每次为文件中的一个记录

}


defined() 将自动加上,在Perl 5.004_04以前的版本中,该命令给出一个警示。要了解所用的Perl版本,可在命令行下打入:

perl -v

一旦我们读出了一个记录,通常打算去掉记录分隔符,(缺省值为换行符字符):

chomp($record);

Perl 4.0版本仅有chop()操作,去掉串的最后一个字符, 不管该字符是什么。chomp() 没有这么大的破坏性,如果有行分隔符存在,它仅去掉行分隔符。如果你打算去掉行分隔符,就用chomp() 来代替chop()。








读入多个记录
如果你调用<FH>,返回文件中剩余的记录。如果你处于文件尾,则返回空表:

@records = <FH>;

if (@records) {

print "There were ", scalar(@records), " records read.\n";

}


在下面的一步中,进行赋值和测试两项工作:

if (@records = <FH>) {

print "There were ", scalar(@records), " records read.\n";

}


chomp() 也可适用对数组操作:

@records = <FH>;

chomp(@records);

对于任何表达式,都可以进行chomp操作,故你可以在下面的一步中这样写:

chomp(@records = <FH>);


什么是记录?

记录的缺省定义为:“行”。

记录的定义由$/ 变量控制的,该变量存放所输入的记录的分隔符,因为换行符字符(根据定义!)是用来分隔行的,故其缺省值为串“\n”。

例如,你可以用任何你想要替换的符号来代替“\n”。

$/ = ";";

$record = <FH>; # 读入下一个用分号分隔的记录

$/可以取其它两个有趣的值:空串("") 和undef。

读入段落
$/ =""的写法是用来指示Perl读入段落的,段落是由两个或两个以上的换行符构成的文本块。这不同于设置为"\n\n",后者仅读入由两行组成的文本块。在这种情况下,将出现这样一个问题:如果有连续的空行存在,例如“text\n\n\n\n”,你既可以把它解释为一个段落 ("text"),也可以解释为两个段落 ("text", 后面跟两个换行符,以及一个空段落,后面跟两个空行。)

在读入文本时,第二个解释用途不大。如果你正在读的段落出现上述情况,你不必过滤出“空”段落。

$/ = "\n\n";

while (<FH>) {

chomp;

next unless length; # 跳过空段

# ...

}


你可以把 $/设置为undef,它用于读入后面跟着两个或多个换行符组成的段落: undef $/;

while (<FH>) {

chomp;

# ...

}


读入整个文件

$/ 的其它有趣的值为undef。如果设置为该值,就将告诉Perl,读命令将把文件的剩余部分作为一个串返回:
undef $/;
$file = <FH>;


因为改变了 $/的值,将会影响以后的每次读操作,而不仅是下一个读操作。通常,你需要将该操作限制在局部。通过下面的例子,可以把文件句柄的内容读入到一个串中:
{
local $/ = undef;
$file = <FH>;
}
记住:Perl变量可读入很长的串。尽管你的文件大小不可以超出你的虚拟内存容量的限度,你仍可以读入尽可能多的数据。
用正则表达式对文件进行操作
一旦你有个包含了整个串的变量,你可以使用正则表达式,对整个文件进行操作,而不是对文件中的某个块进行操作。有两个有用的正则表达式标记/s和/m。一般,Perl的正则表达式对行进行处理,你可以这样写:

undef $/;

$line = <FH>;

if ($line =~ /(b.*grass)$/) {

print "found $1\n";

}


如果把我们的文件填入如下内容:
browngrass

bluegrass

则输出为:

found bluegrass

它没有找到“browngrass”,这是因为$ 仅在串尾寻找其匹配, (或者在串结束前的一行)。如果在包含很多行的串中,用"^" 和"$" 来匹配,, 我们可以使用 /m ("multiline") 选项:

if ($line =~ /(b.*grass)$/m) {}

现在程序会把如下的信息输出:

found browngrass

类似地,句点可以匹配除了换行符之外的所有字符:

while (<FH>) {

if (/19(.*)$/) {

if ($1 < 20) {

$year = 2000+$1;

} else {

$year = 1900+$1;

}

}

}


如果我们从文件中读入“1981”,$_ 将包含“1981\n”。正则表达式中的句点匹配“8”和“1”, 而不匹配“\n”。这里正需要这样做,因为换行符不是日期的组成部分。

对于一个包含很多行的串,我们也许要提取其中的大的块,这些块可能会跨越行分隔符。在这种情况下,我们可以使用 /s 选项,并用句点来匹配除了换行符以外的所有字符。

if (m{<B>(.*?)</B>}s) {

print "Found bold text: $1\n";

}


此处,我用了{}来表示正则表达式的起始和结束,而不用斜杠,所以,我就可以告诉 Perl我正在匹配,起始字符为"m",结束字符为"s"。你可以把/s 和/m 选项组合使用:

if (m{^<FONT COLOR="red">(.*?)</FONT>}sm) {

# ...

}

总结
有两种方法打开文件:open()函数的特点是快速简捷,而sysopen()函数功能强大而复杂。通过 <FH> 操作符,可以读入一个记录,$/ 变量可以让你控制记录是什么。如果你打算把很多行的内容读入到一个串中,不要使用忘记/s和/m 这两个正则表达式标记。
分享到:
评论

相关推荐

    使用perl读写文件

    对学习使用Perl操作文件时写的,在开始学习对Perl文件操作时,使用了$_,导致调试了很长时间,现在改正后做笔记到此

    perl读写文件.txt

    在linux上perl对文件读写的几种方法 整体读入 逐行读入 写入

    perl读写文件代码实例

    ### Perl读写文件知识点详解 #### 一、Perl文件操作简介 Perl是一种广泛使用的脚本语言,特别适合于文本处理和文件操作。在Perl中,读取和写入文件是常见的任务之一,Perl提供了多种内置函数来处理这些操作。本文将...

    perl读写xml文件

    这篇博客文章“perl读写xml文件”很可能是关于如何在Perl中操作XML文件,包括解析XML内容、提取数据、修改数据以及生成新的XML文件。 Perl提供了多个模块来处理XML,最常用的是XML::Simple和XML::LibXML。XML::...

    Perl读写文件简单示例

    本文主要介绍如何使用Perl语言进行文件的读写操作,通过简单示例代码来展示基本的操作方法。Perl语言作为一种功能强大的编程语言,广泛用于文本处理、网络编程等领域,在文件操作方面也表现得十分出色。通过本文的...

    Perl读写excel

    Perl是一种强大的脚本编程语言,...提供的文档“perl控制excel.doc”和“perl读写excel.pdf”应包含更详细的教程和示例,帮助你更好地理解和使用这些功能。记得查阅这些资料,以便进一步提升你的Perl Excel操作技能。

    perl文件用法

    - 使用`open`函数打开文件,然后通过`或`&gt;`操作符读写文件。 - `&lt;&gt;`运算符可以逐行读取文件,例如`while () { ... }`。 5. **正则表达式** - Perl是正则表达式的强大工具,可以使用`=~`操作符匹配和替换字符串中...

    Perl中的文件读写学习笔记

    本文将深入探讨Perl中的文件读写操作,这对于任何需要与文件系统交互的Perl程序都是至关重要的。 首先,我们来了解一下如何打开和关闭文件。在Perl中,使用`open`函数来打开文件。它的基本语法是: ```perl open ...

    Perl 将只读文件属性改成可写文件属性 source

    该Perl脚本的主要目的是在指定目录下查找包含特定字符串的所有只读文件,并将这些文件的权限更改为可读写。 ### 2. 参数解析 #### 2.1 参数格式 该脚本接受两个参数: - 第一个参数是需要检查的目录路径。 - 第二...

    Perl开发环境.zip

    - **系统交互**:Perl可以轻松与操作系统进行交互,执行系统命令,读写文件,控制进程等。 对于初学者,了解Perl的基本语法和常用模块是必要的。例如,`if`语句、`for`和`while`循环、数组和哈希数据结构、子程序...

    perl脚本,初学者可以参考,主要是字符串,hash,文件

    - **svstat.pl** 可能是对结构变异(SV)数据的统计分析,可能涉及到文件读写、哈希的使用以及复杂的字符串处理。 这些脚本为初学者提供了解Perl语言实际应用的宝贵资源,通过阅读和运行它们,你可以深入理解Perl在...

    perl语言编程和perl语言入门

    书中可能会介绍如何打印输出,读写文件,以及简单的文本处理。正则表达式,虽然在Perl中极其重要且相对复杂,但在入门教程中会被简化为更易理解的形式。此外,基础的错误处理和调试技巧也会被讲解,帮助新手避免常见...

    PERL编程24学时教程

    Perl的文件操作能力也是其强大之处,包括读写文件、文件指针、文件测试运算符等。而函数是Perl中复用代码的重要方式,会学习如何定义和调用自定义函数,以及使用内置函数。 总之,通过这24学时的教程,读者将能全面...

    Perl_examples_perl语言_Perl_

    6. **文件操作**:Perl可以方便地读写文件,`open`函数打开文件,`&lt;FILEHANDLE&gt;`用于输入,`&gt;FILEHANDLE`用于输出,`print`和`&lt;&gt;`用于写入和读取。`seek`和`tell`用于文件指针的移动。 7. **异常处理**:Perl使用`...

    Perl编程思想 Perl编程思想

    1. 文件I/O:Perl提供了简便的文件打开、读写和关闭操作,支持各种文件格式处理。 2. 正则表达式:Perl的正则表达式可以用于查找、替换和提取文本中的模式,是文本处理的核心工具。 3. 文本分析:Perl可以高效地...

    perl语言入门+perl语言编程

    它会深入浅出地介绍如何读写文件、处理正则表达式以及进行基本的错误处理。Perl的正则表达式是其一大亮点,它们提供了极其强大的文本匹配和替换功能。 "Perl_语言编程.chm"文件则可能是更深入的Perl编程指南,通常...

    Perl中的一个简单通讯录应用程序

    这份文档可能涵盖Perl的基础知识,如变量、数据结构、控制流语句,以及如何使用Perl读写文件。此外,它可能还介绍了如何与用户交互,如通过命令行参数或简单的GUI。 2. "perlproj.zip"则可能包含了源代码文件和其他...

    perl脚本实例,处理文本,文件,可供学习参考

    2. **文件操作**:Perl的文件操作非常灵活,包括打开、关闭文件(`open`和`close`),读写文件(`print`和`&lt;&gt;`),以及文件指针的移动(`seek`和`tell`)。例如,`getVirus.pl`可能包含查找和处理文件中特定模式的...

    Perl语言编程:Programming Perl

    Perl提供了丰富的API来进行文件读写操作,包括打开、关闭文件,读取或写入文件内容等功能: ```perl open(my $fh, ', 'file.txt') or die "Cannot open file: $!"; while (my $line = &lt;$fh&gt;) { chomp $line; print...

Global site tag (gtag.js) - Google Analytics