`
nanjingjiangbiao_T
  • 浏览: 2689592 次
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

shell逐行读取文件的方法,并比较各方法执行效率

 
阅读更多

在Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的脚本里的方法,而且是效率最高,使用最多的方法。为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率。

方法1:while循环中执行效率最高,最常用的方法。

function while_read_LINE_bottm(){
While read LINE
do
echo $LINE
done < $FILENAME
}

注释:我习惯把这种方式叫做read釜底抽薪,因为这种方式在结束的时候需要执行文件,就好像是执行完的时候再把文件读进去一样。

方法2 : 重定向法;管道法: cat $FILENAME | while read LINE

Function While_read_LINE(){
cat $FILENAME | while read LINE
do
echo $LINE
done
}
注释:我只所有把这种方式叫做管道法,相比大家应该可以看出来了吧。当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。

方法3: 文件描述符法

Function while_read_line_fd(){
Exec 3<&0
Exec 0<$FILENAME
While read LINE
Do
Echo $LINE
Exec 0<&<3
}

注释: 这种方法分2步骤,第一,通过将所有内容重定向到文件描述符3来关闭文件描述符0.为此我们用了语法Exec 3<&0 。第二部将输入文件放送到文件描述符0,即标准输入。

方法4 for 循环。

function for_in_file(){
For i in `cat $FILENAME`
do
echo $i
done
}
注释:这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了,这里不多说。

------------------------------------------------------------------------------------------------------------




对各个方法进行测试,看那方法的执行效率最高。

首先我们用脚本(脚本见附件)生成一个70000行的文件,文件位置在/scripts/bigfile。然后通过下面的脚本来测试各个方法的执行效率,脚本很简单,不再解释。

#!/bin/bash
FILENAME="$1"
TIMEFILE="/tmp/loopfile.out" > $TIMEFILE
SCRIPT=$(basename $0)

function usage(){
echo -e "\nUSAGE: $SCRIPT file \n"

exit 1
}

function while_read_bottm(){

while read LINE
do
echo $LINE

done < $FILENAME

}

function while_read_line(){

cat $FILENAME | while read LINE
do
echo $LINE
done

}

function while_read_line_fd(){

exec 3<&0
exec 0< $FILENAME
while read LINE
do
echo $LINE
done
exec 0<&3
}

function for_in_file(){
for i in `cat $FILENAME`
do
echo $i
done
}

if [ $# -lt 1 ] ; then
usage
fi
echo -e " \n starting file processing of each method\n"
echo -e "method 1:"
echo -e "function while_read_bottm"
time while_read_bottm >> $TIMEFILE

echo -e "\n"

echo -e "method 2:"
echo -e "function while_read_line "
time while_read_line >> $TIMEFILE

echo -e "\n"
echo -e "method 3:"
echo "function while_read_line_fd"
time while_read_line_fd >>$TIMEFILE

echo -e "\n"
echo -e "method 4:"
echo -e "function for_in_file"
time for_in_file >> $TIMEFILE

执行脚本后: [root@localhost shell]# ./while /scripts/bigfile
脚本输出内容:
method 1:
function while_read_bottm

real 0m5.689s
user 0m3.399s
sys 0m1.588s


method 2:
function while_read_line

real 0m11.612s
user 0m4.031s
sys 0m4.956s


method 3:
function while_read_line_fd

real 0m5.853s
user 0m3.536s
sys 0m1.469s


method 4:
function for_in_file

real 0m5.153s
user 0m3.335s
sys 0m1.593s


下面我们对各个方法按照速度进行排序。
real 0m5.153s method 4 (for 循环法)
real 0m5.689s method 1 (while 釜底抽薪法)
real 0m5.853s method 3 (标识符法)
real 0m11.612s method 2 (管道法)

由此可见在各个方法中,for语句效率最高,而在while循环中读写文件时,
while read LINE
do
echo $LINE

done < $FILENAME

方式执行效率最高。

分享到:
评论

相关推荐

    Shell逐行读取文件的4种方法

    本文主要讲解了四种不同的方法来使用Shell逐行读取文件。每种方法都有其特定的用途和效率,了解这些方法可以帮助你根据具体需求选择最合适的方式。 1. **while循环法**: 这是最常见且效率最高的方法。通过`while ...

    Shell脚本逐行读取文本文件(不改变文本格式)

    在Shell脚本中,逐行读取文本文件是一项常见的任务,尤其在处理数据或执行基于文件内容的操作时。本文将详细讲解如何不改变文本格式地读取文本文件内容。 首先,我们来看一下最常见的用于逐行读取文件的脚本片段: ...

    两个 文本文件 逐行比较 文件内容 找出独有文本行

    在给定的“文本逐行比较.exe”文件中,很可能是已经封装好的一个程序,用于执行这样的比较操作。用户只需提供两个文件路径,程序就能自动找出并加入独有的文本行。使用这样的工具可以大大简化操作,提高效率,尤其是...

    PHP读取大文件的多种方法介绍_.docx

    这两种方法允许逐行读取文件,而无需将所有内容加载到内存中。 - **方法一**:从文件末尾开始,向前寻找换行符以确定最后几行的位置。这种方法需要多次移动文件指针,适合小范围的行数检索。 - **方法二**:同样是...

    shell_config.rar_Linux shell_parsing shell_shell config_get_sh

    Shell脚本可以逐行读取文件,通过内置的命令和工具提取所需信息。一个常用的工具是`grep`,它可以搜索文件中特定的字符串或模式。另一个是`awk`,它能按照指定的字段分隔符处理文本,提取特定列的数据。 下面是一个...

    Linux Shell编程 压缩以数字开头的文件

    do`循环逐行读取`tar`文件中的文件名。 ```bash while read line; do tar zcvf $line.tar.gz $line done ``` - 在这里,`tar zcvf`命令用于创建压缩归档文件。其中: - `z`: 表示使用gzip压缩。 - `c`: ...

    纯shell的自动登录执行脚本

    4. 一旦登录成功,读取命令文件并将其中的命令逐条执行。 5. 执行完所有命令后,关闭与该主机的连接。 6. 继续处理下一个主机,直到所有的主机都已完成。 在实际应用中,为了提高安全性,通常会用到SSH(Secure ...

    java调用shell

    这段代码创建了两个读取器,用于逐行读取Shell脚本的输出,并打印到控制台。需要注意的是,当Shell脚本执行完毕后,必须关闭读取器,以释放资源。 ### 高级用法与注意事项 - **错误处理**:除了标准输出外,Shell...

    Unix Shell编程工具

    它可以逐行读取文件,执行替换、删除、插入等操作,而无需改变原文件。sed在批量处理文本文件时非常有用,例如批量替换字符串或者预处理输入数据。 这些工具通常一起使用,形成强大的数据处理管道。例如,你可以用`...

    shell脚本编程入门

    done 逐行读取文件内容并输出。 **数组** 在Bash中,数组允许存储多个值,如`my_array=("apple" "banana" "orange")`。 **函数** 定义函数如下:`function my_function() { commands; }`,然后通过`my_function`...

    shell脚本编程

    Shell脚本的一个显著特点是按行解释执行,也就是说,Shell解释器逐行读取脚本文件并执行其中的命令。在编写脚本时,可以使用echo命令后跟反引号(`)来执行子shell中的命令,并获取其输出结果。在编写完成后,需要...

    shell脚本的demo

    Shell脚本是一种文本文件,包含了一系列命令,当执行这个文件时,Shell会逐行解释并执行这些命令。Bash(Bourne-Again SHell)是最常用的Shell,它是GNU项目的一部分,广泛应用于各种Linux发行版和macOS系统。 2. ...

    Shell及其编程.docx

    Shell脚本的执行过程与一般的程序执行相似,但它们是通过命令行接口逐行读取和执行的。 Linux提供了多种不同的Shell,其中最常用的是Bourne Shell(sh)、C Shell(csh)和Korn Shell(ksh)。Bourne Shell是最早的...

    操作系统第一次实验报告~shell实验

    - 使用`Getline`函数逐行读取文件内容。 - 调用`getenviron`函数解析环境变量字符串,并存储到全局变量`envpath`数组中。 #### 2. 命令执行 ```c int is_founded(char *cmd) { int k = 0; while (envpath[k] != ...

    shell脚本.pdf

    9. **Shell内置命令**:如`echo`, `read`, `printf`, `cd`, `export`等,它们不启动新的进程,执行效率高。 10. **脚本调试**:`set -x`开启命令行调试模式,可以看到脚本逐行执行的情况;`set -v`则会显示脚本中的...

    common shell scripts

    done 读取文件内容并逐行输出。 **函数定义**: 1. 使用`function`关键字定义函数,如`function greet() { echo "Hello, $1!" }`,然后通过`greet "World"`调用。 **文件操作**: 1. `cat`:查看文件内容。 2. `...

    详解linux下批量替换文件内容的三种方法(perl,sed,shell)

    `-p`选项使得Perl逐行读取文件并自动打印每一行,而`-i`选项则允许就地编辑文件(即不创建备份直接修改原文件)。 命令示例: ```bash find -name '要查找的文件名' | xargs perl -pi -e 's|被替换的字符串|替换后...

    python 读取Linux服务器上的文件方法

    7. 使用`for`循环逐行读取文件内容,并打印到控制台: ```python try: for line in remote_file: print(line) finally: remote_file.close() ``` 这里使用了`try-finally`结构确保在读取完成后关闭文件,...

    shell替换文件中的文件路径脚本分享

    通过本文介绍的Shell脚本,用户可以轻松地对文件中的路径信息进行批量替换,大大提高了文件管理的效率。此外,该脚本还提供了详细的日志记录,便于跟踪替换过程中的具体操作和结果,非常适合于项目开发、维护等场景...

Global site tag (gtag.js) - Google Analytics