`
kevin_xu
  • 浏览: 36388 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
  • 星情泪: 感觉楼主挺强的,那么被拒也许出在了薪资上面吧我也去过那里 感觉 ...
    Exoweb面经

用一行命令统计一文本文件中包含指定字符串出现次数

阅读更多

$grep -c 'I am tom' a.txt

 

参考资料:

 

grep、fgrep和egrep命令

 

  这组命令以指定模式搜索文件,并通知用户在什么文件中搜索到与指定的模式匹配的字符串,并打印出所有包含该字符串的文本行,在该文本行的最前面是该行所在的文件名。grep命令一次只能搜索一个指定的模式;egrep命令检索扩展的正则表达式(包括表达式组和可选项);fgrep命令检索固定字符串,它不识别正则表达式,是快速搜索命令。

  这组命令在搜索与定位文件中特定的主题方面非常有用。要搜索的模式可以被认为是一些关键词,您可以用它们来搜索文件中包含的这些关键词。编写程序时,可以用它来寻找某一个函数,或是相关的词组。grep命令的搜索功能比fgrep强大,因为grep命令的搜索模式可以是正则表达式,而fgrep却不能。有关正则表达式请参见shell一章。

  该组命令中的每一个命令都有一组选项,利用这些选项可以改变其输出方式。例如,可以在搜索到的文本行上加入行号,或者只输出文本行的行号,或者输出所有与搜索模式不匹配的文本行,或只简单地输出已搜索到指定模式的文件名,并且可以指定在查找模式时忽略大小写。

  这组命令在指定的输入文件中查找与模式匹配的行。如果没有指定文件,则从标准输入中读取。正常情况下,每个匹配的行被显示到标准输出。如果要查找的文件是多个,则在每一行输出之前加上文件名。

 

  语法:

  grep [选项] [查找模式] [文件名1,文件名2,……]

  egrep [选项] [查找模式] [文件名1,文件名2,……]

  fgrep [选项] [查找模式] [文件名1,文件名2,……]

  这组命令各选项的含义为:

  - E 每个模式作为一个扩展的正则表达式对待。

  - F 每个模式作为一组固定字符串对待(以新行分隔),而不作为正则表达式。

  - b在输出的每一行前显示包含匹配字符串的行在文件中的字节偏移量。

  - c 只显示匹配行的数量。

  - i 比较时不区分大小写。

  - h 在查找多个文件时,指示grep不要将文件名加入到输出之前。

  - l 显示首次匹配串所在的文件名并用换行符将其隔开。当在某文件中多次出现匹配串时,不重复显示此文件名。

  - n 在输出前加上匹配串所在行的行号(文件首行行号为1)。

  - v 只显示不包含匹配串的行。

  - x 只显示整行严格匹配的行。

  - e expression 指定检索使用的模式。用于防止以“-”开头的模式被解释为命令选项。

  - f expfile 从expfile文件中获取要搜索的模式,一个模式占一行。

 

  对该组命令的使用还需注意以下方面:

  在命令后键入搜索的模式,再键入要搜索的文件。其中,文件名列表中也可以使用特殊字符,如“*”等,用来生成文件名列表。如果想在搜索的模式中包含有空格的字符串,可以用单引号把要搜索的模式括起来,用来表明搜索的模式是由包含空格的字符串组成。否则,Shell将把空格认为是命令行参数的定界符,而grep命令将把搜索模式中的单词解释为文件名列表中的一部分。在下面的例子中,grep命令在文件example中搜索模式“text file”。

 

  $ grep ’text file’ example

 

  用户可以在命令行上用Shell特殊字符来生成将要搜索的文件名列表。在下面的例子中,特殊字符“*”用来生成一个文件名列表,该列表包含当前目录下所有的文件。该命令将搜索出当前目录下所有文件中与模式匹配的行。

 

  $ grep data *

 

  特殊字符在搜索一组指定的文件时非常有用。例如,如果想搜索所有的C程序源文件中特定的模式,您可以用“*.c”来指定文件名列表。假设用户的 C程序中包含一些不必要的转向语句(goto语句),想要找到这些语句,可以用如下的命令来搜索并显示所有包含goto语句的代码行:

 

  $ grep goto *.c

 

  用户可以在命令行上键入搜索模式,也可以使用-f选项从指定文件中读取要搜索的模式。在文件中,每个搜索模式占一行。如果经常要搜索一组常见字符串时,这个功能非常有用。在下面的例子中,用户要在文件exam中搜索字符串“editor”和“create”,就把要搜索的模式放置在文件mypats中,然后,grep命令从文件mypats中读取要搜索的模式。

 

  $ cat mypats

 

  editor

 

  create

 

  $ grep -f mypats exam

 

  文件查找命令

 

  find命令

 

  功能:在目录结构中搜索文件,并执行指定的操作。此命令提供了相当多的查找条件,功能很强大。

 

  语法:find 起始目录 寻找条件 操作

 

  说明:find命令从指定的起始目录开始,递归地搜索其各个子目录,查找满足寻找条件的文件并对之采取相关的操作。

 

  该命令提供的寻找条件可以是一个用逻辑运算符not、and、or组成的复合条件。逻辑运算符and、or、not的含义为:

 

  (1)and:逻辑与,在命令中用“-a”表示,是系统缺省的选项,表示只有当所给的条件都满足时,寻找条件才算满足。例如:

 

  $ find –name ’tmp’ –xtype c -user ’inin’

 

  该命令寻找三个给定条件都满足的所有文件。

 

  (2)or:逻辑或,在命令中用“-o”表示。该运算符表示只要所给的条件中有一个满足时,寻找条件就算满足。

 

  例如:

 

  $ find –name ’tmp’ –o –name ’mina*’

 

  该命令查询文件名为’tmp’或是匹配’mina*’的所有文件。

 

  (3)not:逻辑非,在命令中用“!”表示。该运算符表示查找不满足所给条件的文件。

 

  例如:

 

  $ find ! –name ’tmp’

 

  该命令查询文件名不是’tmp’的所有文件。

 

  需要说明的是:当使用很多的逻辑选项时,可以用括号把这些选项括起来。为了避免Shell本身对括号引起误解,在话号前需要加转义字符“\\”来去除括号的意义。

 

  例:$ find \\(–name ’tmp’ –xtype c -user ’inin’ \\) 寻找条件有以下选项:

 

  首先,下列各个选项中的n值可以有三种输入方式,假设n为20,则:

 

  +20 表示20以后(21,22,23等)

 

  -20 表示20以前(19,18,17等)

 

  20 表示正好是20

 

  1. 以名称和文件属性查找。

 

  - name ’字串’ 查找文件名匹配所给字串的所有文件,字串内可用通配符*、?、[ ]。

 

  - lname ’字串’ 查找文件名匹配所给字串的所有符号链接文件,字串内可用通配符*、?、[ ]。

 

  -gid n 查找属于ID号为n的用户组的所有文件。

 

  -uid n 查找属于ID号为n的用户的所有文件。

 

  -group ’字串’ 查找属于用户组名为所给字串的所有的文件。

 

  -user ’字串’ 查找属于用户名为所给字串的所有的文件。

 

  -empty 查找大小为0的目录或文件。

 

  -path ’字串’ 查找路径名匹配所给字串的所有文件,字串内可用通配符*、?、[ ]。

 

  -perm 权限 查找具有指定权限的文件和目录,权限的表示可以如711,644。

 

  -size n[bckw] 查找指定文件大小的文件,n后面的字符表示单位,缺省为b,代表512字节的块。

 

  -type x 查找类型为x的文件,x为下列字符之一:

 

  b 块设备文件

 

  c 字符设备文件

 

  d 目录文件

 

  p 命名管道(FIFO)

 

  f 普通文件

 

  l 符号链接文件(symbolic links)

 

  s socket文件

 

  -xtype x 与-type基本相同,但只查找符号链接文件。

 

  2. 以时间为条件查找

 

  - amin n 查找n分钟以前被访问过的所有文件。

 

  - atime n 查找n天以前被访问过的所有文件。

 

  - cmin n 查找n分钟以前文件状态被修改过的所有文件。

 

  - ctime n 查找n天以前文件状态被修改过的所有文件。

 

  - mmin n 查找n分钟以前文件内容被修改过的所有文件。

 

  - mtime n 查找n天以前文件内容被修改过的所有文件。

 

  3. 可执行的操作

 

  - exec 命令名称 {} 对符合条件的文件执行所给的Linux 命令,而不询问用户是否需要执行该命令。{}表示命令的参数即为所找到的文件;命令的末尾必须以“ \\;”结束。

 

  - ok 命令名称 { } 对符合条件的文件执行所给的Linux 命令,与exec不同的是,它会询问用户是否需要执行该命令。

 

  - ls 详细列出所找到的所有文件。

 

  - fprintf 文件名 将找到的文件名写入指定文件。

 

  - print 在标准输出设备上显示查找出的文件名。

 

  - printf 格式 格式的写法请参考有关C语言的书。

 

  例1:查找当前目录中所有以main开头的文件,并显示这些文件的内容。

 

  $ find . - name ‘main*’ - exec more {} \\;

 

  例2:删除当前目录下所有一周之内没有被访问过的a .out或*.o文件。

 

  $ find . \\(- name a.out - o - name ‘*.o’\\)\\

 

  > - atime +7 - exec rm {} \\;

 

  说明如下: 命令中的“.”表示当前目录,此时find将从当前目录开始,逐个在其子目录中查找满足后面指定条件的文件。\\(和\\)表示括号(),其中的“\\”称为转义符。之所以这样写是由于对Shell而言,(和)另有不同的含义,而不是这里的用于组合条件的用途。“- name a.out”是指要查找名为a.out的文件;“- name ‘*.o’”是指要查找所有名字以 .o结尾的文件。这两个- name之间的- o表示逻辑或(or),即查找名字为a.out或名字以 .o结尾的文件,find在当前目录及其子目录下找到这佯的文件之后,再进行判断,看其最后访问时间是否在7天以前(条件-atime +7),若是,则对该文件执行命令rm(- exec rm{ }\\;)。其中{ }代表当前查到的符合条件的文件名,\\;则是语法所要求的。上述命令中第一行的最后一个\\是续行符。当命令太长而在一行写不下时,可输入一个\\,之后系统将显示一个>,指示用户继续输入命令。

 

  locate命令

 

  locate命令用于查找文件,它比find命令的搜索速度快,它需要一个数据库,这个数据库由每天的例行工作(crontab)程序来建立。当我们建立好这个数据库后,就可以方便地来搜寻所需文件了。

 

  该命令的一般形式为:

 

  locate 相关字

 

  例如:查找相关字issue

 

  $ locate issue

 

  /etc/issue

 

  /etc/issue.net

 

  /usr/man/man5/issue.5

 

  /usr/man/man5/issue.net.5 。

分享到:
评论

相关推荐

    搜索一个文本文件字符串

    当我们需要在一个大型文本文件中查找特定的字符串时,了解如何高效地进行搜索就显得尤为关键。这个主题涵盖了文本处理、字符串匹配算法以及文件I/O操作等多方面的知识。下面,我们将详细讨论如何在文本文件中搜索一...

    BAT批处理脚本-文本操作-统计重复次数并排序.cmd.zip

    脚本会分析文本,统计每个唯一字符串的出现次数,并将结果输出到控制台或新的文件中。为了使脚本能够正常工作,确保文本文件的编码与批处理脚本的预期相符,通常是ANSI或UTF-8无BOM格式。 在实际应用中,这样的...

    第27讲 习题 文件中检索字符串.doc

    2. `"需要检索的字符串"`:这是你要在文件中查找的特定字符串。 3. `"文件路径"`:指定你要搜索的文件或目录。例如,要在"/home/user/Documents/file.txt"中查找字符串"example",命令为`grep -n "example" /home/...

    Linux文本处理命令合集

    - 已匹配字符串标记(&):将匹配到的字符串作为变量使用。 - 示例:`echo "thisisanexample" | sed 's:\w\+:[&]:g'`:输出`[this][is][an][example]`。 - 子串匹配标记(\1):用于引用匹配到的子串。 - 示例:...

    linux数据统计基本命令

    `grep` 是一个强大的文本搜索工具,它能在文件中搜索固定字符串或正则表达式的模式,并打印出匹配的行。`grep` 的主要功能包括: - **基本搜索**:`grep pattern file` 可以用来搜索文件中包含特定模式 `pattern` ...

    数据结构 文本编辑程序

    - `Find_Word(LINE * &head, char *sch)`:查找并返回字符串`sch`在文本中出现的次数。 - `Count_Num(LINE * &head)`:统计文本中的数字数量。 - `Del_String(LINE * &head, char *sch)`:删除文本中所有出现的...

    入门学习Linux常用必会60个命令实例详解doc/txt

    mount命令的作用是加载文件系统,它的用权限是超级用户或/etc/fstab中允许的使用者。 2.格式 mount -a [-fv] [-t vfstype] [-n] [-rw] [-F] device dir 3.主要参数 -h:显示辅助信息。 -v:显示信息,...

    Linux统计一个文件中特定字符个数的方法

    在Linux系统中,统计一个文件中特定字符或字符串的出现次数是常见的操作,这对于日志分析、文本处理等任务尤其有用。以下将详细介绍三种方法来完成这个任务:grep、awk和tr。 首先,我们来看使用`grep`命令的方法。...

    整理Linux中字符串的相关操作技巧

    - `grep -c str filename`:此命令用于计算在文件`filename`中字符串`str`出现的次数。它会返回一个整数结果。 - `grep -o str filename | wc -l`:`-o`选项使得`grep`仅显示匹配的部分,然后通过管道传递给`wc -l...

    Java代码统计实现

    总之,"Java代码行统计软件.jar"是一个实用的工具,它展示了如何利用Java处理文本文件,进行字符串操作,以及构建简单的文件系统遍历逻辑。通过学习和理解这个工具的实现,开发者可以提升自己的文件处理和代码分析...

    在Linux下正则表达式和grep命令的使用

    - `-v`:反向选择,显示不包含指定字符串的行。 以下是一些grep命令的示例: 1. 查找`regexp.txt`中包含"know"的行并显示行号:`grep -n 'know' regexp.txt` 2. 查找`regexp.txt`中含有星号"*"的行并显示行号:`...

    易语言文本操作模块

    “取文本行数”是指统计文本文件或字符串中包含的行数,这在处理大量文本数据时非常常见,例如计算文档的总篇幅或者统计数据表的记录数量。易语言提供`取字符串行数`函数可以轻松完成这项任务。 “替换行内容”涉及...

    unix text processing

    例如,`awk '{print $1}' file.txt` 可以打印出 `file.txt` 文件中每一行的第一个字段。 ### 其他文本处理工具 除了上述提到的核心工具外,Unix 系统还提供了一系列其他文本处理工具: #### 1. **cut** `cut` ...

    《数据结构》教案 第三章 串及其应用.docx

    **文学研究助手**的实现是一个具体的应用实例,它要求设计一个系统统计英文小说中特定形容词的出现次数和位置。通过一次性读取整个文本文件,利用约定(如词汇不跨行),可以使用链表存储行号,实现统计功能。KMP...

    文本三剑客之grep及正则表达式 -.pdf

    - 进行文本文件的初步分析,例如统计某个单词出现的次数等。 #### 7. 总结 `grep` 作为一种强大的文本搜索工具,对于日常的文本处理任务至关重要。掌握其基本用法和高级特性可以帮助用户高效地完成多种文本处理...

    查找替换工具FindStr

    FindStr 是一个强大的命令行工具,主要用于在文本文件中执行查找和替换操作。它在Windows系统中被广泛使用,尤其适用于批处理脚本和自动化任务,因为它提供了灵活的搜索选项和模式匹配能力。 **基本使用** FindStr ...

    linux-grep-命令-详解.zip

    这个压缩包“linux-grep-命令-详解.zip”包含了一份详细文档“linux-grep-基本用法及高级技巧.doc”,将深入解析grep命令的各个方面。下面,我们将根据文档内容,对grep命令进行详细介绍。 grep,顾名思义,“g/re/...

    linux学习笔记,最经常用的命令

    以下是关于标题"Linux学习笔记,最经常用的命令"和描述"学习LINUX最先接触的一些命令,比较实用"中涉及的几个关键命令的详细说明: 1. **Cat命令**: - `cat filename`:用于查看文件`filename`的内容。 - `cat >...

    批处理bat命令大全

    - `find /c "abc" c:\test.txt`:统计`c:\test.txt`文件中"abc"出现的次数。 19. **more(findstr)** - 分页显示文件内容。 - `more c:\test.txt`:分页显示`c:\test.txt`文件的内容。 20. **tree** - 显示目录...

Global site tag (gtag.js) - Google Analytics