`

linux文件合并,去重复

 
阅读更多

第一:两个文件的交集,并集
前提条件:每个文件中不得有重复行
1. 取出两个文件的并集(重复的行只保留一份)
2. 取出两个文件的交集(只留下同时存在于两个文件中的文件)
3. 删除交集,留下其他的行
1. cat file1 file2 | sort | uniq > file3
2. cat file1 file2 | sort | uniq -d > file3
3. cat file1 file2 | sort | uniq -u > file3

第二:两个文件合并
一个文件在上,一个文件在下
cat file1 file2 > file3
一个文件在左,一个文件在右
paste file1 file2 > file3

第三:一个文件去掉重复的行:

sort file |uniq
注意:重复的多行记为一行,也就是说这些重复的行还在,只是全部省略为一行!
sort file |uniq -u
上面的命令可以把重复的行全部去掉,也就是文件中的非重复行!
具体细节可以查看,cat,sort,uniq等命令的详细介绍


我的使用CASE:

需统计一个文件去重后的条数!

eg:

sort an_security_init52_2_20120608.txt |uniq -u | wc -l


参考地址:

http://www.flatws.cn/article/program/linux/2011-02-12/12307.html

分享到:
评论

相关推荐

    文本文件合并器文本文件合并器2.0

    《文本文件合并器2.0》是一款专为处理文本文件而设计的实用工具,它的主要功能是将多个文本文件高效地合并成一个单一的文件。这个软件尤其适用于那些需要管理和整合大量分散文本信息的用户,比如程序员、作家、研究...

    linux文件操作

    - `-s`: 合并重复空白行 - `-t`: 显示制表符为^I - `-T`: 显示ASCII控制字符 通过熟练掌握这些基础的Linux文件操作,用户可以在Linux环境中更高效地工作,无论是编写代码、编辑配置文件还是进行系统维护。对于深度...

    txt文件合并

    在IT领域,文本处理是一项基础且重要的任务,而“txt文件合并”就是其中之一。当我们处理大量文本数据时,有时需要将多个TXT格式的文本文件整合为一个文件,以方便管理和分析。下面,我们将深入探讨这个主题,包括为...

    linux命令速查_查看文件.pdf

    ### Linux命令速查:查看文件的关键知识点 #### 标题解析 标题“Linux命令速查_查看文件.pdf”明确指出了文档的主要内容是关于Linux环境下查看文件的各种命令及其使用方法。这对于初学者或是有一定经验的用户来说都...

    PDF文件分割合并工具

    PDF文件合并功能则允许用户将多个PDF文件整合到一起,形成一个连续的文档。合并过程中,原始文件的页面顺序和样式将被保留,使得合并后的文件易于阅读和管理。合并操作通常简单直观,只需选择要添加的PDF文件,然后...

    Linux文件操作系统命令 系统管理命令大全

    Linux文件操作系统命令和系统管理命令是Linux系统管理的基础,涵盖了对文件、目录、用户、权限、网络等方面的控制。以下是对这些命令的详细说明: 1. `cat`:它用于查看文件内容,通常与`more`一起使用以分页显示。...

    对比两个文件去掉另外一个的重复记录

    这些工具不仅可以显示两个文件的差异,还可以进行合并和同步操作,包括删除一个文件中的重复项。 5. 对比整理.exe:提供的压缩包内有一个名为"对比整理.exe"的文件,这可能是一个专为此目的设计的程序。运行这个...

    Linux实现文件内容去重及求交并差集

    这个命令将两个文件排序后合并,并去除重复行,得到的结果是两个文件的并集。 四、数据差集 差集分为两种情况:左差集和右差集,分别对应于SQL中的LEFT JOIN和RIGHT JOIN。 1. 左差集(`user_2019.txt`中独有的行...

    Linux命令学习+Linux标准文本处理命令

    - `join`(合并两个文件的指定列) - `tr`(字符替换和转换) ### 3. 特殊命令与技巧 #### 管道和重定向 - **管道** (`|`):将一个命令的输出作为另一个命令的输入。 - **重定向** (`>` 和 `>>`):将命令的输出...

    LINUX处理文本命令

    LINUX处理文本命令 处理文本和文本文件的命令 一. sort 文件排序, 通常用在管道中当过滤器来...这个过滤器将会删除一个已排序文件中的重复行. 这个命令经常出现在sort命令的管道后边. 四. expand, unexpand ... ...

    Linux命令大全+Linux高手修炼手册

    8. **cat, more, less**:查看文件内容,其中`cat`常用于合并和查看小文件,`more`和`less`适合查看大文件。 9. **grep**:搜索文件内容,根据指定模式查找信息。 10. **find**:在文件系统中查找文件,可以根据名称...

    linux备份文件命令收集

    它可以将多个文件合并成一个备份文件,并且可以将备份文件中的成员文件提取出来。 语法:ar [-dmpqrtx][cfosSuvV][a<成员文件>][b<成员文件>][i<成员文件>][备存文件][成员文件] 参数: * -d:删除备份文件中的...

    Linux部署springboot(springcloud)启动多个jar

    本篇文章将深入讲解如何在Linux环境下部署SpringBoot(SpringCloud)项目,并启动多个jar文件,以及如何通过shell脚本来实现日志管理和服务控制。 首先,SpringBoot是一个基于Spring框架的轻量级开发工具,它内置了...

    Linux字符处理基础

    总结来说,Linux字符处理基础知识点涵盖了管道的使用、grep搜索工具的使用、文本排序的方法、去除重复内容的命令、文本截取技巧以及文本转换、合并和分割的工具。掌握了这些基础操作,能够在shell环境下进行高效的...

    linux开发基础教程

    了解Linux的文件系统结构至关重要,包括根目录(/)、用户目录(/home)等。同时,Linux的权限系统采用rwx(读、写、执行)三位表示,教程将详细解释如何设置和理解文件及目录的权限。 五、软件包管理和更新 Linux...

    Linux命令速查shell查看文件.pdf

    首先,`cat`命令是最常用的一个,用于在标准输出设备上合并并显示文件内容。例如,`cat file1 file2`将`file1`和`file2`的内容拼接到一起并输出。若想将输出结果重定向到`file3`,可以使用`>`操作符,即`cat file1 ...

    学习Linux---不得不知的Linux命令

    `paste` 命令用于将多个文件的内容按列合并到一起。例如: ``` paste file1 file2 > combined_file ``` #### 26. cat - 显示文件内容 `cat` 命令用于显示文件内容。其他用于显示文件内容的命令还包括 `less` 和 `...

Global site tag (gtag.js) - Google Analytics