`
东边日出西边雨
  • 浏览: 262259 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【转载】linux文件合并,去重

 
阅读更多

转载自 http://www.2cto.com/os/201108/100617.html

 

 

(1)两个文件的交集,并集
前提条件:每个文件中不得有重复行
1. 取出两个文件的并集(重复的行只保留一份)

 

cat file1 file2 | sort | uniq > file3

 
2. 取出两个文件的交集(只留下同时存在于两个文件中的文件)

cat file1 file2 | sort | uniq -d > file3

 

3. 删除交集,留下其他的行

cat file1 file2 | sort | uniq -u > file3

 
(2)两个文件合并
一个文件在上,一个文件在下

cat file1 file2 > file3

 
一个文件在左,一个文件在右

paste file1 file2 > file3

 
(3)一个文件去掉重复的行

sort file | uniq

 
注意:重复的多行记为一行,也就是说这些重复的行还在,只是全部省略为一行!

sort file |uniq –u

 
上面的命令可以把重复的行全部去掉,也就是文件中的非重复行!

分享到:
评论

相关推荐

    LINUX文件去重工具C预言实现

    指定某一个目录,对该目录下所有文件进行遍历(非子目录),列举出内容相同的文件,有用户决定取舍

    Linux实现文件内容去重及求交并差集

    本篇文章将深入探讨如何使用Linux命令行工具来实现文件内容的去重以及求交集、并集和差集。 一、数据去重 在大数据处理中,重复数据是一个普遍存在的问题。Linux提供了`uniq`命令来去除文件中的重复行。首先,我们...

    LINUX下C语言实现文件合并

    LINUX下C语言实现 两个文件合并成第三个文件

    golang实现的文件去重小工具,有git提交历史、注释、windows,linux可执行文件。

    本文将详细讲解基于Golang实现的文件去重小工具,以及与之相关的技术知识点,包括Git提交历史查看、代码注释、跨平台可执行文件构建、Excel数据处理和Docker容器化部署。 首先,我们要讨论的是Golang语言本身。...

    两个有序链表的去重合并

    两个有序链表的去重合并,

    linux内核合并文件

    linux内核源代码,第一部分,下载后请用filecut合并,得到压缩包。

    linux shell 合并与分割

    linux shell 合并与分割

    Linux文件系统及文件管理 上机实验报告

    本次实验是关于Linux文件系统及文件管理的上机操作,旨在让学生深入理解和熟练运用Linux操作系统中的文件系统管理和文件操作。实验涵盖了文件系统的格式化、挂载与卸载,目录和文件的创建、移动、复制、删除,以及...

    BIN文件合并工具

    这款工具的独特之处在于,它不仅实现了合并功能,还支持对每个BIN文件在新合并文件中的精确位置进行设定,这对于数据恢复、备份或分发具有重要意义。 首先,我们需要理解BIN文件的基本概念。BIN是Binary Image的...

    14-Java操作Linux命令分割合并文本文件1

    - 合并文件是通过`cat`命令实现的。例如,`cat /home/leo/sd_000.txt /home/leo/sd_001.txt /home/leo/sd_002`这个命令会将三个文本文件`sd_000.txt`, `sd_001.txt`, 和 `sd_002`的内容拼接在一起,并显示在终端上...

    linuxawk将多个文件结果列合并到一个文件整理.pdf

    在 Linux 环境下,使用 awk 工具可以将多个文件的结果列合并到一个文件中。这篇文章将介绍如何使用 awk 实现该功能,并提供了一个示例 awk 脚本来合并多个文件的结果列。 在 NS 模拟结果中,经常需要对多组参数的...

    二进制Bin文件合并工具

    9. **输入输出文件**:`1.bin`、`2.bin`和`dst.bin`、`dest.bin`是待合并的二进制文件以及目标合并文件。`dst.txt`可能是合并工具的说明文档或者记录合并过程的日志文件。 了解以上知识点后,我们可以使用二进制...

    多个文件合并成一个大文件

    在合并文件时,需要考虑文件的格式兼容性、大小限制、合并后文件的可读性或可播放性,以及合并过程中的错误处理。此外,如果文件较大,可能需要考虑合并效率和存储空间。 7. **安全性与备份** 在合并文件前,确保...

    模拟LINUX文件系统及终端

    (8)copy …: 拷贝文件,除支持模拟Linux文件系统内部的文件拷贝外,还支持host文件系统与模拟Linux文件系统间的文件拷贝。 (9)del …: 删除文件:删除指定文件,不存在时给出出错信息。 (10)check:检测并恢复文件...

    linux下字符串去重,英文句子倒序功能实现

    在Linux环境下,使用C或C++编程语言,我们可以轻松实现字符串去重和英文句子倒序的功能。下面将详细讲解这两个功能的实现方法。 首先,我们来看如何实现字符串去重。这个功能通常涉及到对字符数组的处理。我们可以...

    FileSplitter4Linux 多线程文件分割合并器

    FileSplitter4Linux_多线程文件分割合并器.7z =========================================== 多线程文件分割、合并器 v2.0.1 for Windows / Linux

    多Excel文件合并到一个文件中(多sheet形式)

    在excel中打开宏编辑器,导入这个文件,执行,然后选择多个excel文件,即可将多个excel文件合并为一个文件

    DuplicateCleaner_文件去重软件.zip

    DuplicateCleaner是一款高效、易用的文件去重工具,专为清理电脑中重复的图片、文档、音乐、视频等各类文件而设计。它通过比对文件内容,而非仅依赖文件名或创建日期,确保找到的重复文件是真正的复制品。该软件的...

    txt合并工具

    除此之外,了解一些基本的命令行工具,如Windows的`copy /b`命令或Linux的`cat`命令,也可以实现TXT文件的合并,但这需要用户具备一定的命令行操作经验。 总的来说,"txt合并工具"是针对TXT文件管理需求的一种高效...

    文件与复制合并.rar_合并文件_文件 存储_文件合并

    文件名用于识别原始文件的身份,文件长度则有助于确定在读取合并文件时应跳过多少字节,而文件在合并文件中的位置信息则确保可以精确地定位到原始文件内容。 实现这样的文件合并,可以编写一个简单的程序,遵循以下...

Global site tag (gtag.js) - Google Analytics