`
webcenterol
  • 浏览: 950834 次
文章分类
社区版块
存档分类
最新评论

Linux删除重复行

 
阅读更多

文本处理时,经常要删除重复行,下面是三种方法

第一,用sort+uniq,注意,单纯uniq是不行的。
sort -n test.txt | uniq


第二,用sort+awk命令,注意,单纯awk同样不行,原因同上。

sort -n $file | awk '{if($0!=line)print; line=$0}'
 

第三,用sort+sed命令,同样需要sort命令先排序。

sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D'

Shell脚本

测试文件:

yanggang@barry$ cat test.txt
aaa
bbbbb
ccccc
123
aaaaa
123
bbb
aaa

执行结果:

yanggang@barry$ ./diffRow.sh
aaa
aaaaa
bbb
bbbbb
ccccc
123



推荐参考:

删除文本中的重复行sort+uniq/awk/sed

SED单行脚本快速参考Unix 流编辑器

分享到:
评论

相关推荐

    文本文件,删除重复行

    标题"文本文件,删除重复行"和描述指出,有一个用Pascal语言编写的程序,能够在极短的时间内完成这个任务。 首先,我们要理解什么是重复行。在文本文件中,如果某一行内容与文件中的其他行完全相同,那么这一行就被...

    重复文件删除工具Linux32位

    4. 删除重复文件:按照提示或指定选项,安全地删除重复文件。 5. 清理工作:完成删除后,可能需要更新文件系统索引,如执行`updatedb`命令,以便未来的搜索能更快地定位文件。 总之,"重复文件删除工具Linux32位...

    重复文件删除工具Linux64位

    本文将详细介绍“重复文件删除工具Duplicate-File-Eraser”在Linux 64位环境下的应用,以及如何利用MD5校验和来识别和删除重复文件。 1. **重复文件的定义**:在计算机系统中,重复文件是指内容完全相同但文件名...

    linuxshell删除重复文件只保留一份.docx

    Linux Shell 删除重复文件保留一份 Linux Shellscript 是一种强大的命令行工具,用于自动化和批量处理文件操作。今天,我们将讨论如何使用 Linux Shell 删除重复文件,仅保留一份。 标题解释 Linux Shell 删除重复...

    查找删除重复(同名)文件免安装

    - **免费软件**:例如"CCleaner"、"Duplicate Cleaner"等,它们提供图形化界面,用户只需几步操作即可找出并删除重复文件。 - **命令行工具**:如`fdupes`,它是一个开源命令行工具,可以在Linux、macOS和Windows...

    shell中删除文件中重复行的方法

    Linux下文本处理工具很丰富很强大,例如这样一个文件: 代码如下:cat log ...1.使用uniq/sort删除重复行注意:单纯uniq是不行的。 代码如下

    linux下查找重复文件

    我们可以使用`uniq`命令来过滤掉这些相邻的重复行,但要注意`uniq`只会忽略连续的重复行,所以我们需要先用`sort`对整个输出进行排序: ```bash find . -type f -exec md5sum {} \; | sort | uniq -D ``` `uniq -D...

    删除重复的记录,并保存第一条记录或保存最后一条记录

    "删除重复的记录,并保存第一条记录或保存最后一条记录" 删除重复记录是数据库管理中的一项重要操作,旨在消除数据库中重复的数据,以确保数据的准确性和一致性。在本文中,我们将探讨删除重复记录的方法,并讨论...

    重复文件查找删除器

    综上所述,这款“重复文件查找删除器”是一个跨平台的应用程序,提供了Windows、Mac OS X和Linux三种操作系统版本。用户可以根据自己的系统需求选择相应的安装包,并通过提供的多语言帮助文档了解如何使用。其核心...

    删除重复文件

    在日常的计算机使用中,我们可能会遇到硬盘空间不足或者文件管理混乱的问题,这时删除重复文件就显得尤为重要。本文将深入探讨如何有效地查找并删除电脑中的重复文件,以优化存储空间和提高文件管理效率。 首先,...

    php删除文本文件中重复行的方法

    3. 使用辅助函数`RemoveDuplicatedLinesByString`处理字符串,删除重复行并返回结果。 4. 检查文件是否可写,如果不可写则打印错误信息并终止执行。 5. 将处理后的内容写回原文件,完成删除重复行的操作。 辅助函数...

    删除行代码备用

    1. **代码重构**:为了提高代码的可读性和维护性,程序员可能会删除不必要的代码行,如过时的注释、未使用的变量声明、重复的函数等。 2. **调试**:在查找和修复错误时,删除或注释掉可能导致问题的代码行是一种...

    彻底删除重删池(linux)

    删除重复数据删除存储目录 如果之前指定了db路径,确保也一并删除。 #### 11. 启动NetBackup服务 完成上述步骤后,重新启动NetBackup服务,确保系统正常运行。 ``` /usr/openv/netbackup/bin/goodies/...

    如何在Linux上找出并删除重复的文件:FSlint

    大家好,我们会学习如何在Linux PC或者服务器上找出和删除重复文件。这里有一款工具你可以工具自己的需要使用。  无论你是否正在使用Linux桌面或者服务器,有一些很好的工具能够帮你扫描系统中的重复文件并删除...

    重复文件删除工具

    7. **兼容性**:一个好的重复文件删除工具应该支持各种类型的文件系统和操作系统,如FAT、NTFS、EXT以及Windows、Mac OS、Linux等。 在使用重复文件删除工具时,需要注意以下几点: 1. **备份重要数据**:在进行大...

Global site tag (gtag.js) - Google Analytics