`
wx1569488408
  • 浏览: 79142 次
文章分类
社区版块
存档分类
最新评论

shell中uniq与sort -u 两种去重的对别

 
阅读更多

sort -u 和 uniq都能起到删除重复信息的功能,那么他们的区别究竟在哪呢?
$ cat test              
jason
jason
jason
fffff
jason

下面分别执行三个命令

1:sort -u test

sort -u test
fffff
jason

2: uniq test

$uniq test 
jason
fffff
jason 

 3: sort test|uniq

$sort test |uniq 
fffff
jason

从上面三个命令我们很容易看出他们之间的区别。uniq所谓的重复是连续出现的相同记录(来自转载)

转载于:https://my.oschina.net/u/3180379/blog/812522

分享到:
评论

相关推荐

    shell两个文件去重的多种姿势

    大家都知道shell在文本处理上确有极大优势,比如多文本合并、去重等,但是最近遇到了一个难搞的问题,即两个大数据量文件去重。下面来看看详细的介绍吧。 要求  有txt文件A.txt和B.txt。 其中A为关键词和搜索量,以...

    shell中删除文件中重复行的方法

    ### Shell中删除文件中重复行的方法 在Shell脚本中,我们经常需要处理文本文件,尤其是在日志分析、数据清洗等场景中。去除文件中的重复行是一项常见的需求,本文将详细介绍几种有效的方法来实现这一目标。 #### ...

    Linux shell命令统计某列去重后的值

    本文主要介绍如何使用 Linux Shell 命令来实现对文本文件中某列数据进行去重并统计的过程。具体应用场景为:根据 MAC 地址获取其对应的硬件版本和软件版本,并基于硬件版本对 MAC 地址的数量进行统计。 #### 需求...

    Linux环境下shell编程

    例如:`sort file.txt | uniq`先排序后去重。 13. **expr**: 执行算术运算。例如:`expr 2 "+" 3`计算2加3的结果。 14. **find**: 搜索文件系统中的文件。例如:`find . -name "filename"`查找当前目录及其子目录下...

    Shell脚本中管道的几种使用实例讲解

    `history`列出用户的历史命令,`awk '{print $2}'`提取出命令本身,`sort`对命令进行排序,`uniq -u`去重,`sort -rn`按降序排列,最后`head -5`取出前五个。 第四个例子演示了如何查看哪些用户的登录shell是`/bin/...

    字符串比较脚本 shell script

    在IT领域,shell script是一种非常实用的工具,它允许用户通过编写脚本来自动化一系列的命令行操作。在本例中,我们关注的是一个特定的shell脚本,用于比较多个文本文件中的单词,找出它们的交集和并集。这个任务在...

    bash shell programming

    循环是 Bash Shell 编程中的另一种控制结构,用于重复执行一系列命令直到满足特定条件。 ##### 7.1 for 循环示例 - **语法**: ```bash for file in *.txt; do echo "Processing $file" # 进行文件处理操作 ...

    SHELL 数据转化

    在IT行业中,Shell脚本是一种常用的自动化工具,尤其在数据处理和系统管理中扮演着重要角色。本话题“SHELL 数据转化”将聚焦于如何利用Shell脚本来进行数据转换和处理。通过阅读给出的博文链接...

    shell监控linux系统进程创建脚本分享

    Shell脚本是Linux或类Unix操作系统中的一种批处理程序,它由Bash(Bourne-Again SHell)或其他Shell解释器执行。通过编写Shell脚本,我们可以自动化执行一系列命令,包括系统管理和监控任务。 在标题和描述中提到的...

    Linux命令列表.pdf

    - `sort`/`uniq`:对文本文件的行进行排序和去重。 - `comm`:比较两个已排序文件的不同。 **Linux网络通信命令**: - `ifconfig`:配置或显示网络接口的状态。 - `netstat`:显示网络连接、路由表、接口统计等信息...

    create_list_data.zip

    例如,它可能使用`awk`、`sed`或`grep`命令来处理文本文件,或者利用`sort`和`uniq`来去除重复项,生成一个有序且去重的数据列表。 其次,`create_data.sh`可能是用于生成数据的脚本。这可能涉及到随机数生成、模拟...

Global site tag (gtag.js) - Google Analytics