`
dpzc
  • 浏览: 13054 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

join、sort等分隔符的问题

 
阅读更多
待处理的数据,每列使用\t,即tab分隔。如
a文件
hello world     100     0
goodbaby        50      0
goodguy 25      0

b文件
123     hello world
456     goodbaby
789     good baby

正确的命令是
join -t $'\t' -1 1 -2 2 -o "1.1,1.2,2.1" a b

结果是
hello world     100     123
goodbaby        50      456


写成join -t $"\t" join -t '\t' 等等都是不行的,直接用tab键分隔也很难成功。。。

join的默认分隔符是空白,所以hello world     100     123这行会被认为是4个字段

此分隔符对于sort也是一样的。另外需注意,使用join关联两个文件之前,需要对文件进行排序。

分享到:
评论

相关推荐

    linux sort join cut paste split uniq

    `sort`、`join`、`cut`、`paste`、`split`和`uniq`是Linux命令行中的一组强大工具,它们专门用于对文本文件进行排序、合并、切割、拼接、分割和去重等操作。下面将详细讲解这些工具的使用方法和应用场景。 1. `sort...

    js中的push和join方法使用介绍.docx

    `join()`方法则是将数组的所有元素组合成一个字符串,元素之间由指定的分隔符隔开。默认情况下,如果没有提供分隔符,它会使用逗号(`,`)作为分隔符。其基本语法如下: ```javascript array.join(separator) ``` ...

    Linux操作命令八.doc

    * -t 自定义分隔符,默认为制表符。 sort 命令可以用于各种场景,例如排序文本文件、排序数据库查询结果等。 二、uniq 命令 uniq 命令是 Linux 中一个有用的命令,它从标准输入或单个文件名参数接受数据有序列表...

    tabulator:一组 Unix shell 命令行工具,用于快速方便地批量处理带有标题行的表格文本文件(也称为制表符分隔、tsv、csv 或平面数据文件格式)。 提供按名称的列引用、自动分隔符和每行转换的压缩检测、类似 sql 的 group-by 操作和关系连接

    1.2 2014/10/12 发布 1.1.2 2012/01/24 发布 1.1.1 2011/11/25 发布 1.1.0 2009/06/16 发布 1.0.0目的Unix/Linux 带有多种工具,例如cut, paste, join, sort,以处理表格文本数据文件(也称为制表符分隔、 csv 、 tsv...

    python中join()方法介绍

    在使用join()方法时,可以根据需要选择不同的分隔符来连接序列元素。例如: - 使用'-'连接元组 - 使用空字符串连接列表 - 使用'-'连接字典的键 - 使用os.path.join连接文件路径 以下是具体的代码示例和执行结果: ...

    Linux相关命令详解

    paste 的常用选项包括-d 选项,用于指定分隔符,-s 选项,用于串联文件等。 join 命令是用于合并两个或多个文件。join 语法规则包括join [OPTIONS] [FILE1] [FILE2],其中 OPTIONS 是可选参数,FILE1 和 FILE2 是...

    python练习题Question8.txt

    这里使用了字符串的`join()`方法,它将列表中的所有元素连接成一个单一的字符串,元素之间用指定的分隔符分隔。 6. 遍历列表:在列表推导式`[x for x in input().split(',')]`中,`for x in`这一部分是遍历列表的...

    pandas综合练习50题 - 人口收入分析

    如果文件没有标准的分隔符,可能需要自定义分隔符。 2. 数据预处理:数据通常需要清洗和转换,以便于分析。这可能包括处理缺失值(`fillna()`, `dropna()`),转换数据类型(`astype()`),以及处理异常值。 3. ...

    实例解析Array和String方法

    转换:toString() toLocateString() join([分隔符]) 操作:concat([多个项]) slice(起点[,终点]) splice(起点,个数[,多各项]) 位置:indexOf(项[,起点]) lastIndexOf(项[,起点]) ——迭代方法 参数: (functio

    Linux基础知识(8-10)-管线指令.pdf

    `$ sort -t ':' -k 3 /etc/passwd` 将 `/etc/passwd` 文件按第三列(通常是用户ID)排序,`-t ':'` 定义了分隔符为冒号,`-k 3` 指定第三列。 3. `uniq`:用于去除连续重复的行。`$ last | cut -d ' ' -f 1 | sort ...

    JavaScript中数组的22种方法必学(推举)_.docx

    4. `join()`:`join()`方法将数组元素连接成一个字符串,分隔符可自定义。默认情况下,它使用逗号作为分隔符。例如:`var a = [1,2,3]; console.log(a.join()); // '1,2,3'`,若传入空字符串则元素之间无分隔符:`a....

    (word完整版)python二级考试操作题10.doc

    1. `split(',')`函数:此函数用于将字符串按照指定的分隔符(这里为逗号)切割,返回一个包含切割后的子字符串的列表。例如,输入字符串"1,2,3,4,5",`split(',')`会返回`['1', '2', '3', '4', '5']`。 2. `str....

    第二周js笔记.docx

    `join()`方法可将数组转换为字符串,并允许自定义分隔符,如`var str=arr1.join('--');`。`toString()`方法也用于转换为字符串,但不接受分隔符参数。`reverse()`方法用于数组反转,而`sort()`方法则用于数组排序。 ...

    awk实现Left、join查询、去除重复值以及局部变量讲解例子

    这个方法使用 `-v OFS=","` 设置输出字段分隔符为逗号,`$1 in a` 检查 `b.txt` 的第一列是否在数组 `a` 的键中。 ### 二、去除重复的值 awk 也可以用来去除文本中的重复行,以下介绍三种不同的实现方式: **方法...

    JavaScript中数组的22种方法必学(推荐)

    - `join()`:将数组元素连接成一个字符串,通过指定的分隔符。默认使用逗号,例如`[1,2,3].join()`返回`'1,2,3'`。可以传递参数如`' '`(空格)来改变分隔符,如`[1,2,3].join(' ')`返回`'1 2 3'`。当分隔符为`...

    javascript参考手册【w3c】【带书签、文档内超链接】

    `concat()`可以连接多个数组,而`join()`可以将数组的元素组合成一个由特定分隔符分隔的字符串。这些方法不仅在数组操作中非常实用,还能够帮助开发者在多种场景下灵活处理数据。 此外,文档中还提到了`Array`对象...

    最实用的JS数组函数整理

    `join()`方法允许指定一个字符串作为分隔符,将数组中的所有元素连接成一个字符串返回: ```javascript var arr = ["aaa", "bbb", "ccc"]; console.log(arr.join()); // "aaa,bbb,ccc" console.log(arr.join("|"));...

    javascript

    默认情况下,数组元素之间由逗号分隔,但你可以自定义分隔符。例如,`[1, 2, 3].join("-")` 将返回 "1-2-3"。这个方法在处理数据展示或创建URL查询参数时非常有用。 2. **length属性**:在JavaScript中,无论是数组...

Global site tag (gtag.js) - Google Analytics