锁定老帖子 主题:Linux基本命令面试题
精华帖 (0) :: 良好帖 (0) :: 隐藏帖 (10)
|
|
---|---|
作者 | 正文 |
发表时间:2008-05-04
zgos 写道 tr -s "\t| " "\n" <1.txt|sort|uniq -c
正解 有点小瑕玼,单词与标点符号连在一起时,会被认作一个新单词。 |
|
返回顶楼 | |
发表时间:2008-06-16
按照zgos的方法我又改进了一下,去掉了标点符号,并让脚本大小写不敏感:
cat 1.txt | tr -s "[:punct:]" " "| tr "[A-Z]" "[a-z]" | tr -s "\t+| +" "\n" | sort | uniq -c | sort -r 输出结果: 9 and 7 i 5 to 3 the 3 like 3 is 3 important 2 with 2 than 2 technologies 2 team 2 my 2 more 2 knowledge 2 in 2 have 2 development 2 d <----------这就是I‘d like造成的 1 very 1 thinking 1 thick 1 summarizing 1 success 不过还有个问题就是“’d”不能简单的把“’”变成空格,而是需要转换成相应单词,不过到底转化为“would“还是“had”很麻烦。 |
|
返回顶楼 | |
发表时间:2008-06-16
renyangok 写道 按照zgos的方法我又改进了一下,去掉了标点符号,并让脚本大小写不敏感:
cat 1.txt | tr -s "[:punct:]" " "| tr "[A-Z]" "[a-z]" | tr -s "\t+| +" "\n" | sort | uniq -c | sort -r 输出结果: 9 and 7 i 5 to 3 the 3 like 3 is 3 important 2 with 2 than 2 technologies 2 team 2 my 2 more 2 knowledge 2 in 2 have 2 development 2 d <----------这就是I‘d like造成的 1 very 1 thinking 1 thick 1 summarizing 1 success 不过还有个问题就是“’d”不能简单的把“’”变成空格,而是需要转换成相应单词,不过到底转化为“would“还是“had”很麻烦。 建议不要用CAT,直接文件流就可以了 |
|
返回顶楼 | |
发表时间:2008-06-27
frogfool 写道 [请教]统计文件a.txt中“每个单词”的重复出现次数?若该文件大到几个G又该如何处理?
cat file | tr ' ' '\n'|tr A-Z a-z| sed -e 's/[\,\:\.]//g'|sort | uniq -c|sort -nr |
|
返回顶楼 | |
发表时间:2008-08-20
不懂的还是很多哦 奋斗啊
|
|
返回顶楼 | |
发表时间:2008-11-15
tr -cs '[:lower:][:upper:]' '[\n*]' < a.txt | sort |uniq -c |sort -r
|
|
返回顶楼 | |