论坛首页 招聘求职论坛

Linux基本命令面试题

浏览 18917 次
精华帖 (0) :: 良好帖 (0) :: 隐藏帖 (10)
作者 正文
   发表时间:2008-05-04  
zgos 写道
tr -s "\t| " "\n" <1.txt|sort|uniq -c

正解
有点小瑕玼,单词与标点符号连在一起时,会被认作一个新单词。
0 请登录后投票
   发表时间:2008-06-16  
按照zgos的方法我又改进了一下,去掉了标点符号,并让脚本大小写不敏感:

cat 1.txt | tr -s "[:punct:]" " "| tr "[A-Z]" "[a-z]" | tr -s "\t+| +" "\n" | sort | uniq -c | sort -r

输出结果:
      9 and
      7 i
      5 to
      3 the
      3 like
      3 is
      3 important
      2 with
      2 than
      2 technologies
      2 team
      2 my
      2 more
      2 knowledge
      2 in
      2 have
      2 development
      2 d           <----------这就是I‘d like造成的
      1 very
      1 thinking
      1 thick
      1 summarizing
      1 success

不过还有个问题就是“’d”不能简单的把“’”变成空格,而是需要转换成相应单词,不过到底转化为“would“还是“had”很麻烦。
0 请登录后投票
   发表时间:2008-06-16  
renyangok 写道
按照zgos的方法我又改进了一下,去掉了标点符号,并让脚本大小写不敏感:

cat 1.txt | tr -s "[:punct:]" " "| tr "[A-Z]" "[a-z]" | tr -s "\t+| +" "\n" | sort | uniq -c | sort -r

输出结果:
      9 and
      7 i
      5 to
      3 the
      3 like
      3 is
      3 important
      2 with
      2 than
      2 technologies
      2 team
      2 my
      2 more
      2 knowledge
      2 in
      2 have
      2 development
      2 d           <----------这就是I‘d like造成的
      1 very
      1 thinking
      1 thick
      1 summarizing
      1 success

不过还有个问题就是“’d”不能简单的把“’”变成空格,而是需要转换成相应单词,不过到底转化为“would“还是“had”很麻烦。


建议不要用CAT,直接文件流就可以了
0 请登录后投票
   发表时间:2008-06-27  
frogfool 写道
[请教]统计文件a.txt中“每个单词”的重复出现次数?若该文件大到几个G又该如何处理?


cat file | tr ' ' '\n'|tr A-Z a-z| sed -e 's/[\,\:\.]//g'|sort | uniq -c|sort -nr
0 请登录后投票
   发表时间:2008-08-20  
不懂的还是很多哦 奋斗啊
0 请登录后投票
   发表时间:2008-11-15  
tr -cs '[:lower:][:upper:]' '[\n*]' < a.txt | sort |uniq -c |sort -r
0 请登录后投票
论坛首页 招聘求职版

跳转论坛:
Global site tag (gtag.js) - Google Analytics