当前位置: 技术问答>linux和unix
如何提取一篇文章中的所有词汇
来源: 互联网 发布时间:2016-08-03
本文导语: 在一篇文章中,基本是由几个词构成,想要把所有的词都罗列出来,有没有什么命令,或者用什么语句编程能够实现 | LZ说的可能没有分词那么高深,比如对于空格分隔的单词组成的文章,我...
在一篇文章中,基本是由几个词构成,想要把所有的词都罗列出来,有没有什么命令,或者用什么语句编程能够实现
|
LZ说的可能没有分词那么高深,比如对于空格分隔的单词组成的文章,我的想法是,把空格都替换成换行,然后就简单了,先排序后滤重,sort a.txt|uniq就搞定了