当前位置: 技术问答>linux和unix
统计单词个数
来源: 互联网 发布时间:2016-01-29
本文导语: 大家好,我刚学UNIX,有个问题,前提是 有五个目录,每个目录下至少有一个文件,怎样在UNIX下,用C统计处这些文件中单词个数的总和 ,及每个单词出现的次数,多谢大家了~~希望谁能告诉我的大致算法。 ...
大家好,我刚学UNIX,有个问题,前提是 有五个目录,每个目录下至少有一个文件,怎样在UNIX下,用C统计处这些文件中单词个数的总和 ,及每个单词出现的次数,多谢大家了~~希望谁能告诉我的大致算法。
|
如果文件有标准的格式,例如以空格为分隔分开单词,就简单了,记下这个单词,对比就行
如果是杂乱无章的,就要有单词库了,一般这是不可能的。
如果给定一个单词统计出现次数,在杂乱无章的情况下,就一个字符一个字符的记,碰到和第一个符一样的就停下来对比,相同则计数加1, 不同则读下一个字符。这样一直到文件尾。
貌视我进公司面试的就是这道,可惜源码早不知道放哪了,不然可以贴上来
如果是杂乱无章的,就要有单词库了,一般这是不可能的。
如果给定一个单词统计出现次数,在杂乱无章的情况下,就一个字符一个字符的记,碰到和第一个符一样的就停下来对比,相同则计数加1, 不同则读下一个字符。这样一直到文件尾。
貌视我进公司面试的就是这道,可惜源码早不知道放哪了,不然可以贴上来
|
opendir, readdir , fgets, getToken, string map