当前位置:  技术问答>linux和unix

统计单词个数

    来源: 互联网  发布时间:2016-01-29

    本文导语:  大家好,我刚学UNIX,有个问题,前提是  有五个目录,每个目录下至少有一个文件,怎样在UNIX下,用C统计处这些文件中单词个数的总和  ,及每个单词出现的次数,多谢大家了~~希望谁能告诉我的大致算法。 ...

大家好,我刚学UNIX,有个问题,前提是  有五个目录,每个目录下至少有一个文件,怎样在UNIX下,用C统计处这些文件中单词个数的总和  ,及每个单词出现的次数,多谢大家了~~希望谁能告诉我的大致算法。

|
如果文件有标准的格式,例如以空格为分隔分开单词,就简单了,记下这个单词,对比就行
如果是杂乱无章的,就要有单词库了,一般这是不可能的。
如果给定一个单词统计出现次数,在杂乱无章的情况下,就一个字符一个字符的记,碰到和第一个符一样的就停下来对比,相同则计数加1, 不同则读下一个字符。这样一直到文件尾。

貌视我进公司面试的就是这道,可惜源码早不知道放哪了,不然可以贴上来

|
opendir, readdir , fgets, getToken, string map

    
 
 

您可能感兴趣的文章:

  • 布同 统计英文单词的个数的python代码
  • Python开发的单词频率统计工具wordsworth使用方法
  • PHP统计字符串中单词出现次数的函数
  • c#英文单词分类统计示例分享
  • python用字典统计单词或汉字词个数示例
  • python实现统计汉字/英文单词数的正则表达式
  • vi怎么统计查找字符串的个数?
  • 统计某个词出现个数
  • 急!!求教linux命令的使用:统计出/bin目录中文件的个数,追加到文件filea的结尾
  • 请问用什么命令来统计一个目录下所包含的文件个数?
  • linux中 写shell程序,用于统计文件中关键字的个数
  • jquery统计输入文字的个数
  • 请教:linux下有统计CPU的个数和CPU利用率的函数吗???(急!!!)
  • 统计某一字段等于不同值的个数的sql语句
  • 如何统计一目录下的文件个数?
  • C#统计字符串里中文汉字个数的方法
  • 如何统计一个字串里某个字符的个数?
  • Linux c语言 如何统计utf-8编码的包含中英文和各种符号的字符串中各个字符的个数
  • 求助 shell中split命令如何实现文件分割 并统计分割文件个数。分割完之后,命名方式从 文件名.001 开始
  • 用netfilter钩子函数统计输出包的个数,出错了!
  • jquery统计输入文字的个数并对其进行判断
  • java文件操作代码片断实例实现统计文件中字母出现的个数功能
  • unix 下统计文件的个数
  • PHP如何统计数组元素个数
  • jquery统计用户选中的复选框的个数
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • linux 命令 统计两个文件夹下 不同的文件(只统计文件名)
  • shell脚本实现的网站日志分析统计(可以统计9种数据)
  • 如何得到一个字符串里的换行次数,我用StringTokenizer来统计的话如果有一个行没内容的话就会统计出错,好烦啊
  • 浙ICP备11055608号-3 iis7站长之家
  • 代码覆盖率统计工具gcov的扩展 lcov
  • 请问如何在UNIX下统计一批文件的大小啊?
  • php 统计字数(支持中英文)的实现代码
  • 源码统计工具 pepper
  • 邮件反病毒统计代理 DSPAM
  • Apache日志统计 GoAccess
  • 网站流量统计系统 AudiStat
  • 网页统计日志分析 SuperSeriousStats
  • 网站流量访问统计分析 SlimStat
  • JavaScript统计库 jStat
  • 如何用awk统计数据
  • 网络使用情况统计工具 AsItHappens
  • Oracle中关数据库对象的统计分析
  • 代码行数统计工具 uuStepCount
  • 磁盘使用统计工具 ncdu
  • Web网站统计 WebDruid


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3