当前位置: 软件>JavaScript软件
"结巴"分词的Node.js版本 nodejieba
本文导语: NodeJieba "结巴"分词的Node.js版本Introduction 因为npm速度很慢而且经常因为墙的原因出现莫名其妙的问题,在此强烈建议使用cnpm,命令如下:npm --registry=http://r.cnpmjs.org install nodejiebaUsage默认分词算法初始化var segment = require("no...
NodeJieba "结巴"分词的Node.js版本Introduction
NodeJieba只是CppJieba简单包装而成的node扩展,用来进行中文分词。
Installnpm install nodejieba
因为npm速度很慢而且经常因为墙的原因出现莫名其妙的问题,在此强烈建议使用cnpm,命令如下:
npm --registry=http://r.cnpmjs.org install nodejiebaUsage默认分词算法初始化
var segment = require("nodejieba"); segment.loadDict("./node_modules/nodejieba/dict/jieba.dict.utf8", "./node_modules/nodejieba/dict/hmm_model.utf8");阻塞式调用
var wordList = segment.cutSync("阻塞模式分词"); if (wordList.constructor == Array) // just for tutorial, this is always be true { wordList.forEach(function(word) { console.log(word); }); }非阻塞式调用
segment.cut("非阻塞模式分词", function(wordList) { wordList.forEach(function(word) { console.log(word); }); });搜索引擎分词算法初始化
var segment = require("nodejieba"); segment.queryLoadDict("./node_modules/nodejieba/dict/jieba.dict.utf8", "./node_modules/nodejieba/dict/hmm_model.utf8");阻塞式调用
var wordList = segment.queryCutSync("阻塞模式分词"); if (wordList.constructor == Array) // just for tutorial, this is always be true { wordList.forEach(function(word) { console.log(word); }); }非阻塞式调用
segment.queryCut("非阻塞模式分词", function(wordList) { wordList.forEach(function(word) { console.log(word); }); });
具体用法可以参考 test/segment.js test/query_segment.js
Testing在node v0.10.2下测试通过
Demohttp://cppjieba-webdemo.herokuapp.com/ (chrome is suggested)
Thanks您可能感兴趣的文章:
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。