加载中……  推广三步走:免费注册 -> (提交网站)/(文章投稿) -> 带来无限流量
最新收录网站   最新网站源码下载    最新更新资讯文章
首页 >> [站长源码下载] >> PHP源码>> 搜索链接>> SCWS简易中文分词系统

SCWS简易中文分词系统 v1.2.2

站长搜索 2014-07-26 整理发布  
资源链接:[ 下载地址 ] [ 评论报错 ]
授权方式:共享软件
界面语言:简体中文
文件大小: MB
更新时间:2014-07-26
资源类型:国产软件
推荐等级: ★★★★☆
平台环境:Win2003,WinXP,Win2000,Win9X
作者主页: 点击查看
广告位招租 1天低至2块钱,QQ:93898856

详细介绍 - [ SCWS简易中文分词系统 v1.2.2 ]


 SCWS是Simple Chinese Word Segmentation的首字母缩写(即:简易中文分词系统)。

这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。

SCWS采用纯C语言开发,不依赖任何外部库函数,可直接使用动态链接库嵌入应用程序, 支持的中文编码包括GBK、UTF-8等。此外还提供了PHP扩展模块, 可在PHP中快速而方便地使用分词功能。

分词算法上并无太多创新成分,采用的是自己采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词,经小范围测试准确率在90%~95%之间, 基本上能满足一些小型搜索引擎、关键字提取等场合运用。首次雏形版本发布于2005年底。

SCWS简易中文分词系统 1.2.2 更新日志:
1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6"
2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容
3) 修正一些 configure 检测错误

 

SCWS简易中文分词系统

 



 

下载地址 - [ SCWS简易中文分词系统 v1.2.2 ]
下载说明
推荐使用迅雷QQ旋风下载,请使用WINRAR解压文件;
下载本站资源,如服务器暂不能下载请过一段时间再试;
本站资源通过 QQ电脑管家金山毒霸 等软件检测;
本站部分资源供学习交流使用,如商业用途,请购正版。