绿色软件联盟:绿色软件下载
Hi,请  登录  或  注册

好又快词法分析系统 1.0

本软件下载地址未录入,如想要软件请评论,我们会补上!
好又快词法分析系统是由北京法国电信研发中心历经多年研发而形成的具有世界先进水平的分词和未登录词识别系统,该系统采用由字构词的技术路线和基于分类的判别式建模(如图1),克服了传统词法分析系统中生成式建模的理论假设缺陷,具有理论基础完备、分词精度高、处理速度快、学习效率高、新应用新语种部署快等诸多优势。同时,好又快词法分析系统在国际权威的SIGHAN中文分词和未登录词识别评测中获得多项第一,显著的综合性能为好又快词法分析系统奠定了坚实的技术基石。

主要功能
智能分词 切分歧义消解 词性标注 新词识别 支持用户词典


特色优势
1. 理论基础完备(代表未来技术方向)
传统词法分析采用生成式建模,这种建模技术要求语言必须符合马尔可夫性假设,而该假设在实际文本中并不成立;好又快词法分析系统建立在无需任何假设前提的判别式建模理论之上,建模理论完备。同时好又快词法分析系统采用由字构词的技术路线,以字为处理单元来确定词的边界,实现了对传统词法分析技术的突破性改进,确保机器的分词过程更接近人脑对文本中词语的识别,全面提高了词法分析准确率。


2. 分词精度高(提高业务量)
人们利用互联网获取信息时,往往对人名、地名、机构名、商品名等所表达的信息非常感兴趣,而这些词大都是未登录词,所以识别出更多的未登录词是提高信息服务系统业务量的关键。传统词法分析技术中的未登录词识别过于依赖外部触发知识(如人名姓氏、地名、机构名、商品名关键词),如果触发知识不完备,部分未登录词就无法识别;但倘若触发知识过多,又会引入不必要的错误。好又快词法分析系统完全克服此技术难题,识别未登录词不需要任何词典和外部触发知识,能准确识别出更多的未登录词,力保业务系统有更高查全率。此外,传统词法分析系统中切分歧义的识别取决于词典词汇量的大小,词典词汇量大,就>

赞(0)
标题:《好又快词法分析系统 1.0》
链接:https://www.lvruan.com/app/47283
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。

相关推荐

  • 暂无文章

LvRuan.com=绿软=绿盟=绿色软件联盟
情怀第一 18年 老牌 下载站 绿色 安全 无广告 无捆绑

评论 抢沙发

登录

找回密码

注册