X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00056157]一种基于汉字混淆集的错字词知识生成方法

交易价格: 面议

所属行业: 分析仪器

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:CN201510917790.4

交易方式: 完全转让 许可转让 技术入股

联系人: 江苏科技大学

进入空间

所在地: 江苏镇江市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

本发明公开了一种基于汉字混淆集的错字词知识生成方法,该方法首先利用正确词词典和汉字混淆集生成混淆词集合;通过语料和规则对生成的混淆词集合进行剪枝完成初步过滤;再采用正向最大匹配分词对初步过滤完后的混淆词集合中的混淆词进行分词,根据预先设置的错字词判断规则利用统计知识对混淆词进行验证,最终生成错字词知识。本发明方法解决了现有的人工校对效率低且劳动量大的问题,利用本发明方法所得到的错字词知识进行自动校对和纠错,提高了中文文本自动校对的纠错质量和纠错速度。

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467