X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00145359]短文本语言模型系统

交易价格: 面议

所属行业: 软件

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

该项目为横向合作项目。 该项目设计、开发和完成短文本语言模型系统模块,并利用大规模语料样本训练出基于N-gram的语言模型,为短文本语言的语音合成、语音识别、文本分类与聚类、信息的索引和检索、内容的抽取和挖掘等提供基础的支撑功能,主要研究内容包括: 1.研究基于各种方法的语言模型,主要包括隐马模型(Hidden Markov Model,HMM)、最大熵模型(Maximum Entropy,ME)和条件随机场模型(conditional Random Field,CRF)等,重点研究N-gram语言模型。 2.设计和实现一套完整的短文本语言模型系统模块,主要是针对N-gram语言模型来设计语言模型系统模块。 3.语言模型系统模块将包括预处理、噪声去除、分词、语言模型训练、语言模型判别等基本子模块。 4.利用2亿条或更多条短文本数据,建立五元Ngram语言模型。 5.提供约定的接口,以方便于二次开发和应用。 研究单位:北京邮电大学信息与通信工程学院 项目负责人:徐蔚然 项目组成员:徐蔚然,刘刚,洪立印,彭君睿 结题时间:2014年3月25日

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467