X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00143053]基于主观逻辑的文本分类技术

交易价格: 面议

所属行业: 软件

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

成果简介: 该技术打破从传统机器学习理论中寻找文本分类途径的思维定势,从信任机制角度,基于主现逻辑设计了一种无须特征选择的高效的线性文本分类方法。面向特征与文档类的信任关系,利用Bata密度函数,建立可靠的特征与文档类分布评估体系,运用特征对文档类的信任值构造线性文本分类算法。在Reuters-21578、Newsgroup、复旦中文分类语料、SEWM2007评测语料、搜狗文本分类语料等被广泛使用且具有不同特性的语料集上与传统方法进行了比较实验,实验结果表明:相对于传统算法分类性能显著提高,对不均匀语料和高维特征处理表现出极强的鲁棒性且执行速度快,适于大规模文本分类,能较好地解决了文本分类中特征高维性、语料不均匀性、算法执行效率低等问题。 性能指标: 实验结果表明:本技术算法在各类语料上均比朴素贝叶斯、KNN、神经网络等方法显著提高,与目前文本分类性能最高的支持向量机方法相当,略有提高,但分类速度却远远超过支持向量机方法,因本技术算法是线性算法,而支持向量机是非线性算法。在SEWM2007评测语料进行的实验结果与当时第一名参赛大学大连理工采用的支持向量机实验结果相比超出2个百点。以下列出国内外广泛使用的Reuters-21578语料上与其它算法性能比较结果:算法 召回率 精确率 F1指标 11点平均 主观逻辑 0.8752 0.9074 0.8910 0.9132 支持向量机 0.8120 0.9137 0.8599 - KNN 0.8339 0.8837 0.8567 - 线性最小平方拟合 0.8507 0.8489 0.8498 - 神经网络 0.7842 0.8785 0.8287 - 朴素贝叶斯 0.7688 0.8245 0.7956 - 应用领域或范围: 文本分类技术在信息检索、、新闻即时分类、词义消歧、电子图书自动分类、网络名古舆情监控、医疗信息挖掘等领域都有重要应用。技术先进性和创新点: 从信任分析角度,基于主观逻辑设计算法,采用线性分类; 该技术国内外产文本分类研究中处于领先水平,不仅分类性能指标领先,更重要的是采用算法是线性的,分类速度快,适于大规模实时分类。 经济效益和合作方式: 技术转让、企业合作、科研合作。

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467