[00033730]大规模含噪数据流挖掘方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:ZL201610087343.5
交易方式:
完全转让
许可转让
技术入股
联系人:
孙老师
进入空间
所在地:
北京北京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本技术主要处理大规模含噪数据流挖掘问题,此类问题广泛存在于生物
信息学、社交媒体、流程工业生产过程等实际应用场景之中。主要技术
难点:由于样本标签中富含噪声,无法直接使用常规去噪技术如分箱算
法对数据做预处理,而现有在线学习算法处理富含噪音的样本数据,又
难以学习到系统的准确规律,导致学习算法的可靠性大打折扣。所提供
的技术核心支撑点:(1)针对分类问题,结合经典hinge损失和Ramp损失
构造一种新型损失函数以有效遏制噪音数据的负面影响,引入核函数设
计耐噪在线核分类算法,封装算法形成软件;(2)针对回归问题,构造
Canal损失函数以限制杠杆点等噪音数据的影响,基于核技巧构建具有
实时性的在线核学习算法,综合利用泛函Gateaux导数和在线梯度下降
方法设计可尺度化的快速更新算法,封装算法形成软件。应用前景:所
提耐噪在线核分类算法可用于处理一般的PU学习问题。如生物信息学中
的多肽鉴定问题等。所提耐噪在线核回归算法可用于构建动态高炉炉温
实时预报模型,集成到高炉专家系统中,与高炉炉温控制模型等协同,
有效降低高炉能耗、减少环境污染。