X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到天长市科技大市场,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[00033729]一类样本标签缺失数据的分类器训练方法

交易价格: 面议

所属行业: 固体废弃物污染处理

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:ZL2016108187373

交易方式: 完全转让 许可转让 技术入股

联系人: 孙老师

进入空间

所在地: 北京北京市

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

本技术处理两类样本的分类问题。其中负类样本的标签数据全部缺失, 观测数据中仅有部分正类样本的标签是已知的。缺失标签的数据可能是 正类样本,也可能是负类样本。该种类型的数据广泛出现于图像识别、 多肽鉴定等问题.主要技术难点: 由于负类样本标签均未知,该类问 题在数据质量较差的数据集上通常不稳定,另外,许多模型是较复杂的 非凸优化模型,在求解大规模数据集时存在困难. 所提供的技术核心 支撑点包括:(1)提供一套建模技术, 将样本标签的可靠性作为待求 解的决策变量,采用基于核的学习技术,建立适于求解的分类模型; (2)引入自步长学习技术,首先用可靠样本训练模型,分批将复杂的 样本自动纳入训练过程,避免了分类器训练过程中,算法陷入较差的局 部最优解;(3)开发了在线学习算法,高效分析大规模数据集。应用 前景:凡是仅观测到部分正类样本的标签、而其余样本标签缺失的分类 问题,均可尝试该技术方案。例如 (1)多肽谱匹配匹配鉴定问题:部分 匹配错误的样本标签已知,从数据集中寻找匹配正确的样本; (2)识 别问题:从未标注数据中寻找与用户提供的样本相似的样本,如从数据 库中寻找与用户提供的图片相似的图片;(3)垃圾邮件检测:正常邮 件具有稳定的分布,可视为正类样本,垃圾邮件随时间推移通常采用不 同的策略,可视为未标号样本。

推荐服务:

Copyright  ©  2019    天长市科技大市场    版权所有

地址:滁州高新区经三路

皖ICP备2023004467