联系人: 哈尔滨工业大学
所在地: 黑龙江哈尔滨市
摘要:一种用于蛋白质功能预测的层级多标签分类方法,涉及生物信息学及数据挖掘领域,尤其涉及一种用于蛋白质功能预测的层级多标签分类方法。本发明要为解决现有分类方法用于预测蛋白质功能时,存在数据集不平衡问题、多标签问题和层级约束问题。本发明所述方法按以下步骤进行:一、训练阶段:在训练阶段针对类标签层级结构中的每个节点的数据集采用一个SVM分类器进行训练,得到一组基础分类器;二、预测阶段:在预测阶段首先使用训练阶段获得的这组基础分类器得出未知样本的初步结果,而后采用带权重的TPR算法对结果进行处理,得到满足层级约束条件的最终结果,实现对蛋白质功能的预测。本发明应用于生物信息学及数据挖掘领域。