联系人:
所在地:
本发明公开了一种基于随机森林模型的程序错误定位方法,通过分析单错误版本DFEB所包含的特征,对特征值进行特征衍生和特征筛选,该过程可以挑选出有利于区分包含错误语句的DFEB和不包含错误语句的DFEB特征值,再通过逻辑回归和随机森林训练出两个模型,计算出每个DFEB的可疑度值,用8个经典的可疑度值计算公式获取每条语句的可疑度值,在块内根据语句的可疑度值进行排序,生成错误定位报告。本发明依赖DFEB块,在传统SFL方法4个因子的基础上,引入了DFEB长度这一新特征,并对这5个特征进行特征衍生和特征筛选,对随机森林模型进行训练用以估算DFEB的错误可疑度,能够很大幅度地提高错误定位的精度和效率。