一种基于直线连续性的文档图像来源判别方法,首先对输入的二值图像进行边缘提取的操作,然后使用3*N的直线检测模板进行水平和竖直方向的直线段检测,并通过搜索得到完整的直线段以及直线段两端局部区域内的孤立噪声点;随后在检测到的直线段上进行双向的扩展搜索得到直线段对应的基底直线长度;最后根据基底直线的长度进行分类,并计算每一类中直线段长度和基底直线长度的比值作为特征,将孤立噪声点的数目和直线段数目的比值作为附加的特征添加后输入训练过的SVM分类器中进行分类,最终输出图像的类别;本发明针对了二值文档图像来源判别方法中的不足和空白,在保证没有误判的基础上,可以快速地区分大多数含有直线的文档图像。