摘要:本发明公开了一种云环境下的分布式系统多级故障容错方法,包括基于虚拟机磁盘快照的分布式应用协同备份算法,能够对I/O状态以及所依赖的操作系统环境进行备份;分层故障检测和恢复机制,能够实时地检测物理层、虚拟化层、云平台层、虚拟机OS层和应用层故障,针对不同的故障采用相匹配的故障恢复方法。使得故障检测和恢复细化到模块,采用自顶向下逐级恢复的策略,做到恢复开销最小化;基于模板的虚拟容错集群服务部署策略,用户能够利用虚拟机模板一键部署虚拟机容错集群,并上传作业进行托管,同时使用经过授权的容错PaaS服务。本发明能够有效的解决现有集群部署复杂,容错开销大的问题,并且能够全方位应对云计算环境下分布式应用各层次故障。