本发明适用于三维可视化技术领域,提供了一种生成说话人三维运动模型的方法包括:获取摄像头采集的彩色图像的信息以及深度数据信息;将获取到的数据送入人脸检测函数,计算是否检测到人脸,如果检测到人脸,则计算当前人脸的状态;根据计算出的当前人脸的状态生成被测试人的三维人头模型;获取被测试人发音的运动轨迹的位移;根据被测试人发音的运动轨迹的位移和生成被测试人的三维人头模型,生成发音的三维人头运动模拟。本发明增加了三维建模的效率。另外,本发明在建立任意人的三维说话人运动模型的基础上,同时考虑声音向任意人的转变,从而使得本发明具有个性化人头与个性化声音结合效果。