从《机器能思考吗》一文的发表开始,人工智能已经经历从专家系统到神经网络,再到今天统计学习理论几个阶段,这期间涌现了大量优秀的算法和理论。但我们也看到,在智能领域尤其是识别领域中,新的理论和方法往往也具有高度复杂和难以控制的特点,在实际应用往往不太实用。
本文提出了一种针对特定应用的简单识别算法。该算法只是通过简单的算法组合和计算实现了一定意义的复杂背景下的手势识别。
本文的方法首先需要将从视频流得到的复杂背景下的图象转换到YUV颜色空间中进行处理,这一步操作的意义在于这个颜色空间具有许多优秀的性质,为未来的算法处理提供了良好的基础。然后通过一个简单的贝叶斯分类器标记出图象中大概的手部区域,再通过一系列图象形态学的操作获得了一条连续的图象的边框曲线。获得了边框后,通过搜索边框获得该曲线的有序表达,再使用本文提出的“点曲度”和“中心角度”的计算方法得到手指的指尖位置。得到指尖位置对于解决本文的问题具有重要意义,因为人手势的许多意义都是通过指尖以及指尖的运动表达出来的。
在此基础上,本文实现了两个简单的系统,包括一个对视频中单一手指跟踪的系统和一个简单的人机对战“石头剪子布”的小游戏系统。虽然该算法体系还存在许多问题,但作为一种解决问题的新思路,无疑具有启发意义。并且可以认为本文算法具备了实现更多应用和取得更好效果的基础,以及具备未来改进的可能。