图形识别(Pattern recognition,或称模式识别),为透过计算机运算技术方法达到图形的自动判读之技术。影像在计算机中以数组的形式储存与运算,如三原色光模式(RGB),先将影像以不同色彩分层,以上述方法代表不同颜色后,再以相对位置分配颜色的强度数值。此外尚有印刷四分色模式(CMYK)、CIE 1931等色彩空间结构。模型识别将代表影像的数组进行数学算,利用机率、向量等特征模型,进行特征选取或萃取、分类器设计以及系统辨识率测试,使得信息系统得以自动化辨识输入影像中的信息,将目标信息主体与背景分离并转换成所需之内容,以利后续运算。
《图一》国际照明协会(CIE;INTERNATIONAL COMMISSION ON ILLUMINATION)所订定之色彩空间
来源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recogniTIon. OpTIcal Engineering 50, 077205. 。 Online publication date: 1-Jan-2011. [ CrossRef ]
《图二》 识别辨识战斗机机型样本
来源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. 。 Online publication date: 1-Jan-2011. [ CrossRef ]
随着信息科技的进步,信息处理过程日趋复杂,应用范畴也与日俱增,物联网(IOT;Internet of Things)时代的来临使得图像处理需求增加,含有影像摄取镜头的硬设备越来越多,并融入各种生产制造、商业行为甚至日常生活,不同应用的信息系统渐渐倚靠自动化影像辨识技术,完成各种新的应用。
当今常见的代表性技术如字符识别(OCR;Optical Character Recognition),将文字影像进行处理,抽取主要表达特征并将特征模型纪录,比对实际输入影像后,依逻辑与机率转换成字符串形式,供系统进行后续处理,如车牌辨识系统,将各种车辆的影像做为系统输入,以特征匹配辨识车牌字符后,即可进行如计费、安全控管、疑车追踪等应用。某些系统结合甚至机器学习等算法,透过训练,能自动修正模型提升准确率。拜计算机运算之速度快、准确性高、效率高特性之赐,此技术能逐步取代人工操作行为,目前常用于医疗判读、声纹辨识、车辆监控计费、个人安全等信息系统,应用范畴仍随着时间快速扩展中。
《图三》文字识别辨识标的不同角度的样本范例
来源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. 。 Online publication date: 1-Jan-2011. [ CrossRef ]
图形辨识的流程
图形辨识流程可以分为特征表现、特征萃取、分类器设计以及系统辨识率测试几个步骤。在特征表现步骤将数据之特征量化取出,再借助特征萃取找出较具分类效果的特征,限缩数据维度。再根据数据是否包含先前取得并选取之类别信息以与应用面考虑采用分群法或分类法来进行分类器设计,产生分类函数,最后依测试数据来验证该系统准确率,了解分类函数是否完善等个步骤之准确性,逐一优化。
图形辨识的相关技术
图形侦测(detection)技术,如线条侦测、脸部侦测等,侦测一个物体在一个图像中的表现,线条侦测即侦测影像中是否含有符合条件的直线;脸部侦测则欲在影像中侦测人脸。Hough Transform(霍式转换)为此技术之经典算法,将图形转换成特征空间,再由投票选取图形。图形辨识(recognition)则是要判断影像中物体所属条件,相对于侦测,以人脸为例,侦测的目的为标记出人脸位置,辨识则是能进一步的认出这是属于哪个人物的人脸。图形侦测主要钻研侦测速度以及对于噪声的敏感度,而辨识则讨论复杂环境中对应不同结果的方法。相较于图形侦测除定位与判断欲侦测的对象是否存在外,图形辨识因能判断出图形中存在对象的其他特性,应用更为多广。
至于辨识时的分类方法,多源自于机率上的理论,如贝氏定理(Bayes‘ theorem)、主成分分析(PCA;Principal component analysis)、线性识别分析(LDA;Latent Dirichlet allocation)、支持向量机(SVM;Support Vector Machine)、类神经网络Neural Network等,研究将辨识对象进行分类并优化。
结论
智能家居、数字安全监控、个人装置安全控管等议题一直是物联网的热门讨论内容,车牌辨识、街道影像系统、移动装置应用等热门技术亦需要成熟的影像辨识技术,任何需要针对图形中的对象(如用户、车辆、文件等)进行萃取的系统均能看到图形辨识的技术实作。因图形辨识可应用之领域相当广泛,在物联网发展的同时,图形辨识的技术仍同样在进步中,各种图形辨识算法均有擅长的辨识对象目标,优良的图形辨识算法须结合不同领域之知识,开发者熟悉辨识对象的各种外显特性,以及动态行为,并且不断设计修改算法内容,方能设计出最适宜的辨识与分类算法,提升准确率。对于跨领域之技术人才如医疗与信息;工业设计与信息;机械与信息等,同时具有辨识对象与辨识算法知识的人才,将能在这一波跃进中提供更多见解、崭露头角。