人脸识别技术(人脸识别的基本原理)

/ 0评 / 0

人脸辨认技巧(人脸辨认的根本原理)

现在AI发展的如火如荼,我们已逐步进入智能时期。虽然人工智能偏技巧类,学习和懂得须要必定的技巧背景和数学做支持。但拆开看,其原理、办法、思路并不庞杂,「不懂技巧」的产品经理也能懂得。

人工智能牵扯很多学科,知识点盘根错节,须要具备多学科的知识储备。从学习路径上看,比拟合适做成系列,从浅入深,从基本到运用,逐渐深刻。但无形中进步了学习门槛,下降了学习的兴致,导致很难保持。

有感于此,我想以一种轻松、摸索的视角,跟大家一起探索,用简略、直白的方法来学习AI。这样,虽然会有毛病、遗漏等,但学习难度会下降,那就在进程中完美吧,究竟「隐约的准确大于准确的毛病」。

一、人脸辨认产品

我们从人脸辨认开端,逐步懂得其技巧路径的演化和原理等,今天先从最简略的原理讲起。

人脸辨认其实很早就有了,多年前就以人脸考勤的方法涌现,但由于应用后果不好,用户体验不佳,逐步被市场淘汰。

而这一波人工智能的火热,盘算才能、模型等都是其主要推进力,但更主要的是产品能够落地,能够在实际业务场景中应用。

尤其是人脸辨认,产品在辨认精度、速度、用户友爱度等多个方面都有显著晋升,用户和市场的接收度显著上升。

二、图像表现

懂得人脸辨认,先要从图像表现讲起。

大家都知道,盘算机能够辨认和处置的是二进制,不管我们输入的是文本、图像、声音,盘算机都是用必定长度的二进制串进行存储和处置。

我们先以黑白图片为例,看看盘算机是怎么表现的。

盘算机程序可以将黑白图片可以表现为灰度图像。在灰度图像中,一个像素应用8个比特位,从而可以表现256个灰度阶,表现规模是0-255。其中0代表纯黑色,255代表纯白色。

一个字节可以表现一个像素,那怎么表现一张图片呢,用矩阵进行表现。

简略来说,就是表格,比如可以应用8行8列来表现一张8*8百思特网的灰度图片。

这样我们就解决了图像的表现问题,树立了图像和矩阵的等价关系。图片可以转化为矩阵,通过矩阵也可以恢复原始图片。

大家能算出来下面的矩阵表现什么吗?

对的,一眼就看出来了数字1,看来大家都有搞AI的禀赋,加油。

三、图像辨认

通过矩阵表现图像后,图像的各种处置就转化为数学问题,可以应用数学的理论和办法进行解决,而这正是盘算机所善于的。

我们输入图片,愿望盘算机能够将内容辨认出来,将成果输出。

仍以数字为例,当输入图片并用矩阵表现后,通过将灰度值转化为灰度,可以轻松辨识其所表现的内容。

但在盘算机的世界里,只有0和1。想要通过辨识矩阵内容并将成果输出,就必需树立矩阵到成果的映射。这样,输入一张图片,经过处置和盘算后,能力输出一个数字。

很朴实的想法就是将各个数字所代表的矩阵提前寄存在盘算机内,当输入一张图片后,盘算机通过盘算,从而找到最合适的数字进行输出。

举个例子,更容易懂得一些。比如,盘算机内部已经寄存了包括数字1和7以及它们所对应的灰度矩阵。

数字1

数字7

当新输入一张图像后,程序会主动盘算它的矩阵与这些矩阵的类似度。类似度盘算可应用的公式很多,比如可以应用百分比,距离等。

简略起见,就应用两个矩阵对应元素之差的绝对值之和或者平方和等,盘算机进行迅速运算,找到最类似的矩阵,然后将其所代表的数字进行输出。

当输入以下内容时,经过简略盘算,可以知道输出成果为 7。

四、人脸表现

既然可以用矩阵来表现图片,人脸也是照片,那么也可以用同样的办法来进行表现,下面的这张人脸可以表现为:

人脸照片

矩阵表现

五、人脸辨认

虽然被百思特网叫做人脸辨认,但更精确的名字应当是「人脸比对」。人脸辨认的背后,是一张待比对图片和人脸底库中的所有照片进行比对,从而判别图片中人员的身份。

一般来说,待比对比片就是我们在日常生涯中被各种装备所采集的照片,比如通过人脸辨认考勤机抓拍的照片。

由于环境、姿态等原因,采集的照片具有很大的差别,导致比对胜利率不高。为了晋升比对的胜利率和速度,很多时候会同时抓拍多张人脸进行辨认,但每次比对的时候输入照片只有一张。

所谓的人脸底库就是我们在体系中提前录入的人脸照片,照片和我们的名字一一对应。依据人脸底库中照片数目的不同,可以将人脸比对分为1:1和1:N,由于数目不同这两种办法的盘算量和盘算办法也不尽雷同。

1. 1:1

1:1最常见的场景就是人证比对,比如我们在乘高铁时所遇到的这种装备。

前面的1代表我们从装备中采集的照片,而后面的1代表身份证中的照片,通过将现场采集的照片和身份证中寄存的照片进行比对,通过判别持证人是否为本人。

这种情形下只涉及到两张图片的比对,盘算量相对较小。

可能用在火车票安检等场景中,所以百思特网请求的精度较高。

身份证中的照片像素较小,通过市面上的身份证读卡器读取出来的照片仅为100*100像素左右,给精度带来了必定的挑衅。

目前这个范畴相对成熟,应用场景正在逐步铺开。

2. 1:N

1:N是1张人脸和底库中的N张人脸进行比对。

比如在考勤机中,我们的人脸底库中包括全公司的所有人脸照片。当上班打卡时,考勤机采集到人脸输入体系,经过比对后输出员工身份。

这种情形下盘算量相对较大,时效性和辨认精度太低又会影响用户体验,所以厂商一般会综合斟酌衡量,在装备的参数中标注所支撑的人脸数目。

这一波人工智能的发展,带动了1:N范畴人脸辨认技巧的提高,更多的产品能够在各个场景中落地。比如智慧城市、智慧家居等。

国内厂商也借着这一波东风,加快技巧研发和产品落地,出生了有名的AI视觉四小龙等独角兽。

今天梳理了人脸辨认的根本原理,全部实现进程虽然看起来很简略,但技巧却在根本原理的基本上连续完美和提高,最终到达比拟好的后果。