AI人工智能技术是通过怎样的方式实现人脸识别和图片识别的?

1

用通俗的话总的来说,就是利用大数据抽取规律,再利用规律去预测(回归)、分类、聚类未知的输入,得到输出(结果)。

单说图片识别:

这里面的大数据就是已知的输入(图片)和已知的结果(图片的标签),抽取规律也就是相应的算法(卷及神经网络),预测、分类、聚类就是得到图片的结果(图片识别)。

可以分为以下几步:

第一步:数据的预处理。

2

通过专用的算法。

简单来说,人脸或者是图像,在计算机看来都是一样的像素的组合而已。通过一套算法,识别出某个像素周围的像素种类,进行分类,判断等等操作,最终输出一个结果,这就是识别的大概流程。

而具体每个算法如何详细操作,如何优化,这就是各家厂商的商业秘密了。

3

人工智能技术中,人脸识别和图片识别,都是利用DCNN(深层卷积神经网络)提取图片特征,然后在图片特征上进行一定的操作。

特征提取

这里的特征,可以理解成通过一定的计算公式将三维矩阵存储的图片转换为一定纬度可以方便计算的矩阵(最简单例子,一个向量),其实,可以看做数据降维啦,图片那么大的分辨率,如果基于图片计算,太耗费计算量和存储量。

特征提取:图片>网络>一个向量



人脸识别:

人脸识别是一对一比对或者一对多比对,假设,你需要对person A进行人脸识别,那么前提,你的图片数据库里有A的图片,然后利用卷积神经网络,提取person A的图片的特征,将这个图片的特征和图片数据库中所有图片提取的特征进行比较,距离最相近的图片判定为同一个人,那么数据库中最相近的那个人对应的属性不就是我们想要得到的么?

人脸识别:提取图片特征;和数据库中图片特征进行比较;距离最近的判定为同一个人;识别人的属性



4

其实说白了就是通过大数据分析,图像识别。不过目前国内大部分图像识别技术是开源的。

5

问题中的人脸识别和图片识别都属于模式识别讨论的范畴,识别图像有两大步骤,第一是特征提取,第二是分类。

我们知道,图像是由数字组成的,可以把图像想象成一个矩阵,最简单的提取特征的方法是求这个矩阵的特征向量,相似的图片拥有相似的特征向量,假设利用二范数来做特征向量的相似性度量的过程就是分类,简单的说,特征提取出来了,然后对特征设置一个阈值(这个阈值可以是训练出来的也可以是经验值),在阈值范围之内就是正样本。

随着科技技术的不断进步,硬件的不断升级,特别是gpu对矩阵运算的提速,神经网络技术越来越多的运用到图像识别领域,现在我们讲的ai技术、深度学习,大部分指的是神经网络,它是一种仿生物学的数学理论,有许多神经元在其中传导,故名思义神经网络。网络是分多层次的(深层次的),来训练图像,故又叫深度学习。

神经网络作为一种图像识别方法如今被广泛运用到各个领域。但它离不开模式识别的两大步骤,特征提取和分类。只不过其特征是抽象的,神经网络的网络模型训练出来的数据与网络模型相结合就是分类器。

如果想要更多的理解图像识别还需要深入学习模式识别和机器学习相关内容,单凭这点手打内容远远不够。

6

图像识别是人工智能的一个重要的研究课题,同时也是其他比如自动驾驶,图片检索,信用贷款,安防安检等诸多应用的基础。

首先我们来看图像识别中的主要任务有哪些。面对一张图片,我们可能发出的几个基本问题:

  • 图片中是否包含某种物体
  • 图片中某种物体在什么位置
  • 图片中都有哪些物体
  • 图片属于什么场景,或者描述了怎样的场景

以上种种都是在图像识别中可能的研究问题和方向,当然随着科技的发展,更多复杂的、精细的图像识别方面的问题在诞生。


接下来我们以图像识别的发展进程引入,探究AI技术是怎样处理图像识别的问题,并逐步大放异彩的。

在视觉领域做图像识别,物体识别的研究已经有几十年历史,但是直到几年以前,有影响的图像识别产品并不多,一个是OCR,一个是指纹,一个是人脸检测。

7

《复仇者联盟: 终局之战》美国未开映已尽破预售纪录,单是全美预售金额估计达6亿美元,而中国的开售票房,也已超过10亿人民币,果然是未出发先兴奋。

《复仇者联盟: 终局之战》最终全球的票房将高达60亿美元,因此不少人以「十年」去形容漫威影业在《复仇者联盟: 终局之战》取得的成功。

漫威真的是十年才磨出一剑?

由2008年《钢铁侠》公映开始,连同上映的《复仇者联盟: 终局之战》,漫威合共出品了22部的漫威电影宇宙衍生片,不计《复仇者联盟: 终局之战》预售票房的金额,其余21部电影在全球合共取得超过183亿美元的票房。

由此可见,《复仇者联盟: 终局之战》只是漫威过去10年磨出的其中一把剑,因为漫威已在过去10年多,磨出了合共22把令不少电影人「眼红」的宝剑,同时每把宝剑平均价值超过8亿美元。

8

通过CNN网络。

目前进行人脸识别的主要方式还是卷积网络,虽然Hinton后来提出了胶囊网络,但是新的网络依然处于发展早期,还有很多需要完善的地方,相关的软件配置以及工具包也并不成熟,距离普及会用还有一段时间。

首先强调下人脸识别和图片识别没有本质上的区别,如果一定要说区别的话,人脸识别会通过捕捉面部特征点来进行三角构建,特征点是属于基本不随年龄发生变化的区域,这样而已基本排除由化妆、装扮以及年龄变化所带来的面部识别失效影响,但是整容的话另说。

至于CNN网络进行图片识别,首先是通过数次卷积以后,提取到图片的高维特征,这些特征在同类图片中会必然性的出现,并且具有组合特性,之后利用全连接网络可以对高维特征进行组合判别,不同的特征会指向不同的类别,不同的特征组合最终会给出不同的结论。

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章