这两年人工智能一直非常的火,已经上市的公司寒武纪、科大讯飞,快要上市的云从、旷视,正在排队上市的思必驰,准备赴港上市的商汤,以及这两年在资本市场上非常火的地平线、燧原、爱芯元智都在人工智能领域中勇闯自己的市场。
人工智能是做什么的呢?其实目前人工智能主要还是以机器视觉为主。之前的机器视觉主要是做一些人脸识别、虹膜识别、车辆检测等功能,那事实上,这些功能都可以简单的分成以下几个方向: 图像分类:Image Classification 目标检测:Object Detection 语义分割:Semantic Segmentation 实例分割:Instance Segmentation 目标跟踪:Object Tracking一、图像分类图像分类主要是将图像中的物体类别判断出来。一般来讲,图像分类不需要给出物体所在位置,也不需要判断所含物体的数量。如下面几张BigGAN自动生成的图像,图像分类只需要告知是狗,山水,蝴蝶和面包即可。二、目标检测若需要精确定位出某一物体所在的位置,则需要用目标检测算法。通过目标检测,可以准确的从下图中,找到猫脸的位置。三、语义分割语义分割主要是对图像中所有像素点进行分类,并将同类别的像素点打上相同的标签。下图中左图将人进行了分割。右图则是将街景进行分割,对图像中的车,灯杆,树木等分别采用了不同颜色进行进行标注。四、实例分割语义分割会为图像中的每个像素分配一个类别,但是同一类别之间的对象不会区分。而实例分割,只对特定的物体进行分类。这看起来与目标检测相似,不同的是目标检测输出目标的边界框和类别,实例分割输出的是目标的Mask和类别。五、目标跟踪目标跟踪,是指在特定场景跟踪某一个或多个特定感兴趣对象的过程。这个过程基本分三步:找到目标物体,对目标物体进行实例分割,在后续帧中找到目标物体,实现相应的目标跟踪。这个具体过程,从下图中博尔特参加男子百米短跑的例子,就很容易理解。那既然人工智能,能做这么多事,人工智能在手机上都能有哪些应用呢?人脸识别自从2017年,iPhone X支持人脸识别后,人脸识别技术在手机上开始蓬勃发展。本文不在这讨论人脸识别的安全性,也不在这讨论Apple采用的结构光技术,仅仅是说明一下人脸识别基本是什么样的一个识别流程: A. 传感器先将图像给到处理单元 B. 先通过目标检测,找到脸 C. 进行人脸对齐,找到五官位置 D. 人脸校准和相速度度量,做判断和决策相册分类这个基本就是通过图像分类,就可以实现的。对用户有一定帮助,但是目测作用并不大。语音唤醒,AI 音频降噪,语音识别小米的小爱同学,Apple的Siri 都是这方面的楷模,很受用户的欢迎。 本文主要偏视觉方面,语音相关的就不多介绍了。图像分割这个双摄是能做到一定的效果,但若通过人工智能的图像分割,可以将需要目标物体更完美的与周边物体分割出来。通过图像分割,可以实现背景虚化,更换背景等功能。美颜+虚拟化妆这个基本是在人脸识别基础上,增加的功能。通过目标检测定位,找到人脸的关键点,再在这些关键点上,进行美颜或虚拟化妆。文字OCR文字OCR 较早的应用就是名片识别。不过现在这个功能越来越广泛,比如对笔记进行文字OCR,对pdf文件OCR之类的。这两年,人工智能对OCR的关注非常大,相关的算法也进行了非常大的演进,相关的识别准确率也是越来越高。除了上述几种人工智能的应用外,这两年也陆续开始其他方向的应用AI HDR宽动态最主要是为了解决拍照中,同时有亮度过高和亮度过低的部分,通过HDR技术,使得整体亮度均衡。最简单的场景就是黑人和白人同时拍照。若整体亮度拉高,黑人清楚,但白人就过曝了;但若整体亮度拉低,白人清楚,黑人则看不清了。通过AI HDR,可以做到比传统HDR 更好的效果,并且有机会通过一些算法,对运动物体进行保护,避免因为HDR的多帧合成,运动物体产生拖影问题文章来源:《新型工业化》 网址: http://www.xxgyhzz.cn/zonghexinwen/2022/1221/1526.html
上一篇:新型工业化论文大全(工业化学论文)
下一篇:没有了
新型工业化投稿 | 新型工业化编辑部| 新型工业化版面费 | 新型工业化论文发表 | 新型工业化最新目录
Copyright © 2021 《新型工业化》杂志社 版权所有 Power by DedeCms
投稿电话: 投稿邮箱: