当前位置:巨优公文网>范文大全 > 公文范文 > 计算机视觉在人工智能领域的应用和发展概述

计算机视觉在人工智能领域的应用和发展概述

时间:2022-12-13 21:30:02 公文范文 来源:网友投稿

摘 要 随着大数据时代的到来,人工智能技术已经广泛地应用到社会生活的各个方面。计算机视觉作为人工智能在工业界部署和实施中最重要的技术支撑,在近些年取得了广泛的研究和应用。计算机视觉旨在理解和提取图像刻画的全局纹理信息,将高维的、复杂的图像所蕴含的特征编码为低维的特征向量。本文将计算机视觉任务划分为三个层次:初级视觉任务、中级视觉任务和高级视觉任务,并且介绍了三种层次的视觉任务概况。

关键词 深度学习;神经网络;计算机视觉

引言

随着高性能硬件资源的发展,基于深度学习的卷积神经网络在图像分类领域取得了突破性的研究和进展。神经网络[1-2]通过使用大量的标记的数据学习输入样本和输出类别之间的映射关系。本文首先介绍了卷积神经网络的理论基础,然后分别阐述了各个层次视觉任务的研究和应用方向,最后对计算机视觉在人工智能领域的发展进行了展望 。

1 卷积神经网络

卷积神经网络属于监督学习的理论范畴,从人工神经网络逐渐发展和演变而来。神经网络通过模拟人的神经中枢信号的传播方式,若干个神经元的信息汇总到另一个神经元,只有当累积的信号达到一定程度时才会刺激信号向前传播。

2 视觉任务

根据视觉任务处理的对象不同,将其划分为三个层次的任务:初级视觉任务,中级视觉任务和高级视觉任务。初级视觉任务主要面向图像的局部纹理。中级视觉任务主要用于理解图像所刻画的全局语义信息。主要包含图像分类,图像分割,物体检测等。基于中级视觉任务,高级视觉任务旨在理解图像语义的基础上,进行智能决策任务。

2.1 初级视觉任务

初级视觉任务针对的对象是图像的局部纹理进行编码,例如图像超分辨率重建和圖像修复等工作,这些视觉任务主要针对图像的局部纹理进行操作,并不涉及图像所表述的全局语义信息的理解。

超分辨率重建是在将局部或者全局存在模糊的照片编码为分辨率较高的图像。基于深度学习的超分辨率重建首先使用数字图像方法得到相同图像的高分辨率和低分辨率图像,然后构建一个编码和解码模型,使用低分辨率图像作为输入,高分辨率图像作为输出学习两者之间的映射关系。然后在网络输出的结果和原有的高分辨率图像之间构建绝对值损失优化网络的参数。图像去雾是初级视觉领域较为重要的应用方向之一,其在交通领域有着广泛的应用前景。与之相类似的应用还有图像去雨,都是通过计算机视觉的方法减轻自然天气对视觉造成的影响。图像去雨和去雾的模型较为类似,都是对图像进行减法操作。区别是图像去雨针对图像的高频语义信号进行操作,而图像去雾更加关注图像的低频信号。

2.2 中级视觉任务

中级视觉任务在提取图像的局部纹理特征的基础上,需要理解图像所表述的全局语义信息,因此可以用于其他的视觉任务。除了图像分类任务,中级视觉任务还包括物体检测,图像分割等。物体检测目的是在检测出图像物体的位置,并且标注出对应方框中物体的类别信息。

传统的物体检测算法使用暴力搜索机制的方法,然后使用卷积网络抽取对应的图像特征判断当前区域是否存在物体,但是却没有真正发挥出神经网络的非线性拟合能力。基于此研究者们提出了基于区域系列的物体检测算法,使用候选框生成算法产生一些有可能包含物体的区域,然后使用卷积网络提取对应区域的特征判断是否包含物体。图像分割能够对图像中的每个像素赋予对应的类别信息,在自动驾驶领域有广泛的应用,因为在自动驾驶领域,计算机需要理解图像中每个像素区域的类别信息,然后在进行相应的智能控制。

2.3 高级视觉任务

高级视觉任务建立在理解图像语义的基础上,首先需要使用卷积网络抽取图像的全局语义信息,然后在使用强化学习框架部署智能决策任务。高级视觉任务主要包括视觉追踪,看图说话,图像问答等任务。视觉追踪在安全方位领域有着广泛的应用,视觉追踪首先需要使用物体检测算法识别出图像中物体的位置,然后在后续的视频中时刻的定位出第一个视频中的行人的位置。基于强化学习的视觉追踪算法使用智能的滑动窗口在图像中寻找下一时刻物体的位置,大幅度提升了视觉追踪的效率。看图说话是给定一副图像,将其编码为对应的文本描述。图像问答技术是给定一副图像和对应的问题,根据卷积网络抽取到的特征和对应的文本描述的问题回答对应的问题。

3 未来展望和总结

计算机视觉近几年在人工智能领域取得了突破性的研究和进展,基于深度学习的卷积神经网络已经成为人工智能领域各种算法任务的标配。初级视觉任务在人们的日常生活中有着广泛的应用,例如图像修复任务。中级视觉任务需要理解图像的全局语义信息,高级视觉任务建立在中级任务的基础上,未来在工业界有着广泛的应用前景,相信随着科学技术的发展,高级视觉任务能够进一步的智能化人们的日常生活。

参考文献

[1] 孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810.

[2] 余凯,贾磊,陈雨强,等.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804.

作者简介

王芳芳,专业:计算机技术,学历:硕士,现就职单位:山西工商学院计算机信息工程学院,研究方向:计算机视觉。

推荐访问:人工智能 概述 视觉 领域 计算机

版权所有:巨优公文网 2018-2024 未经授权禁止复制或建立镜像[巨优公文网]所有资源完全免费共享

Powered by 巨优公文网 © All Rights Reserved.。备案号:沪ICP备18054162号-1