计算机视觉是什么 - Opencv中文网

计算机视觉（Computer Vision，CV）是人工智能（AI）的一个分支，旨在让计算机通过摄像头、图像或视频等视觉数据来感知、理解和分析周围的世界。它的目标是模拟人类视觉系统的能力，使计算机能够识别物体、理解场景、跟踪运动，甚至做出决策。

下面是有关计算机视觉的几个核心任务介绍

一、图像分类（Image Classification）

旨在识别图像中的物体属于哪一类别，比如动物、汽车。Google Photos就采用了这一技术对用户手机相册中的图片进行大致分类。在医学影像诊断中（如X光片）也经常用到。

二、目标检测（Object Detection）

旨在图像中找出所有目标的位置及其类别。比如在汽车自动驾驶过程中检测行人与车辆，或是安防监控画面中识别可疑物品或行人。

三、图像分割（Image Segmentation）

旨在对图像中的每个像素进行分类，如区分前景和背景。比较典型的工业应用是医学图像分析中的肿瘤分割，以及自动驾驶时对道路场景的理解。

四、目标跟踪（Object Tracking）

旨在视频中持续追踪某个目标的位置，比如在体育赛事中跟踪并分析运动员，或无人机跟踪目标。典型的应用场景就是目前俄乌战争中首次使用的无人机跟踪敌方。

五、3D重建（3D Reconstruction）

旨在从2D图像或视频中恢复3D结构。如现实增强（AR）技术、机器人导航、医学影像中对X片的2D转3D。

六、人脸识别（Face Recognition）

旨在识别或验证人脸身份。如手机人脸解锁，公共安全（寻找失踪人员），小区人脸识别。

所以，计算机视觉的应用领域是非常广泛的，特别是在自动驾驶、医疗影像、工业检测、安防监控、增强现实、农业及零售业。

与人类视觉相比，计算机视觉的数据形式主要是数字图像和视频，本质上就是像素矩阵，而人类视觉的数据形式是由视网膜成像的光学信号；在处理方式上，计算机视觉通过算法和数字计算可以高速地完成视觉处理过程，缺点是难以处理模糊或遮挡，人类视觉主要依靠大脑视觉皮层加经验理解和判断，优势是适应性强，理解复杂场景强，缺点是需要发工资，容易疲劳，且主观性强。

目前，市面上有许多与计算机视觉相关的产品（算法库），这些产品有的是免费开源的，有的是收费闭源的，下面通过表的形式展示这些算法库的市场份额名称和应用领域。

排名	算法库/框架	主要领域	市场份额
1	OpenCV	通用图像处理	70%+
2	PyTorch	深度学习研究	60%（学术）
3	TensorFlow	工业部署	40%（生产环境）
4	Halcon	工业视觉	30%（高端市场）
5	ITK/VTK	医学影像	50%（医学领域）
6	OpenMMLab	检测/分割	15%（亚洲增长快）

注：市场份额数据综合了GitHub活跃度、行业报告（如Grand View Research）及开发者调研（如Stack Overflow）。实际选择需结合具体需求（如实时性、精度、预算）。

——重庆教主 2025年5月6日

若文章对您有帮助，可以激励一下我哦，祝您平安幸福！

微信	支付宝