计算机视觉基础(7)——相机基础

前言

从这一节开始,我们来学习几何视觉。中层视觉包括相机模型、单目几何视觉、对极几何视觉和多目立体视觉等。在学习几何视觉最开始,我们先来学习一下相机模型,了解相机的基本原理,了解相机如何记录影像。

一、数字相机

1.1  基本工作原理

相机用于生成二维的图像,图像最小的单元被称为像素 (Pixel)

图像中的每个像素对应三维世界中的某个特定方向

相机度量某一时刻,每个像素的光照强度和颜色,并保存在图像中对应像素位置处。

换言之,像素值衡量了某一时刻,来自某一方向上的光照强度

1.2  基本组成元素

二、图像传感器

2.1  图像传感器简介

图像传感器是一种将光学影像转换成电子信号的设备。

感光元件由光敏单元阵列构成

常见的图像传感器有感光耦合器件(CCD)和互补式金属氧化物半导体有源像素传感器(CMOS )两种

彩色图像的生成采用RGB颜色模型:将红绿蓝三原色的色光以不同比例相加,以产生各种色彩光

彩色图像传感器按照对色彩的分辨方式可分为:

• 3CCD 传感器:通过双色棱镜分光,并采用3块独立的CCD传感器

拜尔(Bayer)传感器:一个像素点只对三原色光中的一种感光

Foveon X3 传感器:每一像素点都有三重传感器

2.2  3CCD传感器

2.3  拜尔传感器

三、快门

3.1  快门简介

通过调整快门速度 (Shutter Speed),控制光线照射感光元件的时间,即曝光时间 (Exposure Time)

更长的曝光时间更多的入射光图像亮度更亮

更长的曝光时间容易引起运动模糊 (长曝光摄影)

3.2  卷帘宽门

  •  采用逐行扫描的方式曝光
  • 同一行像素被同时记录,不同行像素曝光时间点不同
  • 当相机或物体发生快速移动时会引起畸变(Distortion) 

3.3  全局快门

所有像素在同一时间曝光

不会造成卷帘快门式的畸变,因而更适用于3D重构任务 (SLAM)

造价更昂贵

【参考链接】

详细图解,一眼就能看懂!卷帘快门(Rolling Shutter)与全局快门(Global Shutter)的区别-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/lz0499/article/details/102616773

四、图像的形成

4.1  成像原理

问:直接在物体前放置幕布,幕布上能否投射出物体的图像?

答:不会,幕布上每一点都会接收到来自不同方向光线的投射,因而投影的结果是十分模糊的。

那么如何解决呢?

  • 增加遮光板屏蔽掉多余的光线 (小孔成像)
  • 遮光板上通光的小孔就是光圈 (Aperture)
  • 最朴素的针孔相机模型

这就是我们日常生活中的小孔成像原理。

4.2  针孔相机

针孔相机假设通过对小孔是一个点,从物体的每个点发出的光线只有一条能通过小孔

针孔相机模型用于近似图像的形成过程

利用相似三角形原理分析

针孔相机模型:图像较锐化,由于光线较少,需要更多的曝光时间

扩大孔径:可以减少所需曝光时间,但图像变模糊

解决方法:用镜头(透镜)替换针孔

4.3  薄透镜相机

薄透镜相机模型是对针孔相机的近似。

理想情况下物点、像点、光心三点共线

光线与光心距离越远,误差越大

采用光圈,屏蔽距离光心较远的光心,控制误差

4.4  光圈与景深

【光圈】

光圈限制了光线与光心的最大距离,光圈就是小孔的孔径。

【景深】

景深指相机聚焦平面前后相对清晰的成像范围,描述在空间中,可以清楚成像的距离范围

【光圈和景深】

【参考网站】Depth of Field in Photography Explained: The Ultimate DOF Guide! (capturetheatlas.com)

4.5  针孔/薄透镜相机的假设

从同一物点发出的光线被聚焦于同一像点

所有的像点位于同一平面上

物点、光心与像点三点共线

因为以上假设条件在实际中并非总是满足的,这导致了不完美的成像结果。

五、像差

真实成像过程中3D场景到2D图像的投影关系与理想薄透镜相机模型中的投影关系的偏差,称

为像差。像差表现为图像的形变与失真,有多中具体的形式。主要形式如下:

畸变 (Distortion)

球面像差 (Spherical aberrations)

色相差 (Chromatic aberrations)

像散 (Astigmatism )

光晕 (Vignetting)

5.1  畸变

  • 直线投影 (rectilinear projection): 3D场景中的直线在2D投影中仍未直线
  • 畸变:与直线投影的偏差

5.2  球面像差

  • 由于透镜球面折射率变化不均造成平行于光轴的光线无法聚焦
  • 造成成像模糊

5.3  色相差

透镜折射率随光的波长而变化,同一物点发出的不同颜色光线无法聚焦于同一像点

5.4  像散

水平和竖直方向的焦点不同

5.5  光晕/暗角

  • 图像的外围部分的亮度或饱和度比中心区域低
  • 一个或多个透镜的实际尺寸造成的,后方的元件遮蔽了前方的
  • 然而,有时却因为需要创意风格而被刻意加入

六、常见的镜头种类

6.1  长焦镜头

  • 视野较窄
  • 透视变形最小
  • 3D空间中平行线在2D图像中保持平行

6.2  广角镜头

  • 视野较宽广 (70-120)
  • 有透视变形
  • 3D空间中的直线在2D图像大致是直线

6.3  鱼眼镜头

  • 视野极宽 (>130)
  • 3D空间中的直线在2D图像中几本不再是直线

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/145839.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【milkv】2、mpu6050驱动添加及测试

前言 本章介绍mpu6050的驱动添加以及测试。 其中驱动没有采用sdk提供的驱动,一方面需要配置irq,另一方面可以学习下如何通过ko方式添加驱动。 一、参考文章 驱动及测试文件编译流程: https://community.milkv.io/t/risc-v-milk-v-lsm6ds…

YOLOV5中parser参数配置

源码下载链接:ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite (github.com) 需要配置的参数:--data parser.add_argument(--data, ...):添加一个用于数据配置文件的路径的参数。 可以直接修改&am…

VBA技术资料MF82:替换文件夹中文件名中的字符

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。我的教程一共九套,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到…

『数据结构与算法』散列表(哈希表)

1. 什么是散列表 散列表(Hash Table)也叫哈希表,是根据给定关键字(Key)来计算出该关键字在表中存储地址的数据结构。也就是说,散列表建立了关键字与存储地址之间的一种直接映射关系,将关键字映…

[文件读取]shopxo 文件读取(CNVD-2021-15822)

1.1漏洞描述 漏洞编号CNVD-2021-15822漏洞类型文件读取漏洞等级⭐⭐漏洞环境VULFOCUS攻击方式 描述: ShopXO是一套开源的企业级开源电子商务系统。 ShopXO存在任意文件读取漏洞,攻击者可利用该漏洞获取敏感信息。 1.2漏洞等级 高危 1.3影响版本 ShopXO 1.4漏洞复现…

【C++】泛型编程 ① ( 函数模板 | 函数模板概念 | 函数模板意义 | 函数模板定义语法 | 函数模板调用语法 | 显式类型调用 | 自动类型推导 )

文章目录 一、函数模板简介1、函数模板概念2、函数模板意义 二、函数模板语法1、函数模板定义语法2、函数模板调用语法 三、函数模板代码示例1、代码示例2、执行结果 四、函数模板代码示例 - 声明多个泛型的情况1、代码示例2、执行结果 一、函数模板简介 1、函数模板概念 在 C …

63基于matlab的生物地理的优化器(BBO)被用作多层感知器(MLP)的训练器。

基于matlab的生物地理的优化器(BBO)被用作多层感知器(MLP)的训练器。粒子群优化(PSO)、蚁群优化(ACO)、遗传算法(GA)、进化策略(ES)和…

企业电子招投标采购系统源码之电子招投标的组成

功能模块: 待办消息,招标公告,中标公告,信息发布 描述: 全过程数字化采购管理,打造从供应商管理到采购招投标、采购合同、采购执行的全过程数字化管理。通供应商门户具备内外协同的能力,为外部供…

MySQL集群高可用架构之MHA

目录 一、概念: 1、MHA的工作流程: 2、MHA工作原理: 二、MHA实验: 一、概念: MHA:masterhight availabulity:基于主库的高可用环境下,实现主从复制以及故障切换 主从的架构&…

1688往微信小程序自营商城铺货商品采集API接口

一、背景介绍 随着移动互联网的快速发展,微信小程序作为一种新型的电商形态,正逐渐成为广大商家拓展销售渠道、提升品牌影响力的重要平台。然而,对于许多传统企业而言,如何将商品信息快速、准确地铺货到微信小程序自营商城是一个…

如何修复msvcr120.dll丢失问题,常用的5个解决方法分享

电脑在启动某个软件时,出现了一个错误提示,显示“msvcr120.dll丢失,无法启动软件”。这个错误通常意味着计算机上缺少了一个重要的动态链接库文件,即msvcr120.dll。 msvcr120.dll是什么 msvcr120.dll是Microsoft Visual C Redist…

文章发表 | 求臻医学发布精准肿瘤学临床试验预筛选平台

近日,求臻医学信息与人工智能团队研发的精准肿瘤学临床试验预筛选平台OncoCTMiner,在线发表于国际期刊Database: The Journal of Biological Databases and Curation (IF5.8)。OncoCTMiner集成自然语言处理(NLP)和大型语言模型&am…

Enfocus PitStop Pro 2022

Enfocus PitStop Pro是一款专为PDF编辑和优化而设计的软件,旨在帮助用户高效、准确地处理PDF文件。其功能包括但不限于: 全面的PDF编辑功能:包括添加、删除或重新排列页面,合并和分割PDF文件,以及调整页面大小和方向等…

Linux 函数库

函数库: 我们的C程序中,并没有定义“printf”的函数实现,且在预编译中包含的“stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实“printf”函数的呢? 最后的答案是:系统把这些函数实现都被做到名为 libc.so.6 的库文件中去…

人工智能基础_机器学习032_多项式回归升维_原理理解---人工智能工作笔记0072

现在开始我们来看多项式回归,首先理解多维 原来我们学习的使用线性回归,其实就是一条直线对吧,那个是一维的,我们之前学的全部都是一维的对吧,是一维的,然后是多远的,因为有多个x1,x2,x3,x4... 但是比如我们有一个数据集,是上面这种,的如果用一条直线很难拟合,那么 这个时候,…

美国受教育程度最高的五大城市

许多研究表明,高等教育水平对一个城市的经济发展可起到决定性的作用。美国最繁荣、经济最活跃的地区无一例外都是拥有本科和研究生学位居民的集中地。本篇知识人网小编就为大家介绍美国受教育程度最高的五大城市。 本文根据主页菌在“Stoooges三士渡”刊载的文章整理…

通过cpolar实现外网ssh远程连接linux

现在我有个想法,就是希望通过外网能够远程连接到我的开发板。这里我们就需要使用到一种技术,内网穿透。 内网穿透是一种将内部网络中的设备通过外网进行访问的技术。在linux系统中,实现内网穿透有多种方式,其中最常见的方法是使用…

Postman还能做Mock?又学了一招!

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…

A Gentle Introduction to Graph Neural Networks

A Gentle Introduction to Graph Neural Networks----《图神经网络入门》 图神经网络信息传递积累 图在我们身边随处可见,现实世界中的物体通常是根据它们与其他事物的联系来定义的。一组物体以及它们之间的联系可以很自然地用图来表示。十多年来,研究人…

AWS实战(一)-创建S3 存储桶

1)登录AWS账号,选择服务—>存储—>S3。 2)查看存储桶列表 3)点击"创建存储桶"创建bucket。 4)设置跨域 点击编辑,修改跨域设置即可。