【计算机视觉】二、图像形成:1、向量和矩阵的基本运算:线性变换与齐次坐标

文章目录

  • 一、向量和矩阵的基本运算
    • 1、简单变换
      • 1. 平移变换
      • 2. 缩放变换
      • 3. 旋转变换
      • 4. 一般线性变换
    • 2、齐次坐标
      • 0. 齐次坐标表示
      • 1. 2D点的齐次坐标变换
      • 2. 投影空间 ( x , y , w ) (x, y, w) (x,y,w)
      • 3. 2D直线的齐次坐标表示
        • a. 直线的参数方程表示
        • b. 直线的法向量和原点距离表示
      • 4. 叉积算子
      • 5. 平行线可以相交

一、向量和矩阵的基本运算

1、简单变换

x = [ x y ] \boldsymbol{x} =\begin{bmatrix}x\\y\end{bmatrix} x=[xy]

1. 平移变换

[ x ′ y ′ ] = [ x y ] + [ a b ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}x\\y\end{bmatrix} + \begin{bmatrix}a\\b\end{bmatrix} [xy]=[xy]+[ab]
  将向量 [ a b ] \begin{bmatrix}a\\b\end{bmatrix} [ab]加到 [ x y ] \begin{bmatrix}x\\y\end{bmatrix} [xy]上,得到平移后的新向量 [ x ′ y ′ ] = [ x + a y + b ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}x+a\\y+b\end{bmatrix} [xy]=[x+ay+b]。其中 a a a b b b分别为x方向和y方向的平移量

2. 缩放变换

[ x ′ y ′ ] = [ s x 0 0 s y ] [ x y ] = [ s x x s y y ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}s_x & 0\\0 & s_y\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix} = \begin{bmatrix}s_xx\\s_yy\end{bmatrix} [xy]=[sx00sy][xy]=[sxxsyy]
  通过缩放矩阵 [ s x 0 0 s y ] \begin{bmatrix}s_x & 0\\0 & s_y\end{bmatrix} [sx00sy]乘以 [ x y ] \begin{bmatrix}x\\y\end{bmatrix} [xy],可以得到缩放后的向量 [ x ′ y ′ ] = [ s x x s y y ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}s_xx\\s_yy\end{bmatrix} [xy]=[sxxsyy]。其中 s x s_x sx s y s_y sy分别为x方向和y方向的缩放比例

3. 旋转变换

[ x ′ y ′ ] = [ cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ] [ x y ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix} [xy]=[cosθsinθsinθcosθ][xy]
  通过旋转矩阵 [ cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ] \begin{bmatrix}\cos\theta & -\sin\theta\\\sin\theta & \cos\theta\end{bmatrix} [cosθsinθsinθcosθ]乘以 [ x y ] \begin{bmatrix}x\\y\end{bmatrix} [xy],可以得到绕原点逆时针旋转 θ \theta θ角度后的向量 [ x ′ y ′ ] \begin{bmatrix}x'\\y'\end{bmatrix} [xy]

4. 一般线性变换

[ x ′ y ′ ] = [ a b c d ] [ x y ] = [ a x + b y c x + d y ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}a & b\\c & d\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix} = \begin{bmatrix}ax+by\\cx+dy\end{bmatrix} [xy]=[acbd][xy]=[ax+bycx+dy]
  通过一个2x2变换矩阵 [ a b c d ] \begin{bmatrix}a & b\\c & d\end{bmatrix} [acbd]乘以 [ x y ] \begin{bmatrix}x\\y\end{bmatrix} [xy],可以得到一个新的变换后向量 [ x ′ y ′ ] = [ a x + b y c x + d y ] \begin{bmatrix}x'\\y'\end{bmatrix} = \begin{bmatrix}ax+by\\cx+dy\end{bmatrix} [xy]=[ax+bycx+dy],这个变换矩阵可以表示缩放、旋转、错切等线性变换的组合

2、齐次坐标

0. 齐次坐标表示

  在使用齐次坐标表示时,我们将n维欧几里得空间中的点 ( x 1 , x 2 , … , x n ) (x_1, x_2, \dots, x_n) (x1,x2,,xn)表示为 ( n + 1 ) (n+1) (n+1)维的齐次坐标形式 ( x 1 , x 2 , … , x n , 1 ) (x_1, x_2, \dots, x_n, 1) (x1,x2,,xn,1),在原始坐标的基础上添加一个1作为最后一个分量。

  • 将2D点用齐次坐标 [ x y 1 ] \begin{bmatrix}x\\y\\1\end{bmatrix} xy1表示,即在笛卡尔坐标 [ x y ] \begin{bmatrix}x\\y\end{bmatrix} [xy]的基础上添加一个1作为最后一个分量;
  • 将3D点用齐次坐标 [ x y z 1 ] \begin{bmatrix}x\\y\\z\\1\end{bmatrix} xyz1表示,即在笛卡尔坐标 [ x y z ] \begin{bmatrix}x\\y\\z\end{bmatrix} xyz的基础上添加一个1作为最后一个分量。

1. 2D点的齐次坐标变换

  • 变换矩阵:
    [ a b c d e f 0 0 1 ] \begin{bmatrix}a & b & c\\d & e & f\\0 & 0 & 1\end{bmatrix} ad0be0cf1

  • 变换结果
    [ x ′ y ′ 1 ] = [ a b c d e f 0 0 1 ] [ x y 1 ] = [ a x + b y + c d x + e y + f 1 ] \begin{bmatrix}x'\\y'\\1\end{bmatrix} = \begin{bmatrix}a & b & c\\d & e & f\\0 & 0 & 1\end{bmatrix}\begin{bmatrix}x\\y\\1\end{bmatrix}=\begin{bmatrix}ax+by+c\\dx+ey+f\\1\end{bmatrix} xy1=ad0be0cf1xy1=ax+by+cdx+ey+f1

该变换矩阵包含了三个部分:

  • 平移分量 [ c f ] \begin{bmatrix}c\\f\end{bmatrix} [cf]
  • 旋转分量( [ a b d e ] \begin{bmatrix}a & b\\d & e\end{bmatrix} [adbe]构成的2x2子矩阵)
  • 缩放分量(a, b, d, e的大小)
    • 当这些元素的值大于1时,会放大相应方向的坐标;小于1时,会缩小。

2. 投影空间 ( x , y , w ) (x, y, w) (x,y,w)

  引入一个三维投影空间,由 x x x y y y w w w三个坐标构成,用 [ x y w ] \begin{bmatrix}x\\y\\w\end{bmatrix} xyw表示。
其中 w = 0 w=0 w=0表示无穷远的点,即所有投影线的汇聚点所在位置。
在这里插入图片描述

  • 左图展示了透视投影(Perspective projection)的情况,所有投影线从场景中的点汇聚于一个无穷远点,这种投影方式可以提供深度信息和真实的景深感。
    • 透视投影可以提供更真实的视觉效果,表达式为:

[ x ′ y ′ w ′ ] = [ a b c d e f g h i ] [ x y w ] \begin{bmatrix}x'\\y'\\w'\end{bmatrix} = \begin{bmatrix}a&b&c\\d&e&f\\g&h&i\end{bmatrix}\begin{bmatrix}x\\y\\w\end{bmatrix} xyw=adgbehcfixyw

  • 右图展示了正交投影(Orthographic projection)的情况,投影线都是平行的,没有汇聚点,无法获得真实的景深感,但可以保持投影后物体的形状不变形。
    • 正交投影常用于工程制图等需要保持形状的场合,表达式为:
      [ x ′ y ′ w ′ ] = [ a b 0 c d 0 0 0 1 ] [ x y w ] \begin{bmatrix}x'\\y'\\w'\end{bmatrix} = \begin{bmatrix}a&b&0\\c&d&0\\0&0&1\end{bmatrix}\begin{bmatrix}x\\y\\w\end{bmatrix} xyw=ac0bd0001xyw

  这种投影空间和投影变换在计算机图形学中被广泛使用,用于将三维物体投影到二维平面上进行显示。

3. 2D直线的齐次坐标表示

a. 直线的参数方程表示

l = ( a , b , c ) x ⋅ l = a x + b y + c = 0 l = (a, b, c)\\x\cdot l = ax + by + c = 0 l=(a,b,c)xl=ax+by+c=0其中 ( a , b , c ) (a, b, c) (a,b,c)是直线的系数,任意一点 ( x , y ) (x, y) (x,y)代入方程,结果为0,则该点位于该直线上。

b. 直线的法向量和原点距离表示

在这里插入图片描述

l = ( n x , n y , d ) = ( n ⃗ , d ) with  ∥ n ⃗ ∥ = 1 l = (n_x, n_y, d) = (\vec{n}, d) \quad \text{with} \ \|\vec{n}\| = 1 l=(nx,ny,d)=(n ,d)with n =1其中 n ⃗ = ( n x , n y ) = ( cos ⁡ θ , sin ⁡ θ ) \vec{n} = (n_x, n_y) = (\cos\theta, \sin\theta) n =(nx,ny)=(cosθ,sinθ)表示直线的法向量,即垂直于直线方向的单位向量, d d d表示直线到原点的有符号距离。

这种表示直观地描述了直线的性质:

  • n ⃗ \vec{n} n 给出了直线的方向
  • d d d给出了直线到原点的距离,取正负号表示直线在原点的两侧

法向量和原点距离表示对于直线的各种几何运算都很有用,例如求直线交点、判断点和直线的位置关系等。通过矩阵变换,可以很自然地对直线进行旋转、平移等操作。

4. 叉积算子

  1. 两条直线的表示:
    给定两条直线 l ~ 1 \tilde{l}_1 l~1 l ~ 2 \tilde{l}_2 l~2的齐次坐标表示。
  2. 交点的计算:
    两条直线 l ~ 1 \tilde{l}_1 l~1 l ~ 2 \tilde{l}_2 l~2的交点 x ~ \tilde{x} x~可以通过它们的外积(叉积)求得:
    x ~ = l ~ 1 × l ~ 2 \tilde{x} = \tilde{l}_1 \times \tilde{l}_2 x~=l~1×l~2
    其中,外积的计算方式为:
    l ~ 1 = ( x ~ 1 , y ~ 1 , a ~ 1 ) \tilde{l}_1 = (\tilde{x}_1, \tilde{y}_1, \tilde{a}_1) l~1=(x~1,y~1,a~1) l ~ 2 = ( x ~ 2 , y ~ 2 , a ~ 2 ) \tilde{l}_2 = (\tilde{x}_2, \tilde{y}_2, \tilde{a}_2) l~2=(x~2,y~2,a~2) x ~ = l ~ 1 × l ~ 2 = \tilde{x} = \tilde{l}_1 \times \tilde{l}_2 = x~=l~1×l~2=

这种利用直线的齐次坐标表示求交点的方法,可以自然地推广到三维空间,求两条三维直线或平面的交点。同理,在三维情况下,交点坐标为两个直线或平面的齐次坐标外积。

5. 平行线可以相交

  • 两条直线在非齐次坐标系下的方程组表示:
    { A x + B y + C = 0 A x + B y + D = 0 \begin{cases} Ax + By + C = 0\\ Ax + By + D = 0 \end{cases} {Ax+By+C=0Ax+By+D=0
  • 将这两条直线方程转换为齐次坐标表示:
    { A x w + B y w + C = 0 A x w + B y w + D = 0    ⟺    { A x + B y + C w = 0 A x + B y + D w = 0 \begin{cases} A \dfrac{x}{w} + B \dfrac{y}{w} + C = 0\\ A \dfrac{x}{w} + B \dfrac{y}{w} + D = 0 \end{cases} \quad\iff\quad \begin{cases} Ax + By + Cw = 0\\ Ax + By + Dw = 0 \end{cases} Awx+Bwy+C=0Awx+Bwy+D=0{Ax+By+Cw=0Ax+By+Dw=0

在这种表示下,两条直线的齐次坐标分别为 ( A , B , C ) (A, B, C) (A,B,C) ( A , B , D ) (A, B, D) (A,B,D)

  • 通过分析可以发现,当 w = 0 w=0 w=0时,对应的是无穷远点,两条直线在这个点处相交

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/457425.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Maven3.6.3安装与配置,IDEA2022.2.3部署Maven操作步骤

1、先确保安装了Java开发环境,并配置了JAVA_HOME环境变量 WinR ,输入cmd,然后输入命令echo %JAVA_HOME%,查看JDK ,接着输入java -version,查看java的版本号 接着系统变量中,配置JAVA_HOME环境变量 2、官网下载MAVEN3.6.3,Maven3.…

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 相关链接:arxiv 关键字:Questioning LLaMA、GPT-3.5/4、guiding principles、prompting、large language models 摘要 本文介绍了26个旨在简化查询和提示大型语言模型&…

15.7k stars一个实用型OCR,支持80多种语言

一个实用型 OCR,支持 80 多种语言和所有流行的书写脚本,包括:拉丁文、中文、阿拉伯文、梵文、西里尔文等。 特点 支持本地或云/API部署 准确度提高到 99% 以上 完全可定制,支持 80 多种语言 支持表格识别 二维码/条码提取识别 GitHub数据 15.7k s…

边缘计算全面概述

什么是边缘计算? 边缘计算是一种分布式计算概念,将智能集成到边缘设备(边缘节点)中,使数据能够在数据采集源附近实时处理和分析。由于边缘计算在网络边缘本地处理数据,而不是在云端或集中式数据中心&#…

针对教育行业的网络安全方案有哪些

智慧校园”是教育信息化进入高级阶段的表现形式,比“数字校园”更先进。集体知识共融、共生、业务应用融合创新、移动互联网物联网高速泛在是其重要特征。特别是在互联网教育的大环境下,为了更好的发挥智慧化教学服务和智慧化教学管理功能,需…

Kafka模拟器产生数据仿真-集成StructuredStreaming做到”毫秒“级实时响应StreamData落地到mysql

这是仿真过程某图: 仿真实战kafka kafka消费sink端和StructuredStreaming集成通信成功 , 数据接收全部接收 数据落地情况: 全部接收到并all存入mysql 下面就简单分享一下StructuredStreaming代码吧 import org.apache.spark.sql.function…

SpringMVC请求、响应和拦截器的使用

SpringMVC请求 RequestMapping注解 RequestMapping注解的作用是建立请求URL和处理方法之间的对应关系 RequestMapping注解可以作用在方法和类上 1. 作用在类上:第一级的访问目录 2. 作用在方法上:第二级的访问目录 3. 细节:路径可以不编写…

Gitee 服务器

Git 服务器集成 1. 创建仓库 2. 远程仓库简易操作指令 # Git 全局设置,修改成自己的信息 git config --global user.name "Muko" git config --global user.email "txk0x7d2163.com" # 创建 git 仓库,基本操作指令和其他远程仓库一…

【STL】set容器、pair队组与map容器

目录 1.修改set容器排序规则 2. set容器的各种函数 3.set构造函数multiset 4.创建pair队组 5.map容器 1.修改set容器排序规则 set容器会自动以升序的方式进行排序&#xff0c;想要改变可以制定排序规则&#xff0c;set<int,排序规则> s&#xff1b; 但需要注意&am…

Mybatis(搭建,CRUD,方法参数,XML映射文件,动态SQL)【详解】

目录 一.准备基础代码 Mybatis的通用配置 二. 基本CURD操作 1.查询-根据id查询一条 2.查询-查询数量 3.删除 4.新增 获取主键值 5.修改 6.查询-模糊查询 预编译SQL #{}与${}的区别【面试题】 三. Mybatis的方法参数与结果集 1.SQL里取方法参数的值 2.查询结果集…

mac解决brew install报错“fatal: not in a git directory“

在macbook上使用brew安装软件时&#xff0c;可能会遇到问题&#xff0c;报错如下&#xff1a; fatal: not in a git directory Error: Command failed with exit 128: git 使用brew -v&#xff0c;仔细看&#xff0c;可以发现有两个fatal(致命错误)提示: 解决方案&#xff1a;…

下载chromedrive,使用自动化

1、先看一下自己浏览器的版本 2、访问 https://googlechromelabs.github.io/chrome-for-testing/

Nginx、LVS、HAProxy工作原理和负载均衡架构

当前大多数的互联网系统都使用了服务器集群技术&#xff0c;集群是将相同服务部署在多台服务器上构成一个集群整体对外提供服务&#xff0c;这些集群可以是 Web 应用服务器集群&#xff0c;也可以是数据库服务器集群&#xff0c;还可以是分布式缓存服务器集群等等。 在实际应用…

ChatGPT提问技巧——对抗性提示

ChatGPT提问技巧——对抗性提示 对抗性提示是一种允许模型生成能够抵御某些类型的攻击或偏差的文本的技术。这种技术可用于训练更健壮、更能抵御某些类型的攻击或偏差的模型。 要在 ChatGPT 中使用对抗性提示&#xff0c;应为模型提供一个提示&#xff0c;该提示的设计应使模…

微信小程序之tabBar

1、tabBar 如果小程序是一个多 tab 应用&#xff08;客户端窗口的底部或顶部有 tab 栏可以切换页面&#xff09;&#xff0c;可以通过 tabBar 配置项指定 tab 栏的表现&#xff0c;以及 tab 切换时显示的对应页面。 属性类型必填默认值描述colorHexColor是tab 上的文字默认颜色…

Web框架开发-Django的视图层

一、视图函数 一个视图函数,简称视图,是一个简单的Python 函数,它接受Web请求并且返回Web响应。响应可以是一张网页的HTML内容,一个重定向,一个404错误,一个XML文档,或者一张图片. . . 是任何东西都可以。无论视图本身包含什么逻辑,都要返回响应。代码写在哪里也无所谓…

【QT】TCP简易聊天框

我们首先复习一下TCP通信的流程 基于linuxTCP客户端和服务器 QT下的TCP处理流程 服务器先启动&#xff08;处于监听状态&#xff09; 各函数的意义和使用 QTcpServer Class *QTcpServer*类提供了一个基于TCP的服务器。这个类可以接受传入的TCP连接。您可以指定端口或让QTcpS…

解决无法登录到 ArcGIS Server Administrator

目录 问题复现原因分析解决办法 问题复现 今天在访问arcgisserver后台准备设置arcgis api for js请求路径时&#xff0c;登录之后出现500错误。Services Directoryhttp://xxx.xxx.xxx.xxx:6080/arcgis/admin/system/handlers/rest/servicesdirectory 原因分析 我实在两台虚拟机…

信号与系统学习笔记——信号的分类

目录 一、确定与随机 二、连续与离散 三、周期与非周期 判断是否为周期函数 离散信号的周期 结论 四、能量与功率 定义 结论 五、因果与反因果 六、阶跃函数 定义 性质 七、冲激函数 定义 重要关系 作用 一、确定与随机 确定信号&#xff1a;可以确定时间函数…

提升运营效率,探索运营中台架构的力量

随着数字化转型的加速推进&#xff0c;企业需要更高效地管理和运营各项业务&#xff0c;而运营中台架构作为一种新型的业务架构设计理念&#xff0c;正在逐渐受到关注和应用。本篇博客将深入探讨运营中台架构的概念、优势和实践&#xff0c;帮助企业了解如何通过构建运营中台实…