射影几何中的单应变换 各种经典变换总结(2维平面上,三维空间中思想一致,但是自由度不同) 刚体(欧式)变换:可以保证两个点在变换前后欧式距离不变,具有3个自由度(旋转一个,平移两个); 通常是旋转加上平移; 相似变换:通常指相似刚体变换,指增加了缩放的刚体变换,具有4个自由度(刚体的3个再加上缩放尺度),相似变换具有保角性与保持距离比的性质; 通常可以描述为先旋转一次,再缩放一次,最后平移一次; 仿射变换:具 2019-01-27 #计算机视觉
RANSAC算法的理解与使用 随机抽样一致算法(random sample consensus, RANSAC),其实就是采用迭代的方法从一组包含离群的被观测数据中估算出数学模型的参数。(比如通过一群点拟合一条直线等) 基本假设 模型假设:事先知道真实数据满足的数学模型,不知道的只是模型的具体参数; 输入假设:输入数据中包含正确数据(即inliers,可以被假设模型描述的数据);同时也包含异常数据(即outliers,偏离正 2019-01-26 #计算机视觉 #机器学习
哈希表的原理与实现 哈希表(hash table,也叫散列表),是可以根据键(key)直接访问值(value)在内存中存储位置的一种数据结构。哈希表的核心是哈希函数(hash function),正是哈希函数完成了从key到value存储位置的映射。 在计算机科学中的应用 哈希算法在计算机科学中应用广泛。例如git的版本管理、IP协议中的checksum都有它的身影。 - 其中在git的版本管理中,文件内容是key, 2019-01-15 #算法与数据结构
理解对极几何与基本矩阵 对极几何是双视图之间内在的射影几何。它独立于景物结构,只依赖于摄像机的内参外参。 而基本矩阵是对对极几何的代数表示。 对极几何 如下图所示,对极几何通常用来解决双眼匹配搜索对应点的问题。 epipolar1 上图a中两个摄像机的中心分别是C与C',而X为一个三维空间点,它在两个摄像机的成像平面上的投影点分别是x与x'。我们常称: - 基线:两个摄像机光心的连线\(CC'\) - 对极 2019-01-13 #计算机视觉
理解齐次坐标 齐次坐标系(Homogeneous Coordinates)是计算机视觉与图形学中的一个重要的数学工具。 齐次坐标的引入 在欧式空间里,两条公面的平行线无法相交,但是在投影空间(Projective Space)里不是这样。一个直观的表示如下:两条轨道的间距随着视线变远而逐渐变小,直到在无限远处相交。 railway 在欧式空间里采用\((x, y, z)\)表示一个三维点,但是无穷远点\( 2019-01-11 #数学
相机成像的几何描述 相机成像,就是指通过摄像机将真实的三维空间中的点映射到成像平面(2维)上。这个过程可以通过一个几何模型来表示,本文使用最简单的针孔成像模型进行讲解。 针孔相机模型 如下图所示,是针孔相机的成像模型。 camera_needle 其中,O为相机的光心,也是针孔模型的针孔。现实世界的空间点P,在经过小孔O投影之后,落在了物理成像平面O'-x'-y'上,成像点是 P' ,假设P的相机坐标系坐标是\ 2019-01-10 #计算机视觉
矩阵的奇异值分解(SVD) 矩阵的本质可以是代表着一定维度空间上的线性变换。矩阵分解的本质是将原本m*n复杂的矩阵分解成对应的几个简单矩阵的乘积的形式。使得矩阵分析起来更加简单。 前面写过一篇博客讲的是矩阵的特征值分解,但是我们知道很多矩阵都是不能够进行特征值分解的。这种情况下,如果我们想通过矩阵分解的形式将原本比较复杂的矩阵问题分解成比较简单的矩阵相乘的形式,会对其进行奇异值分解。 简单回顾特征值分解 如果一个n*n矩阵A 2019-01-03 #数学
线性判别分析(LDA) 线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的有监督线性学习方法,最早在1936年由fisher在二分类问题上提出。这种方法主要用于分类与降维。此处需要说明的是,LDA常常还会是隐含狄利克雷分布(Latent Dirichlet Allocation)的简称,这是自然语言处理领域一种处理文档的主题模型,与本文讲的线性判别分析关系不大。 基本思想 L 2019-01-03 #机器学习
矩阵的特征值分解 特征值分解 物理意义: 1. 矩阵可以表示一种变换; 2. 特征向量表示矩阵变换的方向; 3. 特征值表示矩阵变换在对应特征向量方向上的变换速度; 特征值与特征向量 如下一个二维向量\(\vec{v_{}}\),这个二维空间的基向量是\(\vec{i_{}}\)与\(\vec{j_{}}\); p1 将向量\(\vec{v_{}}\)左乘一个矩阵\(\mathbf{A}\),情况变成如下: 2018-12-26 #数学
光流算法简述 光流(optical flow),字面意思描述的是图像中像素强度的流动。光流法的目的是根据图像中像素点的灰度值强度变化估计出物体移动速度与方向。 光流 光流的假设 首先,光流估计指的是利用时间上相邻的两帧图像内像素强度的变化来计算点的运动。原理决定了这种方法是建立在一系列假设上的。 前后两帧中点的位移不大 灰度不变假设,这要求外界光强保持恒定 空间相关性,每个点的运动和邻近的点类似 好像这么 2018-12-24 #计算机视觉