相机内外参矩阵:从3D世界坐标到2D像素坐标变换
介绍
相机参数矩阵描述了三维世界到二维图像的投影关系,分为内参矩阵(Intrinsic Matrix)和外参矩阵(Extrinsic Matrix)。以下是详细解释和坐标变换公式:
1. 内参矩阵(Intrinsic Matrix, K)
作用:将相机坐标系下的3D点投影到图像像素坐标系(2D),描述相机自身的几何和光学特性。
公式:
K
=
[
f
x
s
u
0
0
f
y
v
0
0
0
1
]
K = \begin{bmatrix} f_x & s & u_0 \\ 0 & f_y & v_0 \\ 0 & 0 & 1 \end{bmatrix}
K=
fx00sfy0u0v01
参数含义:
- (f_x, f_y):焦距(单位为像素),分别表示x和y方向的缩放因子(受传感器尺寸和镜头焦距影响)。
- (u_0, v_0):主点坐标(Principal Point),即光轴与图像平面的交点(通常接近图像中心)。
- (s):轴倾斜参数(Skew),描述图像坐标轴的倾斜程度(现代相机通常为0)。
2. 外参矩阵(Extrinsic Matrix, [R|t])
作用:将世界坐标系下的3D点变换到相机坐标系,描述相机在空间中的位置和姿态(旋转+平移)。
公式:
外参
=
[
R
∣
t
]
=
[
r
11
r
12
r
13
t
x
r
21
r
22
r
23
t
y
r
31
r
32
r
33
t
z
]
\text{外参} = [R \mid t] = \begin{bmatrix} r_{11} & r_{12} & r_{13} & t_x \\ r_{21} & r_{22} & r_{23} & t_y \\ r_{31} & r_{32} & r_{33} & t_z \end{bmatrix}
外参=[R∣t]=
r11r21r31r12r22r32r13r23r33txtytz
参数含义:
- (R):3×3旋转矩阵(正交矩阵),表示相机相对于世界坐标系的朝向。
- (t):3×1平移向量,表示相机光心在世界坐标系中的位置。
3. 完整投影过程(世界坐标 → 像素坐标)
设一个3D点在世界坐标系中的齐次坐标为 P w = [ X w , Y w , Z w , 1 ] T P_w = [X_w, Y_w, Z_w, 1]^T Pw=[Xw,Yw,Zw,1]T,其投影到像素坐标 p = [ u , v , 1 ] T p = [u, v, 1]^T p=[u,v,1]T 的流程如下:
步骤1:世界坐标 → 相机坐标(外参变换)
[ X c Y c Z c 1 ] = [ R t 0 1 ] [ X w Y w Z w 1 ] 或 P c = R ⋅ P w + t \begin{bmatrix} X_c \\ Y_c \\ Z_c \\ 1 \end{bmatrix} = \begin{bmatrix} R & t \\ 0 & 1 \end{bmatrix} \begin{bmatrix} X_w \\ Y_w \\ Z_w \\ 1 \end{bmatrix} \quad \text{或} \quad P_c = R \cdot P_w + t XcYcZc1 =[R0t1] XwYwZw1 或Pc=R⋅Pw+t
步骤2:相机坐标 → 归一化图像坐标(透视投影)
[ x y 1 ] = 1 Z c [ X c Y c Z c ] ⇒ { x = X c / Z c y = Y c / Z c \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = \frac{1}{Z_c} \begin{bmatrix} X_c \\ Y_c \\ Z_c \end{bmatrix} \quad \Rightarrow \quad \begin{cases} x = X_c / Z_c \\ y = Y_c / Z_c \end{cases} xy1 =Zc1 XcYcZc ⇒{x=Xc/Zcy=Yc/Zc
步骤3:归一化坐标 → 像素坐标(内参变换)
[ u v 1 ] = K [ x y 1 ] = [ f x x + s y + u 0 f y y + v 0 1 ] \begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = K \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = \begin{bmatrix} f_x x + s y + u_0 \\ f_y y + v_0 \\ 1 \end{bmatrix} uv1 =K xy1 = fxx+sy+u0fyy+v01
整合公式(直接投影)
Z c [ u v 1 ] = K ⋅ [ R ∣ t ] [ X w Y w Z w 1 ] Z_c \begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = K \cdot [R \mid t] \begin{bmatrix} X_w \\ Y_w \\ Z_w \\ 1 \end{bmatrix} Zc uv1 =K⋅[R∣t] XwYwZw1
4. 关键坐标变换总结
坐标系 | 符号 | 转换关系 |
---|---|---|
世界坐标系 (World) | P w P_w Pw | 参考全局坐标 |
相机坐标系 (Camera) | P c P_c Pc | P c = R P w + t P_c = R P_w + t Pc=RPw+t |
归一化坐标系 (Normalized) | ( x , y ) (x,y) (x,y) | x = X c / Z c , y = Y c / Z c x = X_c/Z_c, y = Y_c/Z_c x=Xc/Zc,y=Yc/Zc |
像素坐标系 (Pixel) | ( u , v ) (u,v) (u,v) | u = f x x + u 0 , v = f y y + v 0 u = f_x x + u_0, v = f_y y + v_0 u=fxx+u0,v=fyy+v0 |
5. 畸变参数(补充)
实际相机还需考虑镜头畸变(径向畸变、切向畸变),使用以下模型修正归一化坐标
(
x
,
y
)
(x, y)
(x,y):
{
x
corrected
=
x
(
1
+
k
1
r
2
+
k
2
r
4
)
+
2
p
1
x
y
+
p
2
(
r
2
+
2
x
2
)
y
corrected
=
y
(
1
+
k
1
r
2
+
k
2
r
4
)
+
p
1
(
r
2
+
2
y
2
)
+
2
p
2
x
y
\begin{cases} x_{\text{corrected}} = x (1 + k_1 r^2 + k_2 r^4) + 2 p_1 x y + p_2 (r^2 + 2x^2) \\ y_{\text{corrected}} = y (1 + k_1 r^2 + k_2 r^4) + p_1 (r^2 + 2y^2) + 2 p_2 x y \end{cases}
{xcorrected=x(1+k1r2+k2r4)+2p1xy+p2(r2+2x2)ycorrected=y(1+k1r2+k2r4)+p1(r2+2y2)+2p2xy
其中
r
2
=
x
2
+
y
2
r^2 = x^2 + y^2
r2=x2+y2,参数
k
1
,
k
2
k_1, k_2
k1,k2 为径向畸变系数,
p
1
,
p
2
p_1, p_2
p1,p2 为切向畸变系数。
6. 示例(OpenCV 模型)
在OpenCV中,投影过程定义为:
u = f_x * (X_c / Z_c) + u_0
v = f_y * (Y_c / Z_c) + v_0
外参通过 solvePnP
求解,内参和畸变参数通过 calibrateCamera
标定。
总结
- 内参矩阵 K K K:相机自身属性(焦距、主点、倾斜)。
- 外参 [ R ∣ t ] [R \mid t] [R∣t]:相机在世界中的位置和姿态。
- 投影公式: Z c p = K [ R ∣ t ] P w Z_c p = K [R \mid t] P_w Zcp=K[R∣t]Pw
- 畸变模型:修正非线性误差,提升精度。