캘리브레이션 원리 - kaellibeuleisyeon wonli

Question

기기 가동 시간 증가

어떤 기종의 기기나 모션 시스템을 사용하든 관계없이, 때로 공작물의 절삭이나 가공 또는 구성품 측정에 앞서 이는 작업에 따라 달라짐을 알아야 합니다. 기계 포지셔닝 성능의 각 특성이 시간 경과에 따라 어떻게 변하는지 자세히 확인하는 것이 중요합니다. 특성 변동을 파악함으로써 특정 기계에 대해 유지보수 작업이 필요한 시기를 예측하고 우발적인 사태에 대처하는 계획을 미리 세울 수 있게 됩니다.

목차 Show

기기 가동 시간 증가
기계 성능 향상
기계/제조 역량에 대한 지식 향상
표적 집중 유지보수
일정에 따른 유지보수 가능
기계 성능 입증
품질 보증 절차 및 표준 준수
전문적인 유지보수 서비스 제공
이미지 형성과 핀홀 모델 카메라
Camera Extrinsic Matrix with Example in Python
Camera Intrinsic Matrix with Example in Python
Find the Minimum Stretching Direction of Positive Definite Matrices
Camera Calibration with Example in Python
추가 내용 : 이미지 crop과 resize에 따른 intrinsic 수정 방법
이미지 형성과 핀홀 모델 카메라
Camera Extrinsic Matrix with Example in Python
Camera Intrinsic Matrix with Example in Python
Find the Minimum Stretching Direction of Positive Definite Matrices
Camera Calibration with Example in Python
추가 내용 : 이미지 crop과 resize에 따른 intrinsic 수정 방법

기계 성능 향상

Renishaw의 성능 측정 장비를 사용하면 가공 및 공정 후 사후 부품 검사 전에 공작 기계의 성능을 판정함으로써 CNC 공작 기계를 효과적으로 관리할 수 있습니다. 또한, 표적 집중 유지보수 및 오차 보정을 통해 기계 성능도 개선할 수 있습니다.

기계/제조 역량에 대한 지식 향상

각 작업에 맞는 기계를 사용하는 것이 중요합니다. 특정 공차의 작업을 해당 공차 내로 작업할 수 있는 기계에 배정함으로써 기계를 필요한 목적에 정확히 맞추고 불량률을 줄입니다.

표적 집중 유지보수

Renishaw의 성능 측정 장비를 사용하면 문제 유발원을 정확히 파악할 수 있고, 유지보수 작업을 요청할 때 필요한 모든 정보가 확보되므로 문제를 정확히 찾아내서 가동 중단시간을 최소화할 수 있습니다.

일정에 따른 유지보수 가능

정기적인 테스트, 저장된 테스트 데이터와 비교를 통해 문제가 심각해지기 전과 잠재된 문제를 식별하여 가동중단을 최소화하기 위한 유지보수 일정을 계획할 수 있습니다.

기계 성능 입증

기계 또는 공정의 품질에 대한 확신이 필요할 때 기계의 캘리브레이션 그래프와 정기적 성능 평가 결과가 좋은 증거가 됩니다. 이러한 자료는 같은 테스트를 수행하지 않는 경쟁업체보다 우위를 차지할 경쟁력을 제공할 수 있습니다.

품질 보증 절차 및 표준 준수

공인된 추적 가능 시스템과 방법을 사용하여 제조 및 검사 장비를 캘리브레이션, 모니터링, 제어하는 것은 ISO 9000 품질 표준 시리즈의 요구 조건입니다.

전문적인 유지보수 서비스 제공

우수한 품질의 판매후 서비스는 정확도 유지의 열쇠입니다. 시스템 OEM(Original Equipment Manufacturer)이 자사 공장에서 사용하는 것과 동일한 캘리브레이션 공구를 고객 작업장에서 사용하는 것이 원래 제조업체 사양으로 기계를 복원하는 최상의 방법입니다.

자세히

캘리브레이션 솔루션이 다양한 글로벌 기업들에게 어떻게 도움을 주었는지 알아보십시오.

기계 성능 개선을 위한 Renishaw의 광범위한 캘리브레이션 솔루션에 대해 알아보십시오.

캘리브레이션 제품의 작동 방식과 공정 개선에 활용하는 방법을 설명하는 안내서.

캘리브레이션하는 이유

캘리브레이션을 통해 기계 활용도를 극대화하는 방법 이해

캘리브레이션하는 이유

작동 원리

레이저 및 볼바 작동 방법을 확인해 보십시오.

작동 원리

6자유도(6DoF)에 대한 설명

선형 이동 경로의 다양한 오차 유형 파악.

6자유도(6DoF)에 대한 설명

자세히

적용 사례 연구

캘리브레이션 솔루션이 다양한 글로벌 기업들에게 어떻게 도움을 주었는지 알아보십시오.

캘리브레이션 솔루션

기계 성능 개선을 위한 Renishaw의 광범위한 캘리브레이션 솔루션에 대해 알아보십시오.

Vision 관련 글 목차

참조 : https://ms-neerajkrishna.medium.com/
참조 : https://darkpgmr.tistory.com/32
참조 : https://www.mathworks.com/help/vision/ug/camera-calibration.html
참조 : https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0165487
참조 : https://blog.immenselyhappy.com/post/camera-axis-skew/

이번 글에서는 컴퓨터 비전을 위한 카메라 내용 및 카메라 캘리브레이션 관련 내용과 파이썬을 이용하여 실습을 해보도록 하겠습니다.

이미지 형성과 핀홀 모델 카메라
Camera Extrinsic Matrix with Example in Python
Camera Intrinsic Matrix with Example in Python
Find the Minimum Stretching Direction of Positive Definite Matrices
Camera Calibration with Example in Python
추가 내용 : 이미지 crop과 resize에 따른 intrinsic 수정 방법

이미지 형성과 핀홀 모델 카메라

이미지 형성의 기본 아이디어는 object에서 medium으로 반사되는 광선(Rays)을 포착하는 것에서 부터 시작합니다.
가장 단순한 방법은 object 앞에 medium을 놓고 반사되어 들어오는 광선을 캡쳐하면 됩니다. 하지만 단순히 이러한 방식으로 하면 필름 전체에 회색만 보일 수 있습니다. 왜냐하면 object의 다른 지점에서 나오는 광선이 필름에서 서로 겹쳐서 엉망이 되기 때문입니다.

위 그림을 살펴보면 object에서 부터 반사되어 나온 광선이 Medium의 같은 위치에서 수집될 수 있습니다. 이런 경우 object로 부터 반사되어 나온 위치의 형상을 정확히 알 수 없습니다.

따라서 위 그림과 같이 pin hole 구조를 이용하여 object의 어떤 위치가 medium의 픽셀 간 일대일 대응이 될 수 있도록 만듭니다. 이와 같은 방법을 이용하여 medium의 한 픽셀에 object의 여러 부분이 겹치는 문제를 개선할 수 있습니다.
하지만 위 그림에서 한가지 문제점이 있습니다. 광선이 medium에 맺히는 위치가 반전이 되어 있습니다. 예를 들어 나무 윗부분의 물체가 medium의 아랫 부분에 위치해 있는 것을 알 수 있습니다. 이것이 pin hole 카메라의 특성이며 이 성질을 이용하여 수학적으로 모델링을 해야 합니다.

Pinhoe camera

앞에서 설명한 핀홀 카메라 모델은 대부분의 컴퓨터 비전 분야에서 기본적으로 사용됩니다. 하지만 핀홀 카메라 모델은 매우 이상적인 카메라 모델이며 실제로는 렌즈의 특성이 반영되어야 하므로 영상 왜곡 등도 같이 고려되어야 합니다.

그러면 핀홀 카메라의 원리를 이용하여 수학적으로 모델링 하기 위하여 아래 2가지 가정을 전제로 두겠습니다.
① 앞의 그림에서 광선을 캡쳐하는 medium 또는 필름 구조를 image plane 이라고 하며 촬영자 - image plane - 핀홀- 물체 순서로 위치해 있습니다. 편의상 핀홀 앞쪽이라고 말하겠습니다. 하지만 실제로는 image plane은 핀홀 뒤쪽에 위치해 있습니다. 이와 같은 구조로 설계하는 것이 물체로부터 반사된 광선을 image plane에 projection하기 쉽기 때문이며 앞서 언급한 반전된 이미지 문제도 해소할 수 있기 때문입니다. 자세한 구조는 생략하며 여기서 짚고 넘어갈 점은 촬영자 - 핀홀 - image plane - world space 순서로 위치한 점입니다.
② world space에서 부터 반사된 수많은 광선은 핀홀로 수렴된다고 가정합니다. 이 지점을 center of projection 또는 camera center라고 합니다.

이러한 가정을 이용하면 world space에 있는 물체들이 image plane에 투영되고 최종적으로 center of projection (camera center)로 수렴되는 구조로 이해할 수 있습니다.
image plane은 XY plane과 평행하고 center of projection과 일정 거리 떨어져 있습니다. 이 거리를 focal length라고 하며 이후에 다룰 예정입니다.

좌표계는 위 그림과 같으며 오른손으로 엄지, 검지, 중지로 나타내었을 때, 각각 y, z, x 축을 가리킵니다. 이를 참조하여 좌표계를 이해하시면 됩니다.

Geometric camera calibration

카메라는 어느 위치에나 장착될 수 있고 카메라가 보는 방향도 제각각 입니다. 여기서 해결해야 할 점은 world space에서 반사되어 들어오는 광선을 어떻게 image plane에 투영할 지 정해야 한다는 것입니다. 바꿔 말하면 world space와 image plane 간의 관계를 알아내어야 실제 이미지를 만들어 낼 수 있습니다.
이 관계는 world space → image plane으로 변환하는 행렬을 구해야 하며 이 때 필요한 2가지 행렬을 extrinsic, intrinsic 이라고 합니다.
extrinsic : world space의 좌표계를 world coordinate system이라고 하고 앞에서 \(X, Y, Z\) 축으로 표현한 좌표계를 camera coordinate system이라고 합니다. 이 때, world coordinate system → camera coordinate system으로 좌표계를 변환할 때 사용하는 행렬을 extrinsic이라고 합니다. 이 행렬은 카메라가 실제 장착된 위치 등의 환경과 관련이 있습니다.
intrinsic : camera coordinate system의 점들을 image plane의 좌표로 변환하는 행렬을 intrinsic이라고 합니다. 이 행렬은 카메라 내부 환경과 관련이 있습니다.
extrinsic과 intrinsic을 확인하는 것을 카메라 캘리브레이션이라고 합니다.

Camera Extrinsic Matrix with Example in Python

카메라가 설치되는 위치와 방향에 따라 world coordinate system에서 camera coordinate system으로 변형하기 위하여 extrinsic이 필요하다고 앞에서 설명하였습니다.
extrinsic을 구하기 위해서는 world space 상에서 카메라의 방향과 위치를 알아야 하며 이것을 알기 위해서는 ① rotation과 ② translation에 대한 변환이 어떻게 되어있는 지 알아야 합니다. world space 상에서의 좌표 기준이 있고 그 좌표계에서 카메라가 얼만큼 회전(rotation)이 되었는 지를 알고 카메라가 얼만큼 이동(translation)하였는 지 알면 카메라 좌표계 상에서의 위치 변화를 알 수 있습니다.

지금부터 살펴볼 내용은 rotation과 translation 각각에 대하여 기저 (basis) 변환을 어떻게 하는 지 살펴보려고 합니다. 기저 변환을 확인하기 위하여 먼저 ① 같은 기저 내에서 점 \(P \to P'\) 로 rotation과 translation을 하는 방법에 대하여 알아보고 ② 기저1의 점 \(P\) 가 기저2에서는 어떤 좌표값을 가지는 지 살펴도록하곘습니다.
이와 같이 기저 변환을 통하여 좌표가 어떻게 바뀌는 지 알아보는 이유는 world space 상의 world coordinate system에서 camera coordinate system으로 기저 변환을 하기 위함입니다.

Change of coordinates by rotation

점 \(P\)가 \(\theta\) 만큼 회전하였을 때 좌표를 구하기 위하여 다음 그림을 참조해 보도록 하겠습니다.

위 예시는 2차원 (\(\mathbb{R}^{2}\)) XY 평면에서 점 \(P\) 를 \(\theta\) 만큼 회전하여 \(P'\) 를 얻을 때 사용하는 행렬을 나타냅니다. 그러면 위 그래프를 기준으로 식을 전개해 보도록 하겠습니다.
먼저 \(\alpha\) 각도에 대하여 다루어 보도록 하곘습니다.

\[\sin{(\alpha)} = \frac{y}{r}, \cos{(\alpha)} = \frac{x}{r} \tag{1}\]

위 식에서 \(r\) 을 기준으로 등식을 만들어 정리하면 다음과 같이 두 식을 정리할 수 있습니다.

\[x\sin{(\alpha)} = y \cos{(\alpha)} \tag{2}\]

이번에는 \(\theta + \alpha\) 각도에 대하여 다루어 보도록 하겠습니다.

\[x' = r\cos{(\theta + \alpha)} \tag{3}\]
\[\cos{(\theta + \alpha)} = \cos{(\theta)}\cos{(\alpha)} - \sin{(\theta)}\sin{(\alpha)} \tag{4}\]

식(4)를 이용하여 식(3)을 전개해 보도록 하겠습니다.

\[\Rightarrow r\cos{(\theta + \alpha)} = r(\cos{(\theta)}\cos{(\alpha)} - \sin{(\theta)}\sin{(\alpha)}) \tag{5}\]
\[= r(\cos{(\theta)}\frac{x}{r} - \sin{(\theta)}\frac{y}{r}) = x\cos{(\theta)} - y\sin{(\theta)} \tag{6}\]
\[\therefore x' = x\cos{(\theta)} - y\sin{(\theta)} \tag{7}\]

이번에는 다른 식을 살펴보도록 하겠습니다.

\[y' = r\sin{(\theta + \alpha)} \tag{8}\]
\[\sin{(\theta + \alpha)} = \sin{(\theta)}\cos{(\alpha)} + \cos{(\theta)}\sin{(\alpha)} \tag{9}\]

식(7)을 전개하는 과정과 동일한 방식으로 식(8)을 식(9)를 이용하여 정리하면 다음과 같습니다.

\[y' = x\sin{(\theta)} + y\cos{(\theta)} \tag{10}\]

식 (7)과 식(10)을 묶어서 행렬로 나타내면 다음과 같습니다.

\[\begin{bmatrix} x' \\ y' \end{bmatrix} = \begin{bmatrix} \cos{(\theta)} & -\sin{(\theta)} \\ \sin{(\theta)} & \cos{(\theta)} \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} \tag{11}\]

식(11)을 이용하면 점 \(P\)를 \(P'\) 로 변환할 수 있습니다.

위 예시는 2차원 평면에서의 회전 변환을 나타냅니다. 만약 3차원 평면에서의 회전이 발생하면 어떻게 될까요? 각 \(X, Y, Z\) 축 방향으로 회전 변환 행렬을 적용하면 됩니다. 변환 행렬은 다음과 같습니다.

\[R_{x}(\theta) = \begin{bmatrix} 1 & 0 & 0 \\ 0 & \text{cos}\theta & -\text{sin}\theta \\ 0 & \text{sin}\theta & \text{cos}\theta \end{bmatrix} \tag{12}\]
\[R_{y}(\theta) = \begin{bmatrix} \text{cos}\theta & 0 & \text{sin}\theta \\ 0 & 1 & 0 \\ -\text{sin}\theta & 0 & \text{cos}\theta \end{bmatrix} \tag{13}\]
\[R_{z}(\theta) = \begin{bmatrix} \text{cos}\theta & -\text{sin}\theta & 0 \\ \text{sin}\theta & \text{cos}\theta & 0 \\ 0 & 0 & 1 \end{bmatrix} \tag{14}\]

전체 변환 행렬 \(R\) 은 \(R = R_{z}(\alpha)R_{y}(\beta)R_{x}(\gamma)\) 로 행렬 곱을 통해 나타낼 수 있습니다. \(\alpha, \beta, \gamma\) 각각은 각 축으로 회전한 각도를 의미합니다.

\[R = R_{z}(\alpha)R_{y}(\beta)R_{x}(\gamma) = \begin{bmatrix} \text{cos}\alpha & -\text{sin}\alpha & 0 \\ \text{sin}\alpha & \text{cos}\alpha & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} \text{cos}\beta & 0 & \text{sin}\beta \\ 0 & 1 & 0 \\ -\text{sin}\beta & 0 & \text{cos}\beta \end{bmatrix} \begin{bmatrix} 1 & 0 & 0 \\ 0 & \text{cos}\gamma & -\text{sin}\gamma \\ 0 & \text{sin}\gamma & \text{cos}\gamma \end{bmatrix} \tag{15}\]

\[R = \begin{bmatrix} \text{cos}\alpha \ \text{cos}\beta & \text{cos}\alpha \ \text{sin}\beta \ \text{sin}\gamma - \text{sin}\alpha \ \text{cos}\gamma & \text{cos}\alpha \ \text{sin}\beta \ \text{cos}\gamma + \text{sin}\alpha \ \text{sin}\gamma \\ \text{sin}\alpha \ \text{cos}\beta & \text{sin}\alpha \ \text{sin}\beta \ \text{sin}\gamma + \text{cos}\alpha \ \text{cos}\gamma & \text{sin}\alpha \ \text{sin}\beta \ \text{cos}\gamma - \text{cos}\alpha \ \text{sin}\gamma \\ -\text{sin}\beta & \text{cos}\beta \ \text{sin} \gamma & \text{cos}\beta \ \text{cos} \gamma \\ \end{bmatrix} \tag{16}\]

Change of basis by rotation

지금까지 살펴본 내용은 한 점 \(P\) 가 각 축의 방향으로 회전하였을 때 새로운 위치를 계산하는 방법에 대하여 알아보았습니다.
앞으로 살펴볼 내용은 basis가 회전할 때 각 좌표들이 어떻게 변경되는 지 살펴보도록 하겠습니다. 앞의 좌표 변환과 유사하지만 다소 차이점이 있으니 그 점을 유의해서 살펴보시면 됩니다.

위 그래프를 살펴보면 기존의 \(X, Y\) 축이 이루는 평면을 \(X', Y'\) 평면이 이루는 축으로 변경을 해야 합니다.
XY 평면 상의 점 P가 X’Y’평면 상에서 어떤 좌표값을 가지는 지 알면 XY → X’Y’의 변환 관계를 알 수 있습니다.
결과는 위 그림의 행렬 식과 같이 회전 변환 행렬의 역행렬을 곱하면 됩니다.

\[\sin{(\alpha)} = \frac{y'}{r}, \cos{(\alpha)} = \frac{x'}{r} \tag{17}\]
\[\Rightarrow x'\sin{(\alpha)} = y'\cos{(\alpha)} \tag{18}\]
\[x = r\cos{(\theta + \alpha)} = \frac{x'}{\cos{(\alpha)}}\cos{(\theta + \alpha)} \tag{19}\]

식 (4)의 코사인 법칙을 이용하여 식을 전개합니다.

\[x = \frac{x'}{\cos{(\alpha)}}\cos{(\theta + \alpha)} = \frac{x'}{\cos{(\alpha)}}(\cos{(\theta)}\cos{(\alpha)} - \sin{(\theta)}\sin{(\alpha)}) \tag{20}\]
\[x = x'\cos{(\alpha)} - x'\sin{(\alpha)}\frac{\sin{(\theta)}}{\cos{(\alpha)}} \tag{21}\]

식 (21)에 식 (17)을 이용하여 \(x'\sin{(\alpha)}\) 을 \(y'\cos{(\alpha)}\) 로 대체한다.

\[x = x'\cos{(\alpha)} - y'\cos{(\alpha)}\frac{\sin{(\theta)}}{\cos{(\alpha)}} \tag{22}\]
\[x = x'\cos{(\alpha)} - y'\sin{(\theta)} \tag{23}\]

이 방법과 유사하게 아래 식 (24)를 식 (9)의 sin법칙과 식 (17)을 이용하여 전개하면 식 (25)와 같이 정리 됩니다.

\[y = r\sin{(\theta + \alpha)} = \frac{y'}{\sin{(\alpha)}}\sin{(\theta + \alpha)} \tag{24}\]
\[\Rightarrow x'\sin{(\theta)} + y'\cos{(\theta)} \tag{25}\]

따라서 basis를 회전하였을 때, 회전 변환 행렬은 다음과 같이 정리할 수 있습니다.

\[\begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} \cos{(\theta)} & -\sin{(\theta)} \\ \sin{(\theta)} & \cos{(\theta)} \end{bmatrix} \begin{bmatrix} x' \\ y' \end{bmatrix} \tag{26}\]

변환의 최종 목적은 (x, y) → (x’, y’)로 변환하기 위한 행렬을 찾는 것이므로 아래와 같이 행렬식을 변경합니다.

\[\begin{bmatrix} x' \\ y' \end{bmatrix} = \begin{bmatrix} \cos{(\theta)} & -\sin{(\theta)} \\ \sin{(\theta)} & \cos{(\theta)} \end{bmatrix}^{-1} \begin{bmatrix} x \\ y \end{bmatrix} \tag{27}\]

식 (27)과 같이 basis 행렬의 변환은 기존의 회전 변환 행렬을 역행렬 한 것으로 확인할 수 있습니다. 따라서 카메라의 extrinsic의 요소인 Rotation 정보를 안다면 역행렬을 이용하여 카메라 좌표계의 basis와 실제 세계의 basis 간의 변환을 할 수 있습니다.

지금까지 특정 점이 회전하는 경우와 기저(basis)가 회전하는 경우에 대하여 살펴보았습니다. 그러면 특정 점이나 기저가 이동 (translation)하는 경우에 대하여 살펴보도록 하겠습니다.

Change of coordinates by translation

먼저 translation에 의하여 특점 점의 좌표값이 바뀌는 경우에 대하여 살펴보도록 하겠습니다.

위 그림과 같이 점 \(P\) 가 점 \(P'\) 로 이동한 경우입니다. 아래 식과 같이 이동할 수 있습니다.

\[x' = x + a, y' = y + b \tag{28}\]

위 식을 행렬 곱으로 나타내려면 차원이 맞지 않기 때문에 차원을 하나 늘려주는 트릭을 통해 행렬의 곱으로 나타낼 수 있습니다. 이와 같이 행렬의 곱셈으로 나타내려는 이유는 앞에서 살펴본 rotation과 translation을 한번에 표현하기 위함입니다.

\[\begin{bmatrix} x' \\ y' \\ 1 \end{bmatrix} = \begin{bmatrix}1 & 0 & a \\ 0 & 1 & b \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ 1\end{bmatrix} \tag{29}\]

위 식과 같이 차원을 추가하여 좌표를 표현한는 것을 homogeneous coordinates라고 합니다. 행렬의 곱으로만 표현된 형태를 뜻합니다.
homogeneous coordinate의 정확한 뜻을 알고 싶으면 아래 링크를 참조하시기 바랍니다.
- 링크 : https://gaussian37.github.io/vision-concept-homogeneous_coordinate/
만약 위 식에서 \(x, y\) 좌표값을 구하고 싶으면 다음과 같이 마지막 상수항을 나눠서 구할 수 있습니다.

\[\begin{bmatrix} x & y & 1 \end{bmatrix} \approx \begin{bmatrix} x/1 & y/1 \end{bmatrix} = \begin{bmatrix} x & y \end{bmatrix} \tag{30}\]

실제 연산을 할 때에는 homogeneous coordinate 상에서 연산을 하고 좌표를 구할 때에는 식 (30)을 이용하여 구합니다. 상세 내용은 글 이후에서 다룰 예정입니다.

Change of coordinates by translation

앞에서 다룬 것과 마찬가지로 XY 평면을 X’Y’ 평면으로 translation 해보도록 하겠습니다. 두 기전 간의 관계는 점 \(P\) 를 고정으로 둔 다음에 좌표가 어떻게 바뀌는 지 확인하여 살펴보겠습니다.

\[x' = x - a, y' = y - b \tag{31}\]
\[\begin{bmatrix} x' \\ y' \\ 1 \end{bmatrix} = \begin{bmatrix}1 & 0 & -a \\ 0 & 1 & -b \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ 1\end{bmatrix} \tag{32}\]

식 (27)의 rotation에서 살펴보았듯이 좌표 위치 변환을 위한 linear transformation과 basis transformation 간에 역(inverse) 관계가 있었듯이 translation에서도 역관계가 있음을 확인할 수 있습니다.

위 풀이 과정을 통하여 식 (29)의 우변의 행렬과 식 (32)의 우변의 행렬은 역행렬 관계임을 알 수 있습니다.
정리하면 rotation과 translation에서의 basis transformation과 coordinate transformation에는 역행렬 관계가 있습니다.

이와 같은 관계를 Active(Alibi)/Passive(Alias) Transformation 이라고 합니다.

위 그림의 왼쪽과 같이 Active Transformation에서는 어떤 점 \(P\) 가 \(P'\) 로 \(\theta\) 만큼 시계 방향으로 회전합니다. 이 때 회전 기준은 점 \(P\) 가 존재하는 좌표계 기준입니다.
반면 위 그림의 오른쪽과 같이 Passive Transformation에서는 점 \(P\) 는 움직이지 않고 좌표계가 \(\theta\) 만큼 반시계 방향으로 회전합니다.
Active Transformation의 점 \(P'\) 와 Passive Transformation이 반영된 점 \(P\) 는 좌표계 기준으로 같은 좌표를 나타내는 것을 알 수 있습니다. 여기서 중요한 점은 방향까지 고려 하였을 때, Active Transformation에서는 \(-\theta\) 만큼 회전이 반영된 것이 Passive Transformation에서는 \(\theta\) 만큼 반영된 것입니다. 즉, 서로 inverse 관계를 가진다는 것입니다. 이와 같은 inverse 관계는 rotation 뿐만 아니라 다른 transformation에서도 적용됩니다.
수학에서는 주로 Active Transformation만 다루지만 물리 또는 공학에서는 두가지 모두를 다루게 되며 Computer Vision과 같은 좌표계 변환이 많은 분야에서는 Passive Transformation의 관점이 많이 다루어집니다. 예를 들어 어떤 강체 (rigid body)의 연속적인 움직임을 관측할 때에는 Active Transformation을 사용하는 반면 한 개의 물체를 두고 local coordinate와 global coordinate가 동시에 존재하는 상황에서는 Passive Transformation이 사용됩니다.

위 그림은 Rotation Matrix \(R\) 을 이용하여 Passive/Active Transformation을 한 그림입니다. 결국 최종 좌표계 기준으로 같은 점을 가리킨다는 것을 나타냅니다.

위 그림은 이미지 좌표계에서 Translation과 Rotation 각각의 Passiave/Active Transformation을 나타냅니다.

Extrinsic Camera Matrix

지금까지 rotation과 translation을 각각 살펴보았습니다. 그러면 homogeneous coordinate 형태로 나타내어 본 이유가 한번에 행렬곱으로 연산하기 위함이었듯이 행렬 곱으로 나타내어 보겠습니다.
아래 식을 어떤 점 \(P\) 를 \(P'\) 로 변환하기 위한 행렬식이라고 가정하겠습니다.

\[\begin{bmatrix} R & T \\ 0^{T} & 1 \end{bmatrix} = \begin{bmatrix} 1 & T \\ 0^{T} & 1 \end{bmatrix} \begin{bmatrix} R & 0 \\ 0^{T} & 1 \end{bmatrix} \tag{33}\]

위 식에서 \(R\) 은 rotation을 의미하고 \(T\) 는 translation을 의미합니다. \(R\) 은 (2, 2), (3, 3)과 같은 정사각행렬의 크기를 가집니다. 이 때 차원이 결정되면 \(R\)의 차원과 동일한 차원의 \(T\) 열벡터가 크기 2, 3과 같은 사이즈를 가지게 됩니다. \(0^{T}\) 는 열벡터를 행벡터 형태로 나타내기 위함입니다.
3차원 공간에서의 rotation과 translation을 위한 행렬에서 \(R\) 은 (3, 3)의 크기의 행렬을 가지고 \(T\) 는 (3, 1)의 크기의 열벡터를 가지므로 최종적으로 (4, 4) 크기의 행렬이 됩니다.
어떤 점 \(P \to P'\) 로 coordinate transform 할 때 사용한 행렬을 \(A\) 라고 하면 \(A^{-1}\) 은 basis transformation 이라고 하였습니다.
따라서 식 (33)의 행렬을 \(A\) 라고 하면 basis transformation 행렬은 \(A^{-1}\) 이 되고 world coordinate system을 camera coordinate system으로 변환하는 것을 extrinsic camera matrix \(E\) 라고 하기 때문에 \(A^{-1} = E\) 라고 정의하겠습니다.
만약 어떤 점 \(p\) 가 있고 world coordinate system에서는 \(p\) 를 좌표 \(p_{w}\) 의 값을 가지고 camera coordinate system에서는 좌표 \(p_{c}\) 를 가진다고 하면 좌표 기준으로 \(p_{w} \to p_{c}\) 로 변환하는 행렬을 구할 수 있습니다. 이 행렬을 앞의 예제와 같이 \(A\) 라고 한다면 반대로 world coordinate system 인 \(P^{W}\) 를 camera coordinate system 인 \(P^{C}\) 로 변환하는 행렬은 \(A^{-1} = E\) 가 됩니다.

\[P^{C} = E \times P^{W} \tag{34}\]

식 (34)와 같이 extrinsic camera matrix \(E\) 를 이용하여 world coordinate system에서 camera coordinate system으로의 기저 변환을 할 수 있습니다.

지금 까지 내용을 정리하면 coordinate system을 변환하는 행렬은 다음과 같은 순서로 구할 수 있습니다.
① 어떤 점 \(P\) 에 대하여 \(A\) 좌표계와 \(B\) 좌표계 각각에서 가지는 좌표값 \(P_{A}\) 와 \(P_{B}\) 를 구합니다.
② 한 좌표계의 점을 기준으로 삼습니다. 편의상 \(A\) 좌표계를 기준으로 삼겠습니다.
③ \(P_{A}\) 를 \(P_{B}\) 로 변환할 수 있는 변환 행렬 \(T\) 를 구합니다.
④ 변환 행렬 \(T\) 를 이용하여 \(T^{-1} \times A = B\) 또는 \(A = T \times B\) 형태로 좌표계 변환에 적용합니다.

Degrees of Freedom

지금까지 살펴본 Extrinsic Camera matrix를 선언할 때, 필요한 파라미터는 6가지가 있었습니다. X, Y, Z 축으로 얼만큼 회전하였는 지와 X, Y, Z 축으로 부터 얼마 만큼의 translation이 발생하였는 지 입니다.
이 필요한 파라미터를 DoF(Degree of Freedom)이라고 하며 따라서 Extrinsic을 구할 때에는 6개의 DoF가 필요하다고 말합니다.

앞에서 살펴본 내용을 파이썬으로 실습해 보도록 하겠습니다. 아래 링크의 예제는 world coordinate system → camera coordinate system으로 기저 변환이 되었을 때, \(y\) 축으로 45도 회전과 -8만큼 translation이 발생하였다고 가정하고 변환하였습니다.
그래프 출력 결과는 colab에서 생성이 안되어 local의 jupyter notebook에서 실행하시길 바랍니다.

colab 링크 : Image formation and camera extrinsics

먼저 결과부터 살펴보면 기존의 파란색 평면 (world 좌표계)이 Y축 (초록색 축)을 기준으로 45도 rotation과 Y축 기준으로 -8 만큼 translation이 발생한 것을 확인할 수 있습니다.
파란색 평면 아래에 있는 좌표 축이 위 좌표계의 기준 축입니다. X, Y, Z 축의 원점이 (0, 0, 0)에 있는 것을 확인할 수 있습니다. 이것을 편의상 world coordinate system이라고 하겠습니다.
반면에 주황색 평면 아래에 있는 좌표 축은 새로운 좌표축이며 편의상 camera coordinate system이라고 하겠습니다.
파란색 평면과 주황색 평면은 좌표의 집합입니다. 즉, 파란색 평면을 주황색 평면으로 변환하는 것은 좌표를 변환하는 것과 같습니다.

위 코드 부분에서 R과 T는 각각 Y축 방향으로 45도 회전과 -8만큼 translation이 발생함을 나타낸 것입니다. 즉, 파란색 평면을 주황색 평면으로 변환하기 위한 것이고 이것은 좌표를 변환하는 것과 같습니다.
R_과 T_는 homogeneous coordinate로 표현하기 위하여 나타낸 것이며 이렇게 표현하면 R_과 T_의 행렬 곱을 통하여 rotation과 translation을 한번에 표현할 수 있습니다.
따라서 주황색 평면은 파란생 평면에에 비하여 Y축 방향으로 +45도 회전과 -8만큼의 translation이 발생한 것을 확인할 수 있습니다.

# create an image grid
xx, yy, Z = create_image_grid(f, img_size)
# convert the image grid to homogeneous coordinates
pt_h = convert_grid_to_homogeneous(xx, yy, Z, img_size)
# transform the homogeneous coordinates
pt_h_transformed = R_ @ T_ @ pt_h
# convert the transformed homogeneous coordinates back to the image grid
xxt, yyt, Zt = convert_homogeneous_to_grid(pt_h_transformed, img_size)

위 코드에서 xx, yy, Z는 (3, 3) 평면을 만들기 위한 코드이며 pt_h는 (4, 9)의 크기를 가지는 행렬입니다. 여기서 행 사이즈인 4의 의미는 X, Y, Z 방향에서의 값과 homogeneous를 만들기 위한 dummy 차원 1개를 의미하며 열 사이즈는 (3, 3) 크기 행렬에 속한 값들을 의미합니다.
위 코드에서 pt_h_transformed = R_ @ T_ @ pt_h을 보면 world coordinate system상에서 파란색 평면을 주황색 평면 위치로 변환하는 역할을 합니다.

# define axis and figure
fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111,projection='3d')

# set limits
ax.set(xlim=(-10, 5), ylim=(-10, 10), zlim=(0, 10))

# plot the global basis and the transformed camera basis
ax = pr.plot_basis(ax)
ax = pr.plot_basis(ax, R, T)

# plot the original and transformed image plane
ax.plot_surface(xx, yy, Z, alpha=0.75)
ax.plot_surface(xxt, yyt, Zt, alpha=0.75)

ax.set_title("camera transformation")
ax.set_xlabel("X-axis")
ax.set_ylabel("Y-axis")
ax.set_zlabel("Z-axis")

위 그래프를 생설할 때, 주황색 평면 아래 좌표축은 ax = pr.plot_basis(ax, R, T)을 통해서 만든 것입니다. 즉, 기존 R, T를 이용하여 world coordinate system을 camera coordinate system로 변환시킨 것임을 알 수 있습니다.

앞에서 설명한 바와 같이 rotation과 translation을 하나의 homogeneous 형태로 만든 R_T_의 역행렬이 기저 즉, 좌표계를 변환하는 행렬임을 확인하였습니다. 따라서 위 식의 E = np.linalg.inv(R_ @ T_)를 world coordinate system좌표계를 camera coordinate system 좌표계로 변환하는 extrinsic 행렬 E를 구할 수 있습니다.

(4, 4) 행렬의 E의 마지막 행을 삭제하여 (3, 4) 크기의 행렬을 만들면 왼쪽 (3, 3)은 Rotation을 의미하고 가장 오른쪽 (3, 1) 크기의 열벡터는 Translation을 의미하게 됩니다.
이 과정의 의미는 homogeneous coordinate (동차 좌표계)를 다시 cartesian coordinate (직교 좌표계)로 표현한 것입니다.

위 코드의 cw는 world coordinate system에서의 좌표를 의미하고 cc는 camera coordinate system의 좌표를 의미합니다.
앞에서 선언한 E를 이용하여 cw → cc로 변환하고자 합니다. 여기서 중요한 것은 cw와 cc 모두 같은 한 점을 의미하지만 좌표계가 다르기 때문에 다른 값을 가진다는 것입니다.
world coordinate system에서는 약 (X = -0.7, Y = -8, Z = 0.7)을 가지지만 camera coordinate system에서는 (X = -1, Y = 0, Z = 1)을 가짐을 코드 또는 그래프를 통해서 확인할 수 있습니다.

지금까지 살펴본 예제가 Camera Extrinsic을 의미하며 이와 같은 원리로 사용됩니다.

Camera Intrinsic Matrix with Example in Python

지금까지 world coordinate system에서 camera coordinate system으로 변환하는 방법을 camera extrinsic을 통하여 알아보았습니다. 지금부터는 camera coordinate system에서 image plane으로 어떻게 변환이 되는지를 통하여 intrinsic에 대하여 알아보도록 하겠습니다. 위 그림의 초록색 점들이 표현된 곳이 image plane입니다.

Projection of a point

이미지 형성을 위한 기본적인 아이디어는 물체로 반사되어 온 빛을 image plane에 projection 하는 것입니다. 이 때, image plane은 물체로 부터 반사된 빛을 캡쳐한다는 관점에서 필름과 같이 이해할 수 있습니다. 그리고 이미지에서의 각 픽셀은 image plane에서의 각 위치와 대응이 됩니다.

위 그림에서 원점은 앞에서 계속 명시하였던 center of projection으로 물체로부터 반사되어 온 빛을 projection 하였을 때 한 곳으로 모이는 점이 됩니다.
image plane은 원점으로부터 Z축 방향으로 \(f\) 만큼 떨어져 있다고 가정합니다. 여기서 \(f\) 를 focal length라고 합니다.
물체 \(P\) 가 image plane에 projection되었을 때, image plane상에서의 점을 \(P'\) 라고 하곘습니다. 그러면 위 그림의 \(X, Y, Z\) 축 기준으로 \(P\) 의 좌표는 \((x, y, z)\) 인 반면 \(P'\)의 좌표는 \((x', y', f)\) 가 됩니다. 여기서 목표는 \(P'\) 좌표를 알아내는 것 입니다.
위 그림에서 \(\Delta \text{OMP}\) 와 \(\Delta \text{OO'P}\) 가 닮은꼴 삼각형임을 이용하여 \(P'\) 좌표를 추정하면 다음과 같습니다.

\[\frac{x'}{x} = \frac{y'}{y} = \frac{f}{z} \tag{35}\]
\[x' = x \frac{f}{z} \tag{36}\]
\[y' = y \frac{f}{z} \tag{37}\]

식 (36), 식 (37)을 이용하여 \(x', y'\) 은 알 수 있으며 \(z' = f\) 로 고정됩니다.
만약 \(P\) 가 카메라로 부터 점점 더 멀어진다면 image plane에 projection 된 물체의 좌표값인 \(P'\) 는 점점 작아질 것입니다. 왜냐하면 물체가 카메라로부터 멀어지면 \(f\) 는 고정이나 \(z\) 값이 커져서 \(x', y'\) 는 작아지기 때문입니다. 따라서 멀리 있는 물체가 이미지의 상단에 위치하게 되는 것입니다.

projection 된 이미지 상의 좌표를 구하고 싶다면 식 (36), (37)을 이용하여 \(x', y'\) 좌표를 구하고 \(z'\) 좌표는 버리면 됩니다. 예를 들어 \(P' = (xf/z, yf/z, f)\) 에서 마지막 \(z' = f\) 제외하면 됩니다. 이렇게 구한 좌표를 image coordinate 라고 하며 \((u, v)\) 로 표현합니다.

\[(u, v) = (\frac{xf}{z}, \frac{yf}{z}) \tag{38}\]

식 (38)을 이용하면 camera coordinate system → image coordinate로 변경할 수 있습니다. 하지만 현실적으로 image plane이 XY plane과 평행하지 않을 수 있고, image plane이 Z축과 많이 벗어날 수 있고 심지어 image plane 자체가 기울어져 있을 수도 있습니다. 카메라 제작 상황에 따라서 이 부분은 바뀔 수 있습니다.
따라서 정확하게 camera coordinate system → image coordinate로 기저를 변경하기 위한 행렬을 intrinsic 이라고 합니다.
intrinsic에는 크게 5가지 DoF가 있으며 이 값에 따라서 어떻게 image coordinate가 형성되는 지 달라집니다. 지금부터는 이 값을 이용하여 어떻게 intrinsic matrix를 만드는 지 살펴보도록 하겠습니다. 살펴볼 요소는 크게 4가지로 Scale, Rectangular Pixels, Offset, Skew 입니다.

Scale

카메라를 구입하면 카메라의 상세 스펙으로 adjustable focal length라는 부분이 있습니다. 이 수치는 주로 mm와 같은 길이 수치로 되어 있습니다. 이 값은 앞에서 설명한 \(f\)에 해당합니다.

\[(u, v) = (\alpha \frac{x}{z}, \alpha \frac{y}{z}) \tag{39}\]

Rectangular Pixels

위 예시에서 \(u, v\) 를 구하기 위하여 동일한 \(\alpha\)를 썻다는 것 또한 이상적인 환경입니다. 만약 image plane의 픽셀의 크기가 정사각형이 아니라 직사각형 형태이면 어떻게 될까요?
이상적인 환경에서 픽셀의 크기는 정사각형이지만 실제로는 height와 width의 크기가 다른 직사각형 형태인 경우가 많습니다. 따라서 앞의 \(u, v\) 좌표를 다음과 같이 표현하도록 하겠습니다.

\[(u, v) = (\alpha \frac{x}{z}, \beta \frac{y}{z}) \tag{40}\]

식 (40)에서 \(\alpha\)는 width 방향으로의 scaling factor이고 \(\beta\) 는 height 방향으로의 scaling factor입니다.

Offset

camera center와 image plane 의 수직선을 optical axis라고 합니다. 이상적인 환경에서는 optical center와 image plane의 origin은 서로 일치하지만, 실제 카메라 환경에서는 차이가 발생할 수 있습니다. 이 차이를 보상해 주는 것을 Offset 이라고 합니다.
Offset은 위 그림에서 \(O\) 와 \(O'\) 간의 image plane에서의 차이를 뜻하며 \(O\) 는 optical axis와 image plane의 수직선이 만나는 부분이고 \(O'\) 는 image plane의 중심점을 뜻합니다.

\[(u, v) = (\alpha \frac{x}{z} + x_{0}, \beta *\frac{y}{z} + y_{0}) \tag{41}\]

따라서 식 (41)과 같이 \(x_{0} , y_{0}\) 를 통하여 \((u, v)\) 를 보정하여 구합니다.

Skew

지금까지 image plane은 직사각형 형태를 가지고 있음을 가정하였습니다. 하지만 실제 image plane이 기울어져서 평행사변형 형태인 경우도 있습니다.

왼쪽 그림은 이상적인 image plane이고 X, Y 축은 직각 관계를 가집니다. 반면 오른쪽 그림은 기울어직 image plane입니다. 지금부터 왼쪽 image plane과 오른쪽 image plane 간의 관계를 파악하고 image plane을 변환하는 방법에 대하여 살펴보도록 하겠습니다.

지금부터 \(x'\)와 \(x\) 의 관계식과 \(y'\)와 \(y\) 의 관계식을 각각 알아보고 검정색 \(xy\) 평면을 하늘색 \(x'y'\) 평면으로 변환하는 식을 정의해 보겠습니다.

\[\cos{(90 - \theta)} = \frac{y}{y'} \tag{42}\]
\[\sin{(\theta)} = \frac{y}{y'} \tag{43}\]
\[y = y'\sin{(\theta)} \tag{44}\]
\[\therefore y' = \frac{y}{\sin{(\theta)}} \tag{45}\]

\[\sin{(90 - \theta)} = \frac{(x - x')}{y'} \tag{44}\]
\[y'\cos{(\theta)} = x - x' \tag{45}\]
\[x' = x - y'\cos{\theta} \tag{46}\]
\[y' = \frac{y}{\sin{(\theta)}} \tag{47}\]
\[x' = x - \frac{y\cos{(\theta)}}{\sin{(\theta)}} \tag{48}\]
\[\therefore x' = x - y\cot{(\theta)} \tag{49}\]

식(49)를 통하여 \(x'\)의 관계식을 찾았고 식 (45)를 통하여 \(y'\)의 관계식을 찾았습니다. 식 (45)와 식 (49)를 식 (41)에 대입하여 기울어진 평면 위의 좌표인 \((u, v)\) 를 정의해 보겠습니다.

\[u = \alpha \frac{x'}{z} + x_{0} = \alpha \frac{x - y\cot{(\theta)}}{z} + x_{0} \tag{50}\]
\[v = \beta \frac{y'}{z} + y_{0} = \beta \frac{\frac{y}{\sin{(\theta)}}}{z} + y_{0} = \beta \frac{y}{z\sin{(\theta)}} + y_{0} \tag{51}\]

Camera Intrinsic Matrix

식 (50), (51)을 이용하여 image plane의 scale, offset, skew를 고려한 \(u, v\) 좌표를 구하는 방법에 대하여 알아보았습니다. 다시 좌표 형태로 표현하면 다음과 같습니다.

\[(u, v) = (\frac{\alpha x}{z}x - \frac{\alpha\cot{(\theta)}} {z}y + x_{0}, \frac{\beta}{z\sin{(\theta)}}y + y_{0}) \tag{52}\]

앞에서 extrinsic을 구할 때, homogeneous coordinates 형태의 행렬 곱으로 나타낸 것과 같이 intrinsic을 구할 때에도 이와 같은 형태를 사용해 보도록 하겠습니다.
앞으로의 식 전개를 위해 식 (52)의 양변에 \(z\) 를 곱하면 다음과 같습니다. 아래 \(x', y'\) 는 앞에서 사용된 \(x', y'\) 와 무관하며 좌변과 우변의 관계를 나타내기 위하여 사용하였습니다.

\[(x', y') = (zu, zv) = (\alpha x - \alpha\cot{(\theta)}y + x_{0}, \frac{\beta}{\sin{(\theta)}}y + y_{0}) \tag{53}\]

아래와 같은 행렬 연산식인 식(54)를 정의해 보겠습니다. 식(54)에 추가 연산을 통하여 최종 좌표를 구할 수 있습니다.

\[\begin{bmatrix} x' \\ y' \\ z' \end{bmatrix} = \begin{bmatrix} \alpha & -\alpha\cot{(\theta)} & x_{0} \\ 0 & \beta\sin^{-1}{(\theta)} & y_{0} \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ z \end{bmatrix} \tag{54}\]

식 (54)의 우변의 3 x 3 행렬을 camera intrinsic matrix 라고하며 \(\kappa\) 라고 나타냅니다. 따라서 \(P_{c}\) 인 camera coordinate system에서의 좌표가 \(\kappa\) 인 camera intrinsic matrix와 곱해지면 이미지 상의 좌표인 \(P'\) 로 구해집니다.

\[P' = \kappa P_{c} \tag{55}\]
\[P' : \text{Homogeneous coordinates of the point in the image}\]
\[\kappa : \text{Camera Intrinsic Matrix}\]
\[P_{c} : \text{Homogeneous Coordinates of the point in the world wrt camera}\]

homogeneous coordinates인 \(P_{c}\) 로부터 최종 구하고자 하는 좌표 \(u, v\)를 구하면 다음 식과 같습니다.

\[\begin{bmatrix} x' \\ y' \\ z' \end{bmatrix} = \begin{bmatrix} x'/z' \\ y'/z' \\ 1 \end{bmatrix} \cong \begin{bmatrix} x'/z' \\ y'/z' \end{bmatrix} = \begin{bmatrix} u \\ v \end{bmatrix} \tag{56}\]

최종적으로 식 (56) 과정을 거치면 image plane 상의 pixel 위치인 \(u, v\) 를 구할 수 있습니다.
지금까지 알아본 내용을 통하여 camera coordinate system에서 intrinsic을 곱하여 image plane으로 좌표를 변환할 수 있었습니다.
추가적으로 intrinsic을 나타내는 가장 많이 사용하는 기호와 기술의 발전으로 생략을 많이하는 부분을 언급하면서 intrinsic의 개념은 마무리하도록 하겠습니다.

먼저 식 (54) 에서 사용한 \(\alpha\) 와 \(\beta\) 는 \(f_{x}, f_{y}\) 라는 용어로 많이 사용됩니다. \(\alpha, \beta\) 는 image plane 에서의 각 pixel의 가로와 세로의 scale을 나타냅니다. 이 scale의 단위를 focal length와 연관지어 나타낸 것이 \(f_{x}, f_{y}\) 입니다.
앞에서 focal length는 mm 와 같은 길이를 나타내는 수치를 사용한다고 하였습니다. 하지만 실제로는 픽셀 단위로 표현을 많이 합니다.
이미지의 픽셀은 이미지 센서 셀에 대응됩니다. 따라서 focal length와 이미지 센서 셀 크기의 상대적인 크기값을 scale로 나타낼 수 있습니다. 따라서 \(f_{x}\) 는 (focal length / 셀 가로 길이)로 나타낼 수 있고 \(f_{y}\) 는 (focal length / 셀 세로 길이)로 나타낼 수 있습니다. 이와 같이 픽셀 단위로 길이를 나타내면 이미지에서의 길이 단위가 통일 되기 때문에 사용이 편해집니다.

현재 기술의 발달로 앞에서 정의한 camera intrinsic matrix를 단순화 할 수 있습니다.
먼저 \(f_{x} = f_{y} = f\) 로 단순화 할 수 있습니다. 앞에서 픽셀의 크기 (이미지 센서 셀 크기)가 가로와 세로가 다를 수 있기 때문에 \(\alpha (f_{x}), \beta (\f_{y})\) 로 scale을 나타내었습니다. 하지만 현대 기술을 이용하면 정사각형 크기의 픽셀을 만드는 데 어려움이 없다고 알려져 있습니다. 따라서 \(f_{x} = f_{y} = f\) 로 많이 사용하고 있습니다.
그리고 image plane 또한 기울어지지 않기 때문에 \(\theta = \frac{\pi}{2}\) 로 둘 수 있습니다. 따라서 \(\cot{(\frac{\pi}{2})} = 0, \sin^{-1}{(\frac{\pi}{2})} = 1\) 을 사용할 수 있습니다.
위 2가지 내용을 이용하여 camera intrinsic matrix를 단순화하면 다음과 같습니다.

\[\begin{bmatrix} \alpha & -\alpha\cot{(\theta)} & x_{0} \\ 0 & \beta\sin^{-1}{(\theta)} & y_{0} \\ 0 & 0 & 1 \end{bmatrix} \Longrightarrow \begin{bmatrix} f & 0 & x_{0} \\ 0 & f & y_{0} \\ 0 & 0 & 1 \end{bmatrix} \tag{57}\]

Find the Minimum Stretching Direction of Positive Definite Matrices

아래 선형대수학 관련 사전 지식이 있으면 이해하기 편리합니다.
고유값과 고유벡터
대칭행렬의 대각화
이차형식과 원추곡선
특이값 분해

Camera Calibration with Example in Python

추가 내용 : 이미지 crop과 resize에 따른 intrinsic 수정 방법

이번 내용은 어떤 이미지를 crop과 resize를 하였을 때, intrinsic이 어떻게 변하는 지 살펴보도록 하겠습니다.
intrinsic에서 사용되는 유효한 값은 fx, fy, cx, cy로 가정하겠습니다.

intrinsic은 normalized image plane에서 image plane에 영상을 대응하기 위하여 사용하는 값입니다.
위 그림에서 \(X_{c}, Y_{c}, Z_{c}\) 는 카메라 좌표계를 의미하고 \(x = X_{c} / Z_{c}\), \(y = Y_{C} / Z_{C}\) 를 이용하여 normalized image plane으로 \((x, y)\) 좌표로 좌표값을 변경합니다.
마지막으로 아래와 같은 intrinsic값을 이용하여 image plane으로 픽셀 값에 대응 시킵니다.

\[\text{intrinsic} = \begin{bmatrix} f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1 \end{bmatrix}\]

이번 글에서는 기존의 intrinsic 파라미터가 있는 상황에서 image plane의 image의 크기가 달라졌을 때, intrinsic을 어떻게 변경해야 하는 지 확인합니다.
먼저 image plane의 축인 (0, 0) 부근의 width와 height 방향으로 crop이 발생 시 intrinsic의 변화를 살펴보면 다음과 같습니다.

위 그림과 같이 image plane의 (0, 0) 부근에서 crop이 발생하면 normalized image plane → image plane 으로 대응되는 점의 위치가 달라집니다. \(P_{\text{image}}\) 의 위치가 crop으로 인하여 width, height 방향으로 좌표 값이 각각 감소한 것을 알 수 있습니다.

위 그림과 같이 crop으로 인한 좌표 값의 상대적인 변화를 알 수 있습니다. 이 변화를 적용하기 위하여 실제 crop된 크기 만큼 \(c_{x}, c_{y}\) 에 반영해 주면 됩니다. 앞의 intrinsic 연산 수식에서 \(c_{x}, c_{y}\) 는 translation 역할을 하기 때문에 줄어든 값 만큼 아래와 같이 반영하면 됩니다.

\[u = f_{x} x + (c_{x} - \text{crop}_{c_{x}})\]
\[v = f_{y} y + (c_{y} - \text{crop}_{c_{y}})\]

반면 위 그림과 같이 이미지 좌표계의 시작인 왼쪽 상단이 아닌 우측 하단에서 crop이 발생한 경우 intrinsic에 변화가 없는 것을 확인할 수 있습니다. 이미지 끝 쪽 crop은 image plane 에서의 좌표계 이동과 무관하기 때문입니다.

이번에는 resize가 발생하였을 때, intrinsic의 변화를 살펴보겠습니다. 적용되는 수식은 위 그림과 같습니다.
resize는 crop과 다르게 \(f_{x}, c_{x}\) 또는 \(f_{y}, c_{y}\) 모두에 영향을 끼칩니다. resize 라는 배율에 따라서 normalized image plane의 좌표와 곱해지는 \(f_{x}, f_{y}\) 뿐만 아니라 translation 역할을 하는 \(c_{x}, c_{y}\) 값 또한 그 배율만큼 조정되어야 하기 때문입니다. 간단하게 전체적으로 scale과 translation 모두 resize가 반영되었다고 보면 됩니다.
따라서 resize에 대한 결과는 다음과 같습니다.

\[u = \text{resize}_{x} (f_{x}x + c_{x}) = \text{resize}_{x}f_{x}x + \text{resize}_{x}c_{x}\]
\[u = \text{resize}_{y} (f_{y}y + c_{y}) = \text{resize}_{y}f_{y}y + \text{resize}_{y}c_{y}\]

일반적으로 crop과 resize를 할 때에는 crop을 먼저하여 원하는 부분만 선택한 다음에 resize를 적용하여 원하는 사이즈의 이미지를 구합니다. 따라서 다음 순서를 따릅니다.

① 이미지 좌측 상단에서 width, height 방향으로 각각 crop할 사이즈를 정한 뒤 crop을 적용합니다.
- \[c_{x} -= \text{crop}_{x}\]
- \[c_{y} -= \text{crop}_{y}\]
② resize 비율에 맞게 아래와 같이 resize를 적용합니다.
- \[f_{x} *= \text{resize}_{x} f_{x}\]
- \[f_{y} *= \text{resize}_{y} f_{y}\]
- \[c_{x} *= \text{resize}_{x} c_{x}\]
- \[c_{y} *= \text{resize}_{y} c_{y}\]

위 내용을 파이썬 코드로 적용하면 아래와 같습니다.

def get_cropped_and_resized_intrinsic(
    fx, fy, cx, cy, crop_cx, crop_cy, resize_fx, resize_fy):
    '''
    crop_cx : crop size of u axis orientation in image plane
    crop_cy : crop size of v axis orientation in image plane
    resize_fx : resize ratio of width orientation in image plane
    resize_fy : resize ratio of height orientation in image plane    
    '''

    cx -= crop_cx
    cy -= crop_cy

    fx *= resize_fx
    fy *= resize_fy

    cx *= resize_fx
    cy *= resize_fy

    return fx, fy, cx, cy

Vision 관련 글 목차

Camera calibration checkerboard OpenCV camera calibration Camera intrinsic calibration camera calibration이란 camera calibration opencv-python Camera calibration GitHub Camera intrinsic matrix OpenCV calibration

캘리브레이션 원리 - kaellibeuleisyeon wonli

기기 가동 시간 증가

기계 성능 향상

기계/제조 역량에 대한 지식 향상

표적 집중 유지보수

일정에 따른 유지보수 가능

기계 성능 입증

품질 보증 절차 및 표준 준수

전문적인 유지보수 서비스 제공

자세히

자세히

목차

이미지 형성과 핀홀 모델 카메라

Camera Extrinsic Matrix with Example in Python

Camera Intrinsic Matrix with Example in Python

Find the Minimum Stretching Direction of Positive Definite Matrices

Camera Calibration with Example in Python

추가 내용 : 이미지 crop과 resize에 따른 intrinsic 수정 방법

이미지 형성과 핀홀 모델 카메라

Pinhoe camera

Geometric camera calibration

Camera Extrinsic Matrix with Example in Python

Change of coordinates by rotation

Change of basis by rotation

Change of coordinates by translation

Change of coordinates by translation

Extrinsic Camera Matrix

Degrees of Freedom

Camera Intrinsic Matrix with Example in Python

Projection of a point

Scale

Rectangular Pixels

Offset

Skew

Camera Intrinsic Matrix

Find the Minimum Stretching Direction of Positive Definite Matrices

Camera Calibration with Example in Python

추가 내용 : 이미지 crop과 resize에 따른 intrinsic 수정 방법

관련 게시물

광고하는

최근 소식

광고하는

포퓰러

광고하는

에 대한

합법적인

돕다

사회의