Top

컴퓨터 비전을 위한 다중 시점 기하학 2/e [카메라를 위한 수학]

  • 원서명Multiple View Geometry in Computer Vision 2nd Edition (ISBN 9780521540513)
  • 지은이리차드 하틀리(Richard Hartley), 앤드류 지서만(Andrew Zisserman)
  • 옮긴이추정호
  • ISBN : 9791161756646
  • 65,000원
  • 2022년 08월 31일 펴냄
  • 페이퍼백 | 844쪽 | 188*235mm
  • 시리즈 : 데이터 과학

책 소개

요약

여러 개의 카메라를 이용해 삼차원 물체를 촬영한 후, 여러 이미지로부터 삼차원 물체를 역으로 복원하는 문제를 다루는 책이다. 카메라 이미지 하나에 관한 기하학인 사영기하학을 설명하고 이중 시점, 삼중 시점, 사중 시점의 기하학을 소개한 후에 이를 이용해 실제로 삼차원 물체를 복원하는 알고리듬을 제시한다. 디지털 카메라의 비용이 저렴한 현재, 이런 문제를 효율적으로 해결하면 유용할 많은 응용 분야가 있기 때문에 컴퓨터 비전을 전공하는 연구자에게 좋은 책이다.

추천의 글

“컴퓨터 비전의 연구는 그 동안 실용적이며 이론적으로도 뛰어난 성공을 거두었다.
실용적인 측면에서 한 가지 예를 들면 컴퓨터 비전 기술을 사용해 일반 도로 또는 험한 지형에서 자동차와 트럭과 같은 차량을 안내할 수 있는 가능성이 수년 전 유럽과 미국, 일본에서 입증됐다. 이를 위해서는 매우 정교한 실시간 3차원 동적 장면 분석 기능이 필요하다. 오늘날 자동차 회사들은 이러한 기능들을 점점 사용하고 있다.
이론적 측면에서 기하 컴퓨터 비전(Geometric Computer Vision)이라고 부를 수 있는 영역에서 몇 가지 놀라운 진전이 이루어졌다. 이것은 물체 모양과 카메라 매개변수의 함수로서 다른 시점에서 볼 때 물체의 모양이 바뀌는 방식에 대한 설명을 포함한다. 이러한 성과는 기하학의 고전 분야와 최신 이론을 포함하는 매우 정교한 수학을 사용하지 않고는 달성하지 못했을 것이다. 이 책은 특히 세계의 물체 이미지 사이에 존재하는 복잡하고 아름다운 기하학적 관계를 다룬다. 이러한 관계를 분석하는 것은 그 자체로 중요하다. 이는 외형(appearance)에 대한 설명을 하려는 과학의 목표 중 하나이기 때문이다. 또한 이런 이해를 통해 개발할 수 있는 애플리케이션이 무궁무진하기에 분석은 중요하다.
이 책의 저자들은 기하 컴퓨터 비전 분야의 선구자이자 전문가다. 이들은 매우 도전적인 일을 성공적으로 해냈다. 근간이 되는 기하학 개념을 이해하는 데 필요한 수학을 간단하고 쉽게 접근할 수 있는 방식으로 전달했고, 이들과 전 세계의 다른 연구자들이 얻은 결과를 매우 광범위하게 포함했으며, 노이즈가 있는 이미지 측정과 기하학의 상호작용을 분석했고, 이러한 이론적 결과를 알고리듬 형식으로 표현해 컴퓨터 코드로 쉽게 변환할 수 있도록 많은 실례를 제시했고, 개념을 설명하고 이론의 적용 범위를 보여주는 많은 예들을 제시했다.”
— 올리비에 포즈하(Olivier Faugeras)

“저자들은 다중 시점 기하학의 주류에 있는 중요한, 고전적인 것과 현대적인 기술들을 명쾌하고 일관성 있게 설명한다. 다중 시점 기하학의 전통적인 것과 현대적인 기술의 이론적인 배경에 관심이 있는 독자에게 적극적으로 이 책을 추천한다.”
— 컴퓨팅 리뷰(computing review)

“이 책은 어려운 개념을 명쾌하게 설명하고, 이를 사용하기 위해 필요한 수식을 소개한다. 이론과 그에 따른 결과를 독자들이 이해하고 구현하기 쉬운 방식으로 설명한다. 이러한 내용들이 잘 정리돼 있으며 참고문헌을 찾아보기 쉬우며, (조금 더 추가되면 더 유용할) 좋은 예와 유용한 노트, 각 장의 끝에 연습문제를 제공한다. 명쾌한 접근법과 설명으로, 강의나 이 분야에 관심 있는 연구자들에게 참고문헌으로 활용하기에도 이상적이다.”
— BMVA News

이 책의 구성

총 6개의 부로 구성돼 있으며 7개의 짧은 부록이 있다. 각 부에서 새로운 기하학적 관계를 소개한다. 배경에 대한 호모그래피(homography), 단일 시점에 대한 카메라 행렬, 이중 시점에 대한 기본 행렬, 삼중 시점에 대한 삼중 초점 텐서, 사중 시점에 대한 사중 초점 텐서다. 각각의 경우에 대해 관계, 속성 및 응용을 설명하는 장과 이미지 측정에서 추정하는 알고리듬을 설명하는 장이 있다. 추정 알고리듬은 간단하고 저렴한 접근 방식부터 현재 가장 좋은 것으로 여겨지는 최적의 알고리듬에 이르기까지 다양하게 설명한다.

0부: 배경. 0부는 다른 부에 비하면 지침서에 해당한다. 2차원 공간과 3차원 공간의 사영 기하학의 (이상점(ideal point)과 절대 원뿔 곡선과 같은) 중요한 개념을 소개한다. 사영기하학을 어떻게 표현하고 조작하고 추정하는지 그리고 원근 왜곡을 제거하기 위해 평면의 이미지를 수정하는 것과 같은 컴퓨터 비전의 다양한 목표와 어떻게 관련되는지를 설명한다.

1부: 단일 시점 기하학. 3차원 공간에서 2차원 이미지로의 원근 사영을 모델링하는 다양한 카메라를 정의하고 구조를 탐구한다. 보정 대상을 이용하는 기존 기술의 추정과 소실점(vanishing point) 및 소실선(vanishing line)을 이용하는 카메라 보정을 설명한다.

2부: 이중 시점 기하학. 2부에서는 카메라 두 개의 등극 기하학, 이미지 간의 점대응에서 사영 재구성, 사영 모호성을 해결하는 방법, 최적 삼각 측량, 평면을 통한 사진 간의 전송을 설명한다.

3부: 삼중 시점 기하학. 카메라 세 개의 삼중 초점 기하학을 설명한다. 사진 두 개에서 세 번째 사진으로 점대응과 선대응으로 전송하기, 점과 선대응에서 형상 계산과 카메라 행렬의 검색을 포함한다.

4부: N-시점. 4부의 목적은 두 가지다. 우선, 삼중 시점 기하학을 사중 시점으로 (부분적으로) 확장해 N-시점에 적용할 수 있는 추정 방법을 설명한다. 토마시(Tomasi)와 카나드(Kanade)의 인수분해 알고리듬을 이용해 여러 이미지에서 구조와 움직임을 동시에 계산하 는 것을 소개한다. 그리고 3부에서 다뤘지만 공통성을 강조해 좀 더 심도 있게 이해할 수 있는 주제를 다룬다. 예컨대 대응과 자동 보정 및 모호함에 대한 다중선형 시점 제약 조건(Multi-Linear View Constrints)을 유도한다.

부록. 텐서, 통계학, 매개변수 추정, 선형 대수와 행렬 대수, 반복 추정법, 성긴 행렬(Sparse Matrix)의 역행렬과 특별한 사영변환에 대해 설명한다.

상세 이미지

저자/역자 소개

지은이의 말

컴퓨터 비전 분야에서 기본으로 고민하는 문제는 주어진 다중 이미지를 이용해 현실의 장면을 재현하는 것이다. 이 문제를 해결하려면 사영기하학과 사진 측량법을 이용하면 된다. 이 책에서는 기하학적 원리, 카메라 사영 행렬, 기본 행렬, 삼중 초점 텐서를 이용한 대수적 표현을 다룬다. 주어진 다중 이미지에서 장면을 재현하며, 이러한 이론과 계산 방법론을 실제 예를 통해 살펴본다. 개정판에서는 중요한 개념에 대해 최신 사례와 부록을 통해 더 자세히 설명한다. 그리고 1판 이후에 나타난 주요 연구를 추가했다. 이 책을 읽는 데 필요한 배경 지식에 대해서도 상세히 설명하고 있어, 선형 대수학과 기본 수치 해석학을 알고 있다면 이 책을 통하여 사영기하학과 추정 알고리듬을 이해하고 직접 구현할 수 있을 것이다.

지은이 소개

리차드 하틀리(Richard Hartley)

오스트레일리아 국립 대학교의 교수이자 캔버라의 NICTA(호주 국립 정보통신기술 연구소) 연구원이다. 주로 컴퓨터 비전을 연구하고 있다.

앤드류 지서만(Andrew Zisserman)

선더랜드 대학교(Sunderland Polytechnic)에서 Mathematical Tripos 파트 III와 이론물리학의 박사 학위를 받았다.

옮긴이의 말

대학 시절의 나는 학교가 있는 대전에서 고향인 대구 사이를 기차로 왕래했다. 경부선 기차는 구름도 쉬어 간다는 험준한 추풍령 고개를 넘어갔다. 창가 풍경은 산뿐이었다. 그런데 자세히 관찰하니 가까이 있는 산이 더 빨리 뒤로 가고 멀리 있는 산은 앞으로 가는 것처럼 보였다. 한참 고민 끝에 이런 현상은 어두운 밤에 보름달이 움직이는 나를 따라오는 것처럼 느껴지는 것과 같음을 깨달았다. 가까이 있는 것은 뒤로 가고 멀리 있는 것은 앞으로 가므로 중간 어디쯤에 고정점이 있을 것 같았고 이것을 계산하는 방법을 나름 고민했다.
이런 고민에 해답을 주는 것이 사영(그림자)기하학이다(이 책 내용 중에 여기에 대한 해답이 있으며 고민했던 고정점은 존재하지 않는다). 르네상스 시대에 화가들이 3차원 물체를 2차원 평면에 더 사실적으로 표현하기 위해 원근법에 대한 연구가 활발해지면서 사영기하학의 기본 원리는 정립됐지만 19세기 초에 본격적으로 정립됐다. 그 후로, 최근에 필즈상을 수상한 허준이 교수의 전공 분야인 대수기하학으로 발전하게 된다.
사영은 유럽 사상에 오랜 뿌리를 갖고 있다. 칸트의 인식론이 나오기 전까지 플라톤의 동굴의 비유에서 우리가 관찰할 수 있는 것은 실체의 사영에 불과하다는 생각이 널리 퍼져 있었다. 이것은 형이상학적인 비유에 불과하지만 실세계에서 비슷한 것이 발견됐다. 양자역학에서 물체의 정확한 위치는 알 수 없고 관찰할 수 있는 것은 실제 물체의 확률적 사영이라는 것이다. 실제로 반물질을 예측해 노벨 물리학상을 받은 영국의 디랙은 양자역학을 연구할 때 학부 시절에 잠깐 심취했던 사영기하학이 많은 도움이 됐다고 언급했다. 이 책은 여기에서 한 걸음 더 나아가는 문제를 고민한다. 같은 물체를 동시에 여러 카메라로 촬영했을 때 여러 개의 사진에서 3차원 형상을 어떻게 복원할 수 있을까? 디지털 카메라의 비용이 저렴하기에 좋은 알고리듬이 개발되면 응용할 수 있는 분야가 무궁무진해 많은 연구가 활발하게 진행되고 있는 분야이다.
이 책은 사영기하학의 기초에서 시작해 이중 시점, 삼중 시점, 다중 시점 기하학으로 설명을 진행한다. 기하학에 대한 기초를 다지고 또 수치 계산에서 발생하는 어쩔 수 없는 노이즈를 다루는 알고리듬에 대해서 매우 자세히 설명하고 있어서 컴퓨터 비전 관련 엔진을 개발하는 연구자에게 많은 도움이 될 것으로 기대한다. 학부에서 수학을 전공했지만 당시에는 비유클리드 기하학에 대한 강의가 없어서 이렇게 다양하게 응용할 수 있는 사영기하학을 책을 번역하면서 알게 됐다. 번역하는 동안 기하학의 위력을 실감하며 흥미진진하게 작업할 수 있었다.

옮긴이 소개

추정호

KAIST에서 수학과 기계공학을 공부하고 이론 유체역학으로 박사 학위를 받았다. 증권사에서 퀀트로서 금융공학 분야의 일을 하고 있으며, 클라우드 컴퓨터를 금융권에 도입했고 세계 인명사전에 등재됐다. 현실 세계를 수학으로 모델링한 후에 컴퓨터로 시뮬레이션하는 것을 좋아한다. 양자 컴퓨터, 인공지능, 음악 수학, 게임 이론에 관심이 많다. 삭막한 정서를 보완하고자 피아노를 연습하고 굳은 몸을 풀기 위해 단전호흡을 하고 있다.

목차

목차
  • 1장. 소개-다중 시점 기하학 둘러보기
    • 1.1 소개-어디서나 볼 수 있는 사영기하
    • 1.2 카메라 사영
    • 1.3 다중 시점에서 재구성
    • 1.4 삼중 시점 기하학
    • 1.5 사중 시점 기하학과 n개의 장면 재구성
    • 1.6 전송
    • 1.7 유클리드 재구성
    • 1.8 자동 보정
    • 1.9 성과 I: 3차원 그래픽 모델
    • 1.10 성과 II: 비디오 증강

  • 0부. 배경: 사영기하학, 변형과 추정
  • 2장. 2차원의 사영기하학과 변환
    • 2.1 평면 기하학
    • 2.2 2차원 사영평면
    • 2.3 사영변환
    • 2.4 변환 계층
    • 2.5 1차원 사영기하학
    • 2.6 사영면의 위상 수학
    • 2.7 이미지에서 아핀변환과 거리 속성의 복원
    • 2.8 원뿔의 추가 속성
    • 2.9 고정점과 고정선
    • 2.10 나가면서

  • 3장. 3차원 사영기하학과 변환
    • 3.1 점과 사영변환
    • 3.2 평면, 선, 이차 곡면의 표현과 변환
    • 3.3 꼬인 삼차 곡선
    • 3.4 변환 계층
    • 3.5 무한면
    • 3.6 절대 원뿔
    • 3.7 절대 쌍대 이차 곡선
    • 3.8 나가면서

  • 4장. 2차원 사영변환의 추정
    • 4.1 직접 선형변환(DLT) 알고리듬
    • 4.2 여러 가지 비용함수
    • 4.3 통계적 비용함수와 최대 우도 추정
    • 4.4 변환 불변성과 정규화
    • 4.5 반복 최소화 방법
    • 4.6 알고리듬의 실험적 비교
    • 4.7 탄탄한 추정
    • 4.8 단응사상의 자동 계산
    • 4.9 나가면서

  • 5장. 알고리듬 평가와 오차 분석
    • 5.1 성능의 한계
    • 5.2 추정된 변환의 공분산
    • 5.3 공분산의 몬테카를로 추정
    • 5.4 나가면서

  • 1부. 카메라 기하학과 단일 시점 기하학
  • 6장. 카메라 모델
    • 6.1 유한 카메라
    • 6.2 사영 카메라
    • 6.3 무한 카메라
    • 6.4 다른 카메라 모델
    • 6.5 나가면서

  • 7장. 카메라 행렬 𝙿의 계산
    • 7.1 기본 방정식
    • 7.2 기하 오류
    • 7.3 제한된 카메라 추정
    • 7.4 방사형 왜곡
    • 7.5 나가면서

  • 8장. 단일 시점 형상의 추가 사항
    • 8.1 평면, 선, 원뿔에서 사영 카메라의 동작
    • 8.2 매끄러운 표면 이미지
    • 8.3 이차 곡면에 대한 사영 카메라의 동작
    • 8.4 카메라 중심의 중요성
    • 8.5 카메라 보정과 절대 원뿔의 이미지
    • 8.6 소실점과 소실선
    • 8.7 아핀 3차원 측정과 재구성
    • 8.8 단일 시점에서 카메라 보정 𝙺 결정
    • 8.9 단일 시점 재구성
    • 8.10 보정 원뿔
    • 8.11 나가면서

  • 2부. 이중 시점 기하학
  • 9장. 등극 기하학과 기본 행렬
    • 9.1 등극 기하학
    • 9.2 기본 행렬 𝙵
    • 9.3 특별한 운동에서 발생하는 기본 행렬
    • 9.4 기본 행렬의 기하학적 표현
    • 9.5 카메라 행렬 찾기
    • 9.6 필수 행렬
    • 9.7 나가면서
  • 10장. 카메라와 구조의 3차원 재구성
    • 10.1 복원 방법 개요
    • 10.2 재구성의 모호함
    • 10.3 사영 재구성 정리
    • 10.4 계층적 재구성
    • 10.5 정답값을 사용하는 직접 재구성
    • 10.6 나가면서

  • 11장. 기본 행렬 𝙵의 계산
    • 11.1 기본 방정식
    • 11.2 정규화된 8점 알고리듬
    • 11.3 대수적 최소화 알고리듬
    • 11.4 기하 거리
    • 11.5 알고리듬의 실험적 평가
    • 11.6 𝙵의 자동 계산
    • 11.7 𝙵 계산의 특별한 경우
    • 11.8 다른 객체의 대응
    • 11.9 퇴화
    • 11.10 𝙵 계산의 기하학적 해석
    • 11.11 등극선들의 포락선
    • 11.12 이미지 교정
    • 11.13 나가면서

  • 12장. 구조 계산
    • 12.1 문제 설명
    • 12.2 선형 삼각 측량법
    • 12.3 기하 오차 비용함수
    • 12.4 샘프슨 근사(1차 기하 보정)
    • 12.5 최적해
    • 12.6 추정한 3차원 점의 확률 분포
    • 12.7 직선 재구성
    • 12.8 나가면서

  • 13장. 장면 평면과 단응사상
    • 13.1 주어진 평면의 단응사상과 그 반대의 경우
    • 13.2 𝙵와 이미지 대응이 주어질 때 단응사상이 유도하는 평면
    • 13.3 평면이 유도하는 단응사상에서 𝙵의 계산
    • 13.4 무한 단응사상 𝙷∞
    • 13.5 나가면서

  • 14장. 아핀 등극 기하학
    • 14.1 아핀 등극 기하학
    • 14.2 아핀 기본 행렬
    • 14.3 두 이미지의 점대응에서 𝙵A의 추정
    • 14.4 삼각 측량
    • 14.5 아핀 재구성
    • 14.6 네케르 반전과 박육조(薄肉彫)
    • 14.7 운동의 계산
    • 14.8 나가면서

  • 3부. 삼중 시점 기하학
  • 15장. 삼중 초점 텐서
    • 15.1 삼중 초점 텐서의 기본 기하학
    • 15.2 삼중 초점 텐서와 텐서 표기법
    • 15.3 전송
    • 15.4 세 시점에 대한 기본 행렬
    • 15.5 나가면서

  • 16장. 삼중 초점 텐서 T의 계산
    • 16.1 기본 방정식
    • 16.2 정규화된 선형 알고리듬
    • 16.3 대수적 최소화 알고리듬
    • 16.4 기하 거리
    • 16.5 알고리듬의 실험적 평가
    • 16.6 T의 자동 계산
    • 16.7 T 계산의 특수한 경우
    • 16.8 나가면서

  • 4부. N개 시점 기하학
  • 17장. N-선형성과 다중 시점 텐서
    • 17.1 이중 선형 관계
    • 17.2 삼중 선형 관계
    • 17.3 사중 선형 관계
    • 17.4 면 4개의 교차점
    • 17.5 셈법 논리
    • 17.6 독립 방정식의 개수
    • 17.7 방정식 선택
    • 17.8 나가면서

  • 18장. N-시점 계산 방법
    • 18.1 사영 재구성-뭉치 조정
    • 18.2 아핀 재구성-분해 알고리듬
    • 18.3 비강체 분해
    • 18.4 사영 분해
    • 18.5 평면을 사용한 사영 재구성
    • 18.6 시퀀스에서 재구성
    • 18.7 나가면서

  • 19장. 자동 보정
    • 19.1 소개
    • 19.2 대수적 체계와 문제 서술
    • 19.3 절대 이중 이차 곡면을 이용한 교정
    • 19.4 크루파 방정식
    • 19.5 계층화된 해
    • 19.6 회전 카메라에서 보정
    • 19.7 평면에서 자동 보정
    • 19.8 평면 운동
    • 19.9 단일 축 회전-턴테이블 운동
    • 19.10 스테레오 장비의 자동 보정
    • 19.11 나가면서

  • 20장. 쌍대성
    • 20.1 칼슨-바인스할 쌍대성
    • 20.2 축약 재구성
    • 20.3 나가면서

  • 21장. 카이렐러티
    • 21.1 준 아핀변환
    • 21.2 카메라 앞면과 뒷면
    • 21.3 3차원 점 집합
    • 21.4 준 아핀 재구성의 계산
    • 21.5 카이렐러티에 대한 변환의 영향
    • 21.6 방향
    • 21.7 카이럴 부등식
    • 21.8 세 번째 시점에서 보이는 점들
    • 21.9 점 사이의 위치
    • 21.10 나가면서

  • 22장. 퇴화 구성
    • 22.1 카메라 후방교회
    • 22.2 이중 시점에서 퇴화
    • 22.3 칼슨-바인스할 쌍대성
    • 22.4 삼중 시점의 임계 구성
    • 22.5 나가면서
  • 5부. 부록
    • A1 텐서 표기법
    • A2 가우스(노말)와 χ² 분포
    • A3 모수 추정
    • A4 행렬의 성질과 분해
    • A5 최소 제곱의 최소화
    • A6 반복 추정법
    • A7 특수 평면 사영변환

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안