책 소개
2022년 대한민국학술원 우수학술도서 선정도서
요약
수학과 컴퓨터 과학 분야에서 문제를 해결하는 절차를 의미했던 알고리즘은 어느새 전 세계인의 일상에 큰 영향을 끼치는 기술로 자리잡았다. 알고리즘은 우리의 삶을 더 효율적이고, 재밌고, 편리하게 만들었지만, 동시에 인간의 기본권을 침해하는 사례도 급증하고 있다. 알고리즘으로 인한 개인 정보 유출, 통계 모델에 따른 인종 및 성 차별 등 문제를 해결하려면, 이 기술 뒤에 숨겨진 과학을 이해하고 개선하는 노력이 시급하다. 이 책은 과학에 기초한 프라이버시와 공정성, 투명성, 책임성 등의 윤리적 원칙을 제시한다. 또한, 과학 탐구를 계속하면서도 윤리적 원칙을 어떻게 코드에 잘 포함시킬 수 있는지를 설명한다.
추천의 글
"윤리가 알고리즘에 '인코딩'될 수 있을까? 마이클 키언스와 아론 로스는 시의적절하게 알고리즘 기반 의사결정에 내재된 다양한 문제의 알고리즘 해법을 제시한다. 체계적이면서도 재미있게, 인간이 하는 판단의 지속적 중요성을 놓치지 않고, 알고리즘에서의 프라이버시와 공정성, 해석 가능성과 관련된 문제를 해결할 수 있는 잠재적 해법을 제시한다.”
- 도로테아 바우어(Dorothea Baur) 박사
/ 국제 기술 윤리 컨설턴트이자 작가
"지옥으로 가는 길은 선의의 알고리즘으로 포장돼 있을까? 많은 이가 선의의 알고리즘으로 이뤄졌을 것이라 생각한다. 적절한 시점에 두 명의 전문가가 좀 더 냉철한 시각으로 쓴 이 책은 분명하고 간결하게 문제 이해와 해법 탐색을 하고 있어, 윤리 알고리즘이라는 새로운 과학 분야에 대한 완벽한 지침서라 할 수 있다."
- 페드로 도밍고스(Pedro Domingos) 박사
/ 워싱턴 대학교 컴퓨터 과학과 교수이자 『마스터 알고리즘(The Master Algorithm)』 저자
"데이터 과학 혁명은 중요한 윤리적 기반을 갖고 있다. 저자들은 인공지능 윤리학이 자체적인 학문으로 발전하는 데 필요한 중요한 사례를 제공한다. 윤리 알고리즘은 알고리즘화된 사회가 꼭 종말론적일 필요는 없다는 것을 보여준다. 인공지능에 관심이 있다면 누구나 필수로 이 책을 읽어야 할 것이다."
- 마르코스 로페즈 데 프라도(Marcos Lopez de Prado) 박사
/ 트루 파지티브 테크놀로지스(True Positive Technologies) CEO이자 「포트폴리오 관리 저널(The Journal of Portfolio Management)」의 2019년 올해의 퀀트)
"이 책은 오늘날 전례 없이 데이터를 이용할 수 있는 세상에서 알고리즘이 맞닥뜨린 구체적이고 실제적인 사례를 통해 가까운 미래의 위협을 잘 보여주고 있다. 윤리 알고리즘은 명확하고 비범한 통찰력으로 가득 찬 책이다."
- 캐롤 라일리(Carol E. Reiley)
/ Drive.ai 공동설립자, 고문 및 이사회 멤버
이 책에서 다루는 내용
최근 발행된 서적이나 뉴스, 과학 기사를 찾아보면 알고리즘이 개인이나 특정 그룹의 사람들에게 해를 끼친 사례를 쉽게 찾아볼 수 있다. 예를 들어, 온라인 대조 실험 결과에 따르면 구글 검색의 결과나 페이스북 광고나 그 외 인터넷 서비스들에서 인종이나 성별, 정치 및 기타 유형에 따른 편향이 존재한다는 사실을 알 수 있다. 최근에는 범죄 형량을 결정하는 데 사용된 예측 모델이 인종을 차별한다는 문제로 인해 통계학자와 범죄학자, 법학자들 간의 폭발적인 논쟁이 일어나기도 했다. 또한 알고리즘 분석 도구의 발전으로 인해 데이터의 상관관계를 빠르고 효율적으로 찾아낼 수 있게 되면서 돈과 시간을 들였지만 결국은 사실이 아닌 것으로 판명된 연구 결과가 빈번하게 나타났다. 현대 알고리즘은 사회의 가장 소중한 가치조차 짓밟을 수 있다는 사실이 점점 분명해지고 있다.
이 책에서 제시하는 이러한 노력은 알고리즘이 강화하거나 감시하는 사회적 가치를 결정하거나 결정하는 데 사용돼야 한다고 제안하는 것은 아니다. 공정성, 프라이버시, 투명성, 해석 가능성, 도덕성의 정의는 인간의 판단 영역에 확고히 남아 있어야 한다. 이것이 우리가 열정을 갖고 설명하는 이유 중 하나다. 궁극적으로는 과학자, 엔지니어, 변호사, 규제 기관, 철학자, 사회복지사 그리고 관련 시민 간의 협력이 있어야 한다. 그러나 프라이버시 같은 사회적 규범을 정확하고 정량적으로 정의할 수 있다면 알고리즘에게 이를 ‘설명’하고 따르게 할 수 있다. 여기서 가장 큰 어려움은 대중이 공감할 수 있도록 사회적 가치에 대한 정량적 정의를 개발하는 것이다. 그리고 프라이버시 같은 분야에서는 (완벽할 수는 없지만) 비교적 잘해왔고, 공정성 같은 분야는 어렵지만 발전하고 있다. 그리고 해석 가능성이나 도덕성 같은 가치는 아직 갈 길이 멀다. 그러나 어려움에도 불구하고 우리가 ‘프라이버시’와 ‘공정성’ 같은 단어를 사용할 때 의미하는 바를 극단적으로 정확하게 하려는 노력은 그 자체로 큰 의미가 있다. 왜냐하면 이는 알고리즘에 필수적이기도 하고, 이러한 개념에 대한 우리의 직관에 숨겨진 미묘함, 결함, 절충점 등이 종종 드러나기 때문이다.
목차
목차
- 1장. 알고리즘 프라이버시 익명에서 소음으로
- 2장. 알고리즘 공정성 패리티에서 파레토까지
- 3장. 알고리즘 게임 이론
- 4장. (데이터에 미혹돼) 정원에서 길을 잃다
- 5장. 위험한 연구 해석 가능성과 도덕성 그리고 특이점
관련 블로그 글
익명화된 데이터의 위험성, <알고리즘 윤리>
많은 사람이 익명은 안전하다고 믿는다.
실제로 인터넷 사이트에서 수집하는
사용자 정보는 극히 일부다.
그래서 사람들은 안심하고 인터넷에 댓글을 쓰고, 책과 영화에 별점을 매긴다.
하지만 익명화된 데이터는 정말 안전할까?
2006년, 넷플릭스는
공공 데이터 과학 경진대회를 개최했다.
넷플릭스의 영화 추천 엔진을 개선하기 위한 최고의 ‘협업 필터링’ 알고리즘을 찾아내는 대회였다.
협업 필터링은 나와 비슷한 사용자의 평가를 근거로 추천하도록 설계된 머신러닝의 한 분야다.
대회에는 프라이버시 우려가 있었으나 넷플릭스가 가지고 있는 정보는 각 사용자와 그의 영화 평가 정보뿐이었다.
모든 사용자 식별자를 제거했고, 성별이나 우편번호 같은 인구통계학
정보도 없었다.
그러나 오스틴 텍사스 대학교 박사 과정의 아르빈드 나라야난과 그의 지도교수 비탈리 슈마티코프는
익명화된 많은
넷플릭스 데이터에서 최소한 가입자의 기록이 포함된 부분을 알아낼 수 있으며,
최대로는 실명까지 추출할
수 있다고 발표했다.
만약 사용자가 IMDB처럼 실명으로
사용하는 평점 서비스를 사용하고 있다면,
그 데이터와 상호 참조해 대규모로도 식별이 가능하다고 말했다.
자신이 본 영화에 공개 감상평을 남긴 사람들을 데이터셋에서 식별해내는 행위가
프라이버시 침해라고 할 수 있냐고
물을 수도 있다.
하지만 이건 침해가 맞다.
사람들이 작성하는
공개 감상평은 일부만을 보여주지만, 넷플릭스 데이터는 평가한 모든 영화 목록을 보여주기 때문이다.
그런 데이터에서 정치적 성향이나 성적 지향 같은 민감한 정보가 노출될 수 있다.
실제로 이 대회로 넷플릭스를 고소하는 사람들이 있었고, 합의 후 2회 대회는 취소됐다.
우리가 인지하지 못하는 순간에도 데이터는 수집되고 있다.
MMCA서울에서
2019년 3월부터 7월까지
전시됐던 <불온한 데이터> 전은 이러한 위험성을 경고하고 있다.
불온한 데이터와 불온하지 않은 데이터의 차이는 무엇일까.
알고리즘에 윤리적 원칙을 포함하려면 어떻게 해야 하는가.
이 책을
읽으면서 함께 고민해볼 수 있을 것이다.
*
"윤리가 알고리즘에 '인코딩'될 수 있을까?
마이클 키언스와 아론 로스는 시의적절하게 알고리즘
기반 의사결정에 내재된 다양한 문제의 알고리즘 해법을 제시한다.
체계적이면서도 재미있게, 인간이 하는 판단의 지속적 중요성을 놓치지 않고,
알고리즘에서의
프라이버시와 공정성, 해석 가능성과 관련된 문제를 해결할 수 있는 잠재적 해법을 제시한다.”
도로테아 바우어(Dorothea
Baur) 박사
국제 기술 윤리 컨설턴트, 작가
"데이터 과학 혁명은 중요한 윤리적 기반을 갖고 있다.
저자들은 인공지능 윤리학이 자체적인 학문으로 발전하는 데 필요한 중요한 사례를 제공한다.
윤리 알고리즘은 알고리즘화된 사회가 꼭 종말론적일 필요는 없다는 것을 보여준다.
인공지능에 관심이 있다면 누구나 필수로 이 책을 읽어야 할 것이다."
마르코스 로페즈 데 프라도(Marcos
Lopez de Prado) 박사
트루 파지티브 테크놀로지스(True Positive Technologies) CEO,
「포트폴리오 관리 저널(The Journal of Portfolio Management)」의 2019년
올해의 퀀트
"이 책은 오늘날 전례 없이 데이터를 이용할 수 있는 세상에서
알고리즘이 맞닥뜨린 구체적이고 실제적인 사례를 통해 가까운 미래의 위협을 잘 보여주고 있다.
윤리 알고리즘은
명확하고 비범한 통찰력으로 가득 찬 책이다."
캐롤 라일리(Carol E.
Reiley)
Drive.ai 공동설립자, 고문 및 이사회 멤버
| 참고 기사 : 거대 데이터의 시대, 그 사이에서 포착한 틈 <불온한 데이터>
Editor. 김다예(dykim@acornpub.co.kr)
알고리즘 윤리는 아래 인터넷서점에서 만나실 수 있습니다.
- YES24, 교보문고, 알라딘, 인터파크, 반디앤루니스
크리에이티브 커먼즈 라이센스 이 저작물은 크리에이티브 커먼즈 코리아 저작자표시 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.