Top

알고리즘 윤리 [안전한 인공지능 알고리즘 설계 기법]

  • 원서명Ethical Algorithm: The Science of Socially Aware Algorithm Design (ISBN 9780190948207)
  • 지은이마이클 키언스(Michael Kearns), 아론 로스(Aaron Roth)
  • 옮긴이이정표
  • ISBN : 9791161755151
  • 20,000원
  • 2021년 05월 12일 펴냄
  • 페이퍼백 | 228쪽 | 152*224mm

책 소개

2022년 대한민국학술원 우수학술도서 선정도서
요약

수학과 컴퓨터 과학 분야에서 문제를 해결하는 절차를 의미했던 알고리즘은 어느새 전 세계인의 일상에 큰 영향을 끼치는 기술로 자리잡았다. 알고리즘은 우리의 삶을 더 효율적이고, 재밌고, 편리하게 만들었지만, 동시에 인간의 기본권을 침해하는 사례도 급증하고 있다. 알고리즘으로 인한 개인 정보 유출, 통계 모델에 따른 인종 및 성 차별 등 문제를 해결하려면, 이 기술 뒤에 숨겨진 과학을 이해하고 개선하는 노력이 시급하다. 이 책은 과학에 기초한 프라이버시와 공정성, 투명성, 책임성 등의 윤리적 원칙을 제시한다. 또한, 과학 탐구를 계속하면서도 윤리적 원칙을 어떻게 코드에 잘 포함시킬 수 있는지를 설명한다.

추천의 글

"윤리가 알고리즘에 '인코딩'될 수 있을까? 마이클 키언스와 아론 로스는 시의적절하게 알고리즘 기반 의사결정에 내재된 다양한 문제의 알고리즘 해법을 제시한다. 체계적이면서도 재미있게, 인간이 하는 판단의 지속적 중요성을 놓치지 않고, 알고리즘에서의 프라이버시와 공정성, 해석 가능성과 관련된 문제를 해결할 수 있는 잠재적 해법을 제시한다.”
- 도로테아 바우어(Dorothea Baur) 박사 / 국제 기술 윤리 컨설턴트이자 작가

"지옥으로 가는 길은 선의의 알고리즘으로 포장돼 있을까? 많은 이가 선의의 알고리즘으로 이뤄졌을 것이라 생각한다. 적절한 시점에 두 명의 전문가가 좀 더 냉철한 시각으로 쓴 이 책은 분명하고 간결하게 문제 이해와 해법 탐색을 하고 있어, 윤리 알고리즘이라는 새로운 과학 분야에 대한 완벽한 지침서라 할 수 있다."
- 페드로 도밍고스(Pedro Domingos) 박사 / 워싱턴 대학교 컴퓨터 과학과 교수이자 『마스터 알고리즘(The Master Algorithm)』 저자

"데이터 과학 혁명은 중요한 윤리적 기반을 갖고 있다. 저자들은 인공지능 윤리학이 자체적인 학문으로 발전하는 데 필요한 중요한 사례를 제공한다. 윤리 알고리즘은 알고리즘화된 사회가 꼭 종말론적일 필요는 없다는 것을 보여준다. 인공지능에 관심이 있다면 누구나 필수로 이 책을 읽어야 할 것이다."
- 마르코스 로페즈 데 프라도(Marcos Lopez de Prado) 박사 / 트루 파지티브 테크놀로지스(True Positive Technologies) CEO이자 「포트폴리오 관리 저널(The Journal of Portfolio Management)」의 2019년 올해의 퀀트)

"이 책은 오늘날 전례 없이 데이터를 이용할 수 있는 세상에서 알고리즘이 맞닥뜨린 구체적이고 실제적인 사례를 통해 가까운 미래의 위협을 잘 보여주고 있다. 윤리 알고리즘은 명확하고 비범한 통찰력으로 가득 찬 책이다."
- 캐롤 라일리(Carol E. Reiley) / Drive.ai 공동설립자, 고문 및 이사회 멤버

이 책에서 다루는 내용

최근 발행된 서적이나 뉴스, 과학 기사를 찾아보면 알고리즘이 개인이나 특정 그룹의 사람들에게 해를 끼친 사례를 쉽게 찾아볼 수 있다. 예를 들어, 온라인 대조 실험 결과에 따르면 구글 검색의 결과나 페이스북 광고나 그 외 인터넷 서비스들에서 인종이나 성별, 정치 및 기타 유형에 따른 편향이 존재한다는 사실을 알 수 있다. 최근에는 범죄 형량을 결정하는 데 사용된 예측 모델이 인종을 차별한다는 문제로 인해 통계학자와 범죄학자, 법학자들 간의 폭발적인 논쟁이 일어나기도 했다. 또한 알고리즘 분석 도구의 발전으로 인해 데이터의 상관관계를 빠르고 효율적으로 찾아낼 수 있게 되면서 돈과 시간을 들였지만 결국은 사실이 아닌 것으로 판명된 연구 결과가 빈번하게 나타났다. 현대 알고리즘은 사회의 가장 소중한 가치조차 짓밟을 수 있다는 사실이 점점 분명해지고 있다.
이 책에서 제시하는 이러한 노력은 알고리즘이 강화하거나 감시하는 사회적 가치를 결정하거나 결정하는 데 사용돼야 한다고 제안하는 것은 아니다. 공정성, 프라이버시, 투명성, 해석 가능성, 도덕성의 정의는 인간의 판단 영역에 확고히 남아 있어야 한다. 이것이 우리가 열정을 갖고 설명하는 이유 중 하나다. 궁극적으로는 과학자, 엔지니어, 변호사, 규제 기관, 철학자, 사회복지사 그리고 관련 시민 간의 협력이 있어야 한다. 그러나 프라이버시 같은 사회적 규범을 정확하고 정량적으로 정의할 수 있다면 알고리즘에게 이를 ‘설명’하고 따르게 할 수 있다. 여기서 가장 큰 어려움은 대중이 공감할 수 있도록 사회적 가치에 대한 정량적 정의를 개발하는 것이다. 그리고 프라이버시 같은 분야에서는 (완벽할 수는 없지만) 비교적 잘해왔고, 공정성 같은 분야는 어렵지만 발전하고 있다. 그리고 해석 가능성이나 도덕성 같은 가치는 아직 갈 길이 멀다. 그러나 어려움에도 불구하고 우리가 ‘프라이버시’와 ‘공정성’ 같은 단어를 사용할 때 의미하는 바를 극단적으로 정확하게 하려는 노력은 그 자체로 큰 의미가 있다. 왜냐하면 이는 알고리즘에 필수적이기도 하고, 이러한 개념에 대한 우리의 직관에 숨겨진 미묘함, 결함, 절충점 등이 종종 드러나기 때문이다.

저자/역자 소개

지은이의 말

우리는 이른바 데이터의 황금기에 살고 있다. 사람이나 사회에 대해 궁금해 할 만한 모든 질문에 통계적으로 정확한 답변을 제공하는 데 활용할 수 있는 방대한 데이터가 존재한다. “친구의 행동은 당신이 어떤 TV 프로를 볼지 또는 어떤 사람에게 투표할지를 정하는 데 영향을 줍니까?”라는 질문에 대한 답변은 전 세계 사람들 수억 명의 사회적 활동을 기록하고 있는 페이스북 데이터로 할 수 있다. 운동을 자주 하는 사람들은 이메일을 비교적 덜 확인할까? 만약 애플 워치(Apple Watch)나 구글 핏(Google Fit) 앱을 설치한 안드로이드 폰 사용자들이라면 데이터로 답을 알 수 있을 것이다. 또한 타깃 마케팅을 원하는 유통 회사를 위해 고객이 어디서 주로 시간을 보내는지에 관한 데이터를 판매하는 수십 개의 회사가 이미 경쟁 중이다. 이는 우리를 매우 복잡한 상황으로 이끈다. 즉, 전례가 없던 풍요로운 데이터로부터 얻게 되는 통찰력을 통해 사회의 동작 방식을 새롭게 이해하고, 공중 보건과 서비스, 소비자 제품을 개선할 수 있다. 그러나 개인이 이런 데이터 분석의 수혜자가 되는 것이 아니다. 분석에 사용되는 데이터가 바로 나와 당신이며, 우리에 대한 중요한 결정을 내리는 데도 바로 그 데이터가 사용되는 것이다.
데이터 수집과 분석이 급증하면서 발생하는 걱정거리가 단지 프라이버시만은 아니다. 왜냐하면 휴대폰과 인터넷을 이용할 수 있게 해주는 작은 기계 코드, 알고리즘은 우리가 이동하면서 생성하는 데이터를 분석하는 정도에서 끝나지 않기 때문이다. 이는 우리 생활에 영향을 끼치는 결정을 내리는 데 활발히 사용된다. 예를 들어, 신용카드를 발급받으려고 신청서를 내면 아마도 그 신청서는 사람이 검토하지 않을 것이다. 대신 알고리즘이 신청자(또는 신청자와 유사한 그룹의 사람들)에 대한 정보를 여러 기관에서 수집한 후, 자동으로 발급 승인을 하거나 거절할 것이다. 이렇듯 요청이 승인될 때까지 5~10일 정도 기다리지 않고 바로 결과를 알 수 있다는 것은 장점이 많지만, 좀 더 생각해볼 필요가 있다. 미국의 많은 주에서는 이른바 머신러닝(machine learning)이라 부르는 알고리즘을 보석과 가석방, 형사 선고를 하는 데도 사용하고 있다. 또한 경찰관을 도시 전역에 배치하는 데도 알고리즘이 사용된다. 사람들의 삶에 직접적이고 실제적인 영향을 끼치는 모든 분야의 결정 과정에 알고리즘이 사용되고 있는 것이다. 이 모든 현상은 프라이버시뿐만 아니라 공정성이나 안전, 투명성, 책임성, 도덕성을 포함한 다양한 사회적 가치에 대해 의문을 제기한다. 따라서 앞으로도 계속 빅데이터를 생성하고, 이를 통해 중요한 결정을 자동화할 것이라면(그렇지 않을 가능성은 농경사회로 다시 돌아갈 것이라는 가정만큼 현실성이 없다), 반드시 몇 가지 중요한 주제를 진지하게 고려해야 한다. 여기에는 데이터와 알고리즘의 사용을 제한하는 것과 이런 제한을 법제화하는 것, 규제를 시행하는 조직이 모두 포함된다. 그러나 우리는 이러한 우려 사항을 과학적으로 해결하려는 시도, 좀 더 자세히 말하자면 우리 삶에 점점 깊이 들어오는 알고리즘을 설계하는 데 있어 윤리적 원칙을 직접 코딩해서 반영한다는 사실이 의미하는 바를 진지하게 고려해야 한다. 이 책은 바로 그러한 윤리 알고리즘의 설계를 다루는 최신 과학 분야의 책이다.

지은이 소개

마이클 키언스(Michael Kearns)

펜실베이니아 대학교의 컴퓨터 정보 과학과 교수 겸 국립 센터장이고, 경제학과 와튼 스쿨에도 공동 소속돼 있다. 머신러닝, 인공지능, 알고리즘 게임 이론, 금융 공학 분야 등 폭넓은 분야에 논문을 출간했다. 금융 및 기술 분야에서 다양한 경험을 했으며, 알고리즘과 데이터, 머신러닝 분야의 법과규제 관련 컨설팅을 한다.

아론 로스(Aaron Roth)

펜실베이니아 대학교의 컴퓨터 정보 과학과 부교수다. 알고리즘과 머신러닝, 데이터 프라이버시와 알고리즘 게임 등의 분야에 논문을 출간했으며, 알고리즘 프라이버시 분야 전반에 걸쳐 컨설팅을 한다. 2016년 오바마 대통령이 수여한 젊은 과학자 및 기술자상 등 수많은 상을 받았다.

옮긴이 소개

이정표

소프트웨어 엔지니어로서 다양한 개발 프로젝트에 참여하고 있다. 크리에이티브 커먼즈 코리아의 자원활동가로 활동했으며, 오픈아이디어랩 프로젝트의 공동 설립자다. 옮긴 책으로는 『워드프레스 플러그인과 테마 만들기』(에이콘, 2012), 『Hudson3 설치와 운용』(에이콘, 2014), 『젠킨스 마스터』(에이콘, 2018), 『젠킨스 블루오션 시작하기』(에이콘, 2019), 『린 모바일 앱 개발』(에이콘, 2019), 『The Power of Open 한국어판』, 『참여와 소통의 정부 2.0』(아이앤유 ,2011), 『난독화, 디지털 프라이버시 생존 전략』(에이콘, 2017) 등이 있다.

목차

목차
  • 1장. 알고리즘 프라이버시 익명에서 소음으로
  • 2장. 알고리즘 공정성 패리티에서 파레토까지
  • 3장. 알고리즘 게임 이론
  • 4장. (데이터에 미혹돼) 정원에서 길을 잃다
  • 5장. 위험한 연구 해석 가능성과 도덕성 그리고 특이점

관련 블로그 글

익명화된 데이터의 위험성, <알고리즘 윤리>



많은 사람이 익명은 안전하다고 믿는다.
실제로 인터넷 사이트에서 수집하는 사용자 정보는 극히 일부다
그래서 사람들은 안심하고 인터넷에 댓글을 쓰고, 책과 영화에 별점을 매긴다
하지만 익명화된 데이터는 정말 안전할까?

 

2006, 넷플릭스는 공공 데이터 과학 경진대회를 개최했다.
넷플릭스의 영화 추천 엔진을 개선하기 위한 최고의 협업 필터링알고리즘을 찾아내는 대회였다.
협업 필터링나와 비슷한 사용자의 평가를 근거로 추천하도록 설계된 머신러닝의 한 분야.
대회에는 프라이버시 우려가 있었으나 넷플릭스가 가지고 있는 정보는 각 사용자와 그의 영화 평가 정보뿐이었다.
모든 사용자 식별자를 제거했고, 성별이나 우편번호 같은 인구통계학 정보도 없었다.

 

그러나 오스틴 텍사스 대학교 박사 과정의 아르빈드 나라야난과 그의 지도교수 비탈리 슈마티코프는
익명화된 많은 넷플릭스 데이터에서 최소한 가입자의 기록이 포함된 부분을 알아낼 수 있으며,
최대로는 실명까지 추출할 수 있다고 발표했다.
만약 사용자가 IMDB처럼 실명으로 사용하는 평점 서비스를 사용하고 있다면,
그 데이터와 상호 참조해 대규모로도 식별이 가능하다고 말했다.

 



자신이 본 영화에 공개 감상평을 남긴 사람들을 데이터셋에서 식별해내는 행위가
프라이버시 침해라고 할 수 있냐고 물을 수도 있다.

하지만 이건 침해가 맞다.
사람들이 작성하는 공개 감상평은 일부만을 보여주지만, 넷플릭스 데이터는 평가한 모든 영화 목록을 보여주기 때문이다.
그런 데이터에서 정치적 성향이나 성적 지향 같은 민감한 정보가 노출될 수 있다.
실제로 이 대회로 넷플릭스를 고소하는 사람들이 있었고, 합의 후 2회 대회는 취소됐다.

 




우리가 인지하지 못하는 순간에도 데이터는 수집되고 있다.
MMCA
서울에서 20193월부터 7월까지 전시됐던 <불온한 데이터> 전은 이러한 위험성을 경고하고 있다.
불온한 데이터와 불온하지 않은 데이터의 차이는 무엇일까.
알고리즘에 윤리적 원칙을 포함하려면 어떻게 해야 하는가.

이 책을 읽으면서 함께 고민해볼 수 있을 것이다.



*



"윤리가 알고리즘에 '인코딩'될 수 있을까?
마이클 키언스와 아론 로스는 시의적절하게 알고리즘 기반 의사결정에 내재된 다양한 문제의 알고리즘 해법을 제시한다.
체계적이면서도 재미있게, 인간이 하는 판단의 지속적 중요성을 놓치지 않고,
알고리즘에서의 프라이버시와 공정성, 해석 가능성과 관련된 문제를 해결할 수 있는 잠재적 해법을 제시한다.”

도로테아 바우어(Dorothea Baur) 박사
국제 기술 윤리 컨설턴트, 작가

 

"데이터 과학 혁명은 중요한 윤리적 기반을 갖고 있다.
저자들은 인공지능 윤리학이 자체적인 학문으로 발전하는 데 필요한 중요한 사례를 제공한다.
윤리 알고리즘은 알고리즘화된 사회가 꼭 종말론적일 필요는 없다는 것을 보여준다.
인공지능에 관심이 있다면 누구나 필수로 이 책을 읽어야 할 것이다."

마르코스 로페즈 데 프라도(Marcos Lopez de Prado) 박사
트루 파지티브 테크놀로지스(True Positive Technologies) CEO,
「포트폴리오 관리 저널(The Journal of Portfolio Management)」의 2019년 올해의 퀀트

 

"이 책은 오늘날 전례 없이 데이터를 이용할 수 있는 세상에서
알고리즘이 맞닥뜨린 구체적이고 실제적인 사례를 통해 가까운 미래의 위협을 잘 보여주고 있다.
윤리 알고리즘은 명확하고 비범한 통찰력으로 가득 찬 책이다."

캐롤 라일리(Carol E. Reiley)
Drive.ai
공동설립자, 고문 및 이사회 멤버

 


 

| 참고 기사 : 거대 데이터의 시대, 그 사이에서 포착한 틈 <불온한 데이터>

Editor. 김다예(dykim@acornpub.co.kr)
알고리즘 윤리는 아래 인터넷서점에서 만나실 수 있습니다.
- YES24, 교보문고, 알라딘, 인터파크, 반디앤루니스

CC

크리에이티브 커먼즈 라이센스 이 저작물은 크리에이티브 커먼즈 코리아 저작자표시 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안