책 소개
요약
저자는 책에서 자주 언급되는 diabetes.co.uk라는 당뇨병 커뮤니티에서 환자들이 자신의 당뇨를 잘 관리할 수 있도록 도와주는 인공지능 개발 전문가이다. 그 경험을 살려 헬스케어 종사자들과 헬스케어에 관심이 있는 사람들을 위해 헬스케어 인공지능의 이모저모를 어렵지 않게 설명한다.
이야기는 인공지능의 원료가 되는 데이터로 시작한다. 다른 분야와 마찬가지로 헬스케어 분야에서도 엄청난 양의 데이터가 수집되고 있음에 따라 빅데이터의 특징, 소스, 처리 과정, 공유 방법을 다룬다. 전통적인 의료 데이터는 병원에서 수집하고 관리했던 반면 최근에는 다양한 디바이스와 센서에서 데이터를 수집하다 보니 전통과 혁신이 충돌할 수 밖에 없다. 이 책에서는 이러한 문제를 현명하게 해결했을 때 얻을 수 있는 가치를 생각해 보게 한다.
다음은 헬스케어 데이터를 다루는 머신러닝, 인공지능 기술을 살펴본다. 최근에 큰 성공을 거둔 딥러닝을 비롯해 전통적인 회귀 분석에까지 데이터 분석에 쓰이는 알고리즘과 그런 알고리즘의 성능을 측정하는 방법을 설명한다. 알고리즘을 자세히 설명하려면 수학이나 통계학 수식 등을 동원할 수 밖에 없다. 그러나 저자가 그 방법을 피하고 있다 보니 내용이 다소 얄팍해졌다는 느낌을 준다. 처음 접하는 독자들은 아 이런 기술들이 사용되고 있구나 하는 정도로 넘어가도 될 듯 하다.
헬스케어 인공지능은 헬스케어 데이터를 다루기 때문에 그 어떤 분야보다 데이터 윤리가 크게 대두된다. 데이터를 공개, 공유하는 문제부터 데이터 보안 유지 그리고 인공지능 알고리즘의 공정성, 결과의 활용 등 윤리적인 철학과 토론, 합의가 필요함을 강조한다.
인간의 건강은 행복의 요건 가운데 하나이지만, 건강은 개인과 집단, 인류 모두의 노력으로 성취되는 것이다. 의료를 비롯한 헬스케어는 건강을 유지하기 위한 핵심 수단이다. 하지만 양질의 헬스케어를 제공하려면 어마어마한 비용이 든다. 그리고 많은 나라에서 고령화와 같은 변화로 인해 기존의 의료 경제 시스템을 지속할 수 없는 지점에 점점 다가가고 있음을 걱정하고 있다. 이러한 상황에서 헬스케어 인공지능은 지속 가능한 헬스케어 관리 시스템을 위한 수단으로 부각되고 있다. 이 책을 통해 헬스케어 인공지능의 구체적인 예와 가능성을 동시에 생각해볼 수 있다.
이 책의 대상 독자
이해관계자들은 빅데이터와 머신러닝을 사용해 데이터에서 미래를 예측하고, 숨겨진 연관성과 패턴을 발견할 수 있다. 이런 지식을 획득한다는 것은 도적적이고 법적인 결과로 이어질 수 있는데, 이에 대한 리스크를 줄일 수 있는 적절한 관리 방법을 알아본다.
이 책의 구성
헬스케어 영역에서의 인공지능 이론과 실용적인 응용을 다루며, 언제 어떻게 머신러닝을 응용할 수 있는지와 성능을 평가하는 방법을 알려준다. 마지막에는 새롭고 혁신적인 방법으로 인공지능과 빅데이터를 이용하는 시장을 주도하는 헬스케어 기관의 사례를 살펴본다.
목차
목차
- 1장. 인공지능
- 다학제적인 과학
- 인공지능 검토
- 반응성 기계
- 이성적으로 생각하고 사고하는 제한된 메모리 시스템
- 사람과 같이 사고하는 마음 이론 시스템
- 사람과 다름없이 자각하는 인공지능 시스템
- 머신러닝이란?
- 데이터 과학이란?
- 실시간 빅데이터에서 학습
- 헬스케어 분야에서 인공지능의 응용
- 예측
- 진단
- 맞춤 치료와 행동의 변화
- 신약 개발
- 추적 돌봄
- 헬스케어에서 인공지능의 가능성 현실화
- 간극의 이해
- 단절된 데이터
- 적절한 데이터 보안
- 데이터 거버넌스
- 편향
- 소프트웨어
- 결론
- 2장. 데이터
- 데이터란?
- 데이터의 형태
- 빅데이터
- 데이터양
- 다양성
- 속도
- 가치
- 정확성
- 타당성
- 가변성
- 시각화
- 작은 데이터
- 메타데이터
- 헬스케어 데이터: 작은 또는 큰 사용 사례
- 대기 시간 예측
- 재입원 줄이기
- 예측 분석
- 전자의무기록
- 가치 기반 케어/참여
- 헬스케어 사물 인터넷: 실시간 알림, 경고문 발송, 자동화
- 근거 증심 의학으로 이동
- 공중 보건
- 데이터 진화와 애널리틱스
- 데이터를 정보로 변환: 빅데이터 사용
- 기술적 애널리틱스
- 진단적 애널리틱스
- 예측 애널리틱스
- 처방적 애널리틱스
- 추론
- 연역
- 귀납
- 귀추
- 나의 프로젝트에 얼마나 많은 데이터가 필요할까?
- 빅데이터의 난관
- 데이터의 증가
- 인프라스트럭처
- 전문가
- 데이터 소스
- 데이터의 질
- 보안
- 저항
- 정책과 거버넌스
- 단절화
- 데이터 전략의 부재
- 시각화
- 분석 시간의 고려
- 윤리
- 데이터 거버넌스와 정보 거버넌스
- 데이터 관리
- 데이터의 질
- 데이터 보안
- 데이터의 이용 가능성
- 데이터의 내용
- 마스터 데이터 관리
- 사용 사례
- 빅데이터 프로젝트 배치
- 빅데이터 도구
- 결론
- 3장. 머신러닝
- 기초
- 에이전트
- 자율성
- 인터페이스
- 성능
- 목표
- 효용
- 지식
- 환경
- 훈련 데이터
- 타깃 함수
- 가설
- 학습자
- 검증
- 데이터셋
- 특징
- 특징 선택
- 머신러닝이란?
- 머신러닝이 전통적인 소프트웨어 엔지니어링과 다른 점
- 머신러닝의 기초
- 지도학습
- 비지도학습
- 준지도학습
- 강화학습
- 데이터 마이닝
- 모수적, 비모수적 알고리즘
- 머신러닝 알고리즘의 작동법
- 머신러닝을 수행하는 방법
- 문제 명시
- 데이터 준비
- 학습법의 선택
- 머신러닝법의 적용
- 방법과 결과 평가
- 편향과 분산
- 최적화
- 결과 보고
- 기초
- 4장. 머신러닝 알고리즘
- 머신러닝 프로젝트 정의
- 과업(T)
- 성능(P)
- 경험(E)
- 머신러닝에 자주 사용되는 라이브러리
- 지도학습 알고리즘
- 분류
- 회귀
- 의사 결정 트리
- ID3(Iterative Dichotomizer 3)
- C4.5
- CART
- 앙상블
- 배깅
- 부스팅
- 선형 회귀
- 로지스틱 회귀
- 서포트 벡터 머신
- 나이브 베이즈
- k-최근접 이웃(kNN)
- 신경망
- 퍼셉트론
- 인공신경망
- 딥러닝
- 피드포워드 신경망
- 순환 신경망: 장단기 메모리
- 컨볼루션 신경망
- 모듈 신경망
- 방사형 기저 신경망
- 비지도학습
- 클러스터링
- K-평균
- 연관 법칙
- 차원 축소 알고리즘
- 차원 축소 기술
- 누락된 값/결측값
- 낮은 분산
- 높은 상관
- 랜덤 포레스트 의사 결정 트리
- 백워드 특징 제거
- 포워드 특징 구성
- 주성분 분석
- 자연어 처리(NLP)
- 자연어 처리 시작
- 전처리: 어휘 분석
- 노이즈 제거
- 어휘 정규화
- 포터 어간 추출
- 객체 표준화
- 구문 분석
- 의존성 파싱
- 파트오브스피치 태깅
- 의미 분석
- 자연어 처리에 사용되는 기술
- N-그램
- 단어 빈도-역문서 빈도 벡터
- 잠재 의미 분석
- 코사인 유사도
- 나이브 베이즈 분류자
- 유전 알고리즘
- 머신러닝의 모범 사례와 고려할 점
- 좋은 데이터 관리
- 기준이 될 기초 성능 지표
- 데이터 정제에 들이는 시간
- 훈련 시간
- 적절한 모델의 선택
- 적절한 변수의 선택
- 불필요한 데이터
- 과적합
- 생산성
- 이해도
- 정확도
- 거짓 음성의 영향
- 선형성
- 파라미터
- 앙상블
- 사례: 제2형 당뇨병
- 머신러닝 프로젝트 정의
- 5장. 지능을 위한 학습 성과 평가
- 모델 개발과 작업 과정
- 모델을 평가하는 두 가지 접근법이 있는 이유
- 평가 지표
- 비대칭 데이터셋, 변칙 값, 희소 데이터
- 파라미터와 하이퍼파라미터
- 하이퍼파라미터 튜닝
- 하이퍼파라미터 튜닝 알고리즘
- 그리드 서치
- 랜덤 서치
- 다변량 테스팅
- 어떤 지표를 평가에 사용해야 하는가?
- 상관은 인과와 다르다
- 얼마만큼의 차이가 정말로 중요한 차이인가?
- 검정법, 통계적 검증력, 효과 크기
- 보고자 하는 성능 지표의 분포 확인
- 적절한 p 값 결정
- 얼마나 많은 관측 값이 필요한가?
- 얼마나 오랫동안 다변량 테스팅을 실행해야 하는가?
- 데이터 분산
- 분포 이동 알아내기
- 모델의 변경 내용 기록
- 모델 개발과 작업 과정
- 6장. 인공지능의 윤리
- 윤리란?
- 데이터 과학 윤리학이란?
- 데이터 윤리학
- 고지에 입각한 동의
- 선택의 자유
- 데이터에 대한 동의가 항상 절대적 기준인가?
- 대중의 이해
- 데이터는 누구의 소유인가?
- 데이터는 어떤 목적으로 사용될 수 있는가?
- 프라이버시: 누가 나의 데이터를 볼 수 있는가?
- 데이터가 어떻게 미래에 영향을 미칠까?
- 치료 우선순위 결정
- 새로운 치료와 관리법 결정
- 더 많은 실제 생활 증거
- 약물 개발 능력 향상
- 연결을 통한 치료법의 최적화: 한계가 있을까?
- 보안
- 인공지능과 머신러닝의 윤리학
- 기계의 편향
- 데이터 편향
- 사람에 의한 편향
- 지능 편향
- 편향 수정
- 편향은 나쁜 것인가?
- 예측의 윤리학
- 예측 설명
- 실수에 따른 보호
- 타당성
- 알고리즘이 비도덕이지 않게 예방
- 의도하지 않은 결과
- 복잡하고 지능적인 시스템의 주도권을 인간이 유지하는 방법
- 지능
- 건강 지능
- 누가 책임을 지는가?
- 최초 문제
- 공정함 정의
- 어떻게 기계가 우리의 행동과 상호 교류에 영향을 주는가?
- 인간성
- 행동과 중독
- 경제와 고용
- 미래에 대한 영향
- 신처럼 행동하기
- 과대광고와 세상을 시끌 법석하게 만들기
- 이해관계자의 수용과 정렬
- 정책, 법률, 규제
- 데이터와 정보 거버넌스
- 너무 많은 정책의 단점
- 글로벌 표준과 제도
- 인공지능을 인류로 취급해야 하는가?
- 기관 내부에서 데이터 윤리학 적용
- 윤리 강령
- 윤리 프레임워크 고려
- 데이터 과학자를 위한 히포크라테스 선서
- 프레임워크 감사
- 윤리란?
- 7장. 헬스케어의 미래
- 양에서 질로 이동
- 근거 중심 의학
- 맞춤 의학
- 미래의 비전
- 연결된 의학
- 질병과 상태 관리
- 가상 비서
- 원격 모니터링
- 약물 순응도
- 접근 가능한 진단 검사
- 스마트 임플란트
- 디지털 건강과 치료법
- 교육
- 웰니스에 대한 인센티브
- 인공지능
- 기록에 대한 데이터 마이닝
- 대화형 인공지능
- 더 좋은 의사 만들기
- 맞춤형 보조기
- 가상현실과 증강현실
- 가상현실
- 증강현실
- 융합현실
- 통증 관리
- 물리 치료
- 인지 재활
- 간호와 수련
- 가상 진료와 수업
- 블록체인
- 공급망 검증
- 웰니스에 대한 인센티브
- 환자 데이터 접근
- 로봇
- 로봇 수술
- 외골격 로봇
- 입원 환자 케어
- 동무되기
- 드론
- 스마트 장소
- 스마트 홈
- 스마트 병원
- 환원주의
- 혁신 대 숙의
- 8장. 사례 연구
- 사례 연구의 선정
- 사례 연구의 선정 결과
- 사례 연구: 당뇨 발 관리용 이미징 인공지능 및 이환율과 사망률을 개선하기 위한 의료 전달 체계에 대한 우선순위 결정
- 배경
- 인지적 시각
- 프로젝트 목표
- 도전 과제
- 결론
- 사례 연구: 제2형 당뇨병 자기 관리를 위한 디지털 저탄수화물 프로그램의 결과: 단일군 종단 연구 1년 추적 결과
- 배경
- 목적
- 방법
- 결과
- 관찰된 현상
- 결론
- 사례 연구: 확장 가능하고 참여를 유도하는 뇌전증 디지털 치료법
- 배경
- 근거 중심 적용
- 센서 기반 디지털 프로그램
- 연구
- 프로젝트 영향
- 예비 분석
- 사례 연구: 새로운 증강 및 가상현실을 이용한 주니어 의사 교육 프로그램의 결과
- 배경
- 목표
- 프로젝트 설명
- 결론
- 사례 연구: 빅데이터, 큰 영향, 큰 윤리: 데이터로 환자 위험도 진단
- 배경
- 플랫폼 서비스
- 약물 순응도, 효능과 약물에 대한 부담
- 커뮤니티 포럼
- 인공지능을 사용한 환자 상호작용에 대한 우선순위 결정
- 실세계 근거
- 예측 분석의 윤리적인 함의
- 사물 인터넷의 통합
- 결론
- 기술 용어 설명