Top

크롤리의 통계학 강의 [R을 활용한 입문]

  • 원서명Statistics: An Introduction Using R 2nd Edition (ISBN 9781118941096)
  • 지은이마이클 크롤리(Michael J. Crawley)
  • 옮긴이염현식
  • ISBN : 9788960779150
  • 30,000원
  • 2016년 10월 28일 펴냄
  • 페이퍼백 | 388쪽 | 188*250mm
  • 시리즈 : 데이터 과학

책 소개

소스 파일은 아래 깃허브 페이지에서 내려 받으실 수 있습니다.
(https://github.com/AcornPublishing/statistics)

요약

R을 활용해 통계학의 핵심 내용을 다룬 세계적 베스트셀러다. 통계학의 기본 개념부터 모집단 비교, 회귀 분석, 분산 분석, 일반화 선형 모형, R의 활용 등 통계학에 대한 주제를 가장 이해하기 쉬운 방식으로 깊이 있고 논리적으로 설명해주고 있으며 자세하고 단계적인 예제로 실제 활용하는 데에도 도움을 준다. 통계학에 대한 기본 지식이 없는 독자들도 이 책을 통해 통계학의 개념적인 부분을 확실하고 명쾌하게 이해할 수 있을 것이다.

이 책에서 다루는 내용

■ R을 활용한 통계 작업의 세밀한 부분까지 총정리

■ 현재의 R 버전 3에 맞춘 내용 업데이트

■ 핵심적 통계 기법들에 대한 상세한 설명

■ 선형 모형(회귀 분석, 분산 분석, 공분산 분석)과 일반화 선형 모형(카운트 데이터, 비율 데이터, 사망까지의 시간 데이터)에 대한 집중적 고찰

■ 실험 설계에 대한 깊이 있는 설명

■ 웹사이트를 통한 데이터 파일, 코드, 추가적인 문서 제공

이 책의 대상 독자

이 책의 대상 독자에는 의학, 공학, 경제학, 생물학을 전공하는 대학생들뿐만 아니라 대학원생들까지 모두 포함된다.

본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.

저자/역자 소개

지은이 소개

마이클 크롤리(Michael J. Crawley)

영국 런던 임페리얼 칼리지 실우드파크 캠퍼스에서 강의하고 있는 교수다. 영국왕립학회 회원(Fellow of the Royal Society)이며 R과 통계학 관련 베스트셀러인 『The R book』과 『Statistical Computing: An Introduction to Data Analysis Using S-Plus』의 저자기도 하다.

옮긴이의 말

우리의 일상생활에서는 매일 원하든 원치 않든 데이터들이 쉴 새 없이 생겨나고 있습니다. 또한 학문적 연구나 스포츠 분야 등에서도 전 세계에서 발생하는 많은 데이터들을 확인할 수 있습니다. 이런 데이터들을 올바른 방식으로 분석해 합당한 결론을 이끌어내고 한 걸음 더 나아가 미래의 현상을 예측하는 일련의 과정은 매우 큰 중요성과 영향력을 가지고 있습니다. 정확한 데이터 분석을 위해 반드시 갖춰야 할 요소 중 하나가 올바른 통계학적 기법의 적용이라고 생각합니다. 그러나 통계학은 복잡합니다. 개인적인 생각으로는 통계학이 어렵다고 표현하기보다는 복잡하다고 표현하는 것이 적절할 것 같습니다. 통계학이 복잡하다고 느껴지는 가장 큰 이유는 핵심적인 개념들을 객관적이면서 직관적으로 이해하고 그 바탕 위에 어떤 문제를 차근차근 풀어나가는 과정이 순차적으로 무리 없이 이뤄져야 하기 때문이라고 생각합니다. 핵심적인 개념들에 대한 이해라는 것은 어찌 보면 쉬울 듯하지만 가장 어려운 문제일 수도 있습니다. 특히 저처럼 통계학을 전공하지 않았을 뿐 아니라 체계적으로 배울 수 있는 기회가 별로 없는 대다수의 일반인들에게는 개념 확립의 어려움에 의한 무수한 시행착오가 당연히 뒤따르게 될 것입니다. 이런 시행착오를 조금이라도 줄이기 위해서는 정확한 개념 확립이 반드시 필요하다고 생각합니다.
이 책은 R과 통계학을 다룬 세계적인 베스트셀러입니다. 이 책을 번역하면서 선생님 한 분이 제 옆에서 직접 통계학에 대한 이런저런 내용들을 차근차근 설명해주고 있는 것 같다는 느낌을 자주 받았습니다. 또 한편으로는 통계학 입문서의 성격이 강하기는 하지만 꽤 깊이가 있다는 생각도 들었습니다. 이 책의 가장 큰 특징은 본질적인 개념에 대한 명쾌한 해설과 단계적인 적용 과정의 논리적 제시라고 생각합니다. 튼튼한 학문적 바탕 위에 논리 정연하게 실타래 풀어나가듯이 실제적인 분석 과정을 진행하는 과정이 매우 인상적으로 느껴졌으며, 통계학을 처음 접하는 독자들도 부담감 없이 이 책의 내용을 받아들일 수 있으리라 생각합니다. 또한 어느 정도 통계학에 대한 기본 지식을 가진 분들에게도 이전에 미처 깊게 생각해보지 못했던 부분들에 대해 다시 한 번 새로운 시각으로 바라보는 기회가 될 것이라 생각합니다.
통계학 공부를 위한 책을 선택할 때 그 책이 어느 정도의 범위까지 다루고 있는지는 아마도 많은 분들이 반드시 고려하고 고민하는 부분일 것입니다. 제 개인적인 생각으로는 개념적인 기초를 확립하고 앞으로의 심화 과정을 준비하기 위해서는 이 책에서 다루는 정도의 범위가 합당하리라 생각합니다. 개인적으로 깊은 관심을 가지고 있는 베이지안 데이터 분석이나 메타 분석 관련 책을 공부할 때 이 책에서 다루는 정도의 범위와 개념들 안에서 대부분의 응용이 가능하다는 느낌을 받았습니다. 이 점은 아마도 다른 분석 방법들을 공부하시는 분들께도 동일하게 적용되리라 생각합니다. 이 책을 보시는 모든 분들이 부담감 없이 통계학에 친숙해지시고 그 바탕 위에서 데이터 분석의 깊은 재미를 느끼시길 바랍니다.

옮긴이 소개

염현식

시험관아기시술 센터에서 난임 전문 산부인과 의사로 활동 중이다. 메타 분석을 포함한 통계 분석, 베이지안 데이터 분석, 그래픽스, 논문 작성 등에 관심이 많으며, 이런 분야에서 R을 적극적으로 사용하고 있다. 데이터 분석의 전반적인 과정을 수행하는 데 반드시 필요한 통계학적 기법들을 이해하기 쉽게 정리함으로써 통계학에 대한 기본 지식이 없는 독자들도 어려움 없이 데이터 분석을 진행할 수 있는 방법을 제시하기 위해 노력을 기울이고 있다. 에이콘출판사에서 출간한 『R을 활용한 바이오인포매틱스』(2014)를 번역했다.

목차

목차
  • 1장. 기본 사항
    • 모든 것은 서로 다르다
    • 유의성
    • 좋은 가설과 나쁜 가설
    • 귀무가설
    • p 값
    • 해석
    • 모형 선택
    • 통계 모형
    • 최대 가능도
    • 실험 설계
    • 간결성의 원칙(오컴의 면도날)
    • 관찰, 이론, 실험 통제 집단
    • 반복 시행
    • 얼마나 많은 반복 시행이 필요한가
    • 검정력
    • 무작위화
    • 강한 추론
    • 약한 추론
    • 얼마나 오래 진행해야 할까
    • 인위적 반복
    • 초기 조건
    • 직교 설계와 비직교 관찰 데이터
    • 에일리어싱
    • 다중 비교
    • R에서의 통계 모형 요약
    • 작업의 조직화
    • R 작업
    • 참고 문헌
    • 추가 참고 문헌

  • 2장. 데이터 프레임
    • 데이터 프레임의 일부를 선택하기: 서브스크립트
    • 정렬
    • 데이터 프레임 요약
    • 설명 변수 기준의 요약
    • 제일 중요한 것을 제일 먼저 해야 한다
    • 관계
    • 연속형 변수들 사이에서의 상호작용
    • 다중 회귀에서의 그래픽
    • 범주형 변수에서의 상호작용
    • 추가 참고 문헌

  • 3장. 중심 경향
    • 추가 참고 문헌

  • 4장. 분산
    • 자유도
    • 분산
    • 분산: 실전 예제
    • 분산과 표본 크기
    • 분산의 사용
    • 비신뢰도의 측정
    • 신뢰구간
    • 부트스트랩
    • 이분산성
    • 추가 참고 문헌

  • 5장. 하나의 표본
    • 하나의 표본에서 데이터 요약
    • 정규분포
    • 정규분포의 z 값을 이용한 계산
    • 하나의 표본에서 정규성 검정을 위한 플롯
    • 하나의 표본을 통한 추론
    • 하나의 표본에서 가설 검정을 위한 부트스트랩
    • 스튜던트 t 분포
    • 분포의 고차 모멘트
    • 왜도
    • 첨도
    • 참고 문헌
    • 추가 참고 문헌
  • 6장. 두 표본
    • 두 분산의 비교
    • 두 평균의 비교
    • 스튜던트 t 검정
    • 윌콕슨 순위합 검정
    • 짝진 표본에 대한 검정
    • 이항 검정
    • 두 비율을 비교하기 위한 이항 검정
    • 카이제곱 분할표
    • 피셔의 정확 검정
    • 상관과 공분산
    • 상관과 변수 간 차이의 분산
    • 스케일에 따른 상관
    • 참고 문헌
    • 추가 참고 문헌
  • 7장. 회귀 분석
    • 선형 회귀
    • R에서의 선형 회귀
    • 선형 회귀에서의 계산
    • 회귀 분석의 제곱합 분할: SSY5SSR1SSE
    • 적합도의 측정, r2
    • 모형 검증 변환
    • 다항 회귀
    • 비선형 회귀
    • 일반화 가법 모형
    • 영향력
    • 추가 참고 문헌

  • 8장. 분산 분석
    • 일원 분산 분석
    • 간단한 공식
    • 효과 크기
    • 일원 분산 분석의 해석을 위한 그래프
    • 요인 실험
    • 인위적 반복: 내재 설계와 분할 구획
    • 분할 구획 실험
    • 임의 효과와 내재 설계
    • 고정 효과와 임의 효과 사이에서의 선택
    • 인위적 반복의 제거
    • 종단 자료의 분석
    • 파생 변수 분석
    • 인위적 반복에 대한 해법
    • 분산 성분 분석
    • 참고 문헌
    • 추가 참고 문헌

  • 9장. 공분산 분석
    • 추가 참고 문헌

  • 10장. 다중 회귀
    • 모형 단순화의 과정
    • 주의 사항
    • 제거의 순서
    • 다중 회귀의 시행
    • 실전 예제
    • 추가 참고 문헌

  • 11장. 대비
    • 대비 계수
    • R에서 시행한 대비의 예
    • 사전 대비
    • 처리 대비
    • 단계적 제거에 의한 모형 단순화
    • 대비 제곱합의 계산
    • 이외의 대비
    • 참고 문헌
    • 추가 참고 문헌

  • 12장. 기타 반응 변수들
    • 일반화 선형 모형
    • 오차 구조
    • 선형 예측치
    • 적합 값
    • 변동성의 일반적 측정
    • 연결 함수
    • 정준 연결 함수
    • 모형 적합도 측정을 위한 아케이케 정보 척도
    • 추가 참고 문헌

  • 13장. 카운트 데이터
    • 포아송 오차를 사용한 회귀
    • 카운트 데이터에서 편차 분석
    • 분할표의 위험
    • 카운트 데이터에서 공분산 분석
    • 빈도 분포
    • 추가 참고 문헌

  • 14장. 비율 데이터
    • 하나 또는 두 개의 비율에 대한 데이터 분석
    • 비율의 평균
    • 비율에서의 카운트 데이터
    • 오즈
    • 과대 산포와 가설 검정
    • 적용
    • 이항 분포를 사용한 로지스틱 회귀
    • 범주형 설명 변수를 포함하는 비율 데이터
    • 이항 데이터를 이용한 공분산 분석
    • 추가 참고 문헌

  • 15장. 바이너리 반응 변수
    • 발생률 함수
    • 바이너리 반응 변수를 이용한 공분산 분석
    • 추가 참고 문헌

  • 16장. 사망과 실패 데이터
    • 중도절단을 포함한 생존 분석
    • 추가 참고 문헌

  • 부록
    • R의 계산 기능
    • R 내재 함수
    • 지수를 포함하는 숫자
    • 모듈로
    • 할당
    • 반올림
    • 무한대와 NaN
    • 결측 값
    • 연산자
    • 벡터의 생성
    • 벡터의 요소 이름
    • 벡터 함수
    • 벡터의 그룹에 따른 요약
    • 서브스크립트와 인덱스
    • 벡터와 논리 서브스크립트
    • 벡터에서의 위치
    • 음의 서브스크립트를 사용한 벡터의 일부 제거
    • 논리 연산
    • 반복
    • 요인 수준의 생성
    • 수열 생성
    • 행렬
    • 문자열
    • R에서의 함수 작성
    • 단일 표본에 대한 산술평균 계산 함수
    • 단일 표본에 대한 중앙값 계산 함수
    • 루프와 반복
    • ifelse 함수
    • apply를 통한 함수의 적용
    • 동일성 검정
    • R에서의 검정과 강제 변환
    • R에서의 날짜와 시간
    • 날짜와 시간의 계산
    • str을 이용한 R 객체 구조의 이해
    • 참고 문헌
    • 추가 참고 문헌

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

정오표

정오표

[p.26 : 아래서 3행]
많은 경우에서는
->
많은 경우에서

[p.49 : 아래서 2행]
atach(worms)
->
attach(worms)

[p.54 : 본문 아래서 1행]
taaply와 with를 사용할 수 있다.
->
tapply와 with를 사용할 수 있다.

[p.147 : 1행]
범주형 변수
->
연속형 변수