책 소개
소스 파일은 아래 깃허브 페이지에서 내려 받으실 수 있습니다.
(https://github.com/AcornPublishing/statistics)
요약
R을 활용해 통계학의 핵심 내용을 다룬 세계적 베스트셀러다. 통계학의 기본 개념부터 모집단 비교, 회귀 분석, 분산 분석, 일반화 선형 모형, R의 활용 등 통계학에 대한 주제를 가장 이해하기 쉬운 방식으로 깊이 있고 논리적으로 설명해주고 있으며 자세하고 단계적인 예제로 실제 활용하는 데에도 도움을 준다. 통계학에 대한 기본 지식이 없는 독자들도 이 책을 통해 통계학의 개념적인 부분을 확실하고 명쾌하게 이해할 수 있을 것이다.
이 책에서 다루는 내용
■ R을 활용한 통계 작업의 세밀한 부분까지 총정리
■ 현재의 R 버전 3에 맞춘 내용 업데이트
■ 핵심적 통계 기법들에 대한 상세한 설명
■ 선형 모형(회귀 분석, 분산 분석, 공분산 분석)과 일반화 선형 모형(카운트 데이터, 비율 데이터, 사망까지의 시간 데이터)에 대한 집중적 고찰
■ 실험 설계에 대한 깊이 있는 설명
■ 웹사이트를 통한 데이터 파일, 코드, 추가적인 문서 제공
이 책의 대상 독자
이 책의 대상 독자에는 의학, 공학, 경제학, 생물학을 전공하는 대학생들뿐만 아니라 대학원생들까지 모두 포함된다.
본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.
목차
목차
- 1장. 기본 사항
- 모든 것은 서로 다르다
- 유의성
- 좋은 가설과 나쁜 가설
- 귀무가설
- p 값
- 해석
- 모형 선택
- 통계 모형
- 최대 가능도
- 실험 설계
- 간결성의 원칙(오컴의 면도날)
- 관찰, 이론, 실험 통제 집단
- 반복 시행
- 얼마나 많은 반복 시행이 필요한가
- 검정력
- 무작위화
- 강한 추론
- 약한 추론
- 얼마나 오래 진행해야 할까
- 인위적 반복
- 초기 조건
- 직교 설계와 비직교 관찰 데이터
- 에일리어싱
- 다중 비교
- R에서의 통계 모형 요약
- 작업의 조직화
- R 작업
- 참고 문헌
- 추가 참고 문헌
- 2장. 데이터 프레임
- 데이터 프레임의 일부를 선택하기: 서브스크립트
- 정렬
- 데이터 프레임 요약
- 설명 변수 기준의 요약
- 제일 중요한 것을 제일 먼저 해야 한다
- 관계
- 연속형 변수들 사이에서의 상호작용
- 다중 회귀에서의 그래픽
- 범주형 변수에서의 상호작용
- 추가 참고 문헌
- 3장. 중심 경향
- 추가 참고 문헌
- 추가 참고 문헌
- 4장. 분산
- 자유도
- 분산
- 분산: 실전 예제
- 분산과 표본 크기
- 분산의 사용
- 비신뢰도의 측정
- 신뢰구간
- 부트스트랩
- 이분산성
- 추가 참고 문헌
- 5장. 하나의 표본
- 하나의 표본에서 데이터 요약
- 정규분포
- 정규분포의 z 값을 이용한 계산
- 하나의 표본에서 정규성 검정을 위한 플롯
- 하나의 표본을 통한 추론
- 하나의 표본에서 가설 검정을 위한 부트스트랩
- 스튜던트 t 분포
- 분포의 고차 모멘트
- 왜도
- 첨도
- 참고 문헌
- 추가 참고 문헌
- 6장. 두 표본
- 두 분산의 비교
- 두 평균의 비교
- 스튜던트 t 검정
- 윌콕슨 순위합 검정
- 짝진 표본에 대한 검정
- 이항 검정
- 두 비율을 비교하기 위한 이항 검정
- 카이제곱 분할표
- 피셔의 정확 검정
- 상관과 공분산
- 상관과 변수 간 차이의 분산
- 스케일에 따른 상관
- 참고 문헌
- 추가 참고 문헌
- 7장. 회귀 분석
- 선형 회귀
- R에서의 선형 회귀
- 선형 회귀에서의 계산
- 회귀 분석의 제곱합 분할: SSY5SSR1SSE
- 적합도의 측정, r2
- 모형 검증 변환
- 다항 회귀
- 비선형 회귀
- 일반화 가법 모형
- 영향력
- 추가 참고 문헌
- 8장. 분산 분석
- 일원 분산 분석
- 간단한 공식
- 효과 크기
- 일원 분산 분석의 해석을 위한 그래프
- 요인 실험
- 인위적 반복: 내재 설계와 분할 구획
- 분할 구획 실험
- 임의 효과와 내재 설계
- 고정 효과와 임의 효과 사이에서의 선택
- 인위적 반복의 제거
- 종단 자료의 분석
- 파생 변수 분석
- 인위적 반복에 대한 해법
- 분산 성분 분석
- 참고 문헌
- 추가 참고 문헌
- 9장. 공분산 분석
- 추가 참고 문헌
- 추가 참고 문헌
- 10장. 다중 회귀
- 모형 단순화의 과정
- 주의 사항
- 제거의 순서
- 다중 회귀의 시행
- 실전 예제
- 추가 참고 문헌
- 11장. 대비
- 대비 계수
- R에서 시행한 대비의 예
- 사전 대비
- 처리 대비
- 단계적 제거에 의한 모형 단순화
- 대비 제곱합의 계산
- 이외의 대비
- 참고 문헌
- 추가 참고 문헌
- 12장. 기타 반응 변수들
- 일반화 선형 모형
- 오차 구조
- 선형 예측치
- 적합 값
- 변동성의 일반적 측정
- 연결 함수
- 정준 연결 함수
- 모형 적합도 측정을 위한 아케이케 정보 척도
- 추가 참고 문헌
- 13장. 카운트 데이터
- 포아송 오차를 사용한 회귀
- 카운트 데이터에서 편차 분석
- 분할표의 위험
- 카운트 데이터에서 공분산 분석
- 빈도 분포
- 추가 참고 문헌
- 14장. 비율 데이터
- 하나 또는 두 개의 비율에 대한 데이터 분석
- 비율의 평균
- 비율에서의 카운트 데이터
- 오즈
- 과대 산포와 가설 검정
- 적용
- 이항 분포를 사용한 로지스틱 회귀
- 범주형 설명 변수를 포함하는 비율 데이터
- 이항 데이터를 이용한 공분산 분석
- 추가 참고 문헌
- 15장. 바이너리 반응 변수
- 발생률 함수
- 바이너리 반응 변수를 이용한 공분산 분석
- 추가 참고 문헌
- 16장. 사망과 실패 데이터
- 중도절단을 포함한 생존 분석
- 추가 참고 문헌
- 부록
- R의 계산 기능
- R 내재 함수
- 지수를 포함하는 숫자
- 모듈로
- 할당
- 반올림
- 무한대와 NaN
- 결측 값
- 연산자
- 벡터의 생성
- 벡터의 요소 이름
- 벡터 함수
- 벡터의 그룹에 따른 요약
- 서브스크립트와 인덱스
- 벡터와 논리 서브스크립트
- 벡터에서의 위치
- 음의 서브스크립트를 사용한 벡터의 일부 제거
- 논리 연산
- 반복
- 요인 수준의 생성
- 수열 생성
- 행렬
- 문자열
- R에서의 함수 작성
- 단일 표본에 대한 산술평균 계산 함수
- 단일 표본에 대한 중앙값 계산 함수
- 루프와 반복
- ifelse 함수
- apply를 통한 함수의 적용
- 동일성 검정
- R에서의 검정과 강제 변환
- R에서의 날짜와 시간
- 날짜와 시간의 계산
- str을 이용한 R 객체 구조의 이해
- 참고 문헌
- 추가 참고 문헌
도서 오류 신고
정오표
정오표
[p.26 : 아래서 3행]
많은 경우에서는
->
많은 경우에서
[p.49 : 아래서 2행]
atach(worms)
->
attach(worms)
[p.54 : 본문 아래서 1행]
taaply와 with를 사용할 수 있다.
->
tapply와 with를 사용할 수 있다.
[p.147 : 1행]
범주형 변수
->
연속형 변수