책 소개
소스 코드 파일은 여기에서 내려 받으실 수 있습니다.
요약
단순히 공식을 설명하는 것이 아니라 부동산 가격 예측, 웹 데이터 분석 등과 같은 실무에서 바로 사용될 만한 풍부한 예제를 통해 회귀분석의 원리를 친절하게 설명한다. 복잡한 계산은 엑셀에 맡기고 회귀분석에 필요한 통계 개념의 원리와 실무 데이터를 적용하는 방법에 대해 집중한다. 이 책을 통해 분산, 표준편차, 상관관계와 같은 기초 개념의 의미를 파악할 수 있으며 회귀분석, 다중비교, 공분산분석 등의 고급 개념까지 이해할 수 있다. 전통적인 분산분석 대신 회귀분석을 사용해 분석의 범위를 확장하고, 엑셀을 사용하여 쉽게 데이터분석을 해보자.
이 책에서 다루는 내용
■ 회귀분석으로 할 수 있는 일과 할 수 없는 일의 이해와 그 이유 알아보기
■ 엑셀에서 기본 제공되는 회귀 함수 마스터하기
■ 상관관계와 단순회귀분석 작업하기
■ 엑셀의 향상된 LINEST() 함수를 최대한 활용하기
■ 다중회귀분석 실험 계획과 수행하기
■ 문제가 되는 회귀분석의 가정과 그렇지 않은 가정 구별하기
■ 일반적인 분산분석 대신 회귀분석을 사용해 분석의 옵션 확장하기
■ 공변량을 분석에 추가, 편향을 줄이고 통계적 검증력을 강화하기
목차
목차
- 1장. 변동 측정: 값들이 얼마나 다른가
- 어떻게 변동이 측정되는가
- 편차의합(Sum of Deviations)
- 편차제곱의합(Summing Squared Deviations)
- 제곱의합에서 분산으로
- VAR.P()와 VAR.S() 함수의 사용
- 표준편차
- 평균의 표준오차
- z-점수와 z-값
- t-값
- 어떻게 변동이 측정되는가
- 2장. 상관관계
- 상관관계 측정
- 상관관계의 강도 나타내기
- 상관관계의 방향 결정
- 상관관계 계산
- 1단계: 공분산
- 부호에 주의하라
- 공분산에서부터 상관계수까지
- CORREL() 함수의 사용
- 상관관계에서의 편향 이해하기
- 상관관계에서 선형성과 특이점 체크
- 차트를 그릴 때 조심해야 하는 부분
- 상관관계와 인과관계
- 원인의 방향
- 제3의 변수
- 범위의 제한
- 상관관계 측정
- 3장. 단순회귀분석
- 상관관계와 표준점수를 이용한 예측
- 예측 계산하기
- 본래 단위로 변환
- 예측 일반화
- 회귀계수와 절편을 이용한 예측
- SLOPE() 함수
- INTERCEPT() 함수
- 공유분산
- 표준편차, 리뷰
- 제곱의합 자세히 보기
- 제곱의합은 가산적이다
- 단순회귀분석에서의 R2
- 잔차제곱의 합과 그룹내제곱의 합
- TREND() 함수
- TREND()에 배열 입력하기
- TREND()의 new x’s 인자
- TREND()의 const 인자
- 제로-상수 회귀 계산
- 부분상관과 준부분상관
- 부분상관
- 준부분상관 이해하기
- 상관관계와 표준점수를 이용한 예측
- 4장. LINEST() 함수
- 배열을 입력받는 LINEST()
- 배열 수식의 메커니즘 이해하기
- 실수 목록
- LINEST()와 SLOPE(), INTERCEPT()의 비교
- 회귀계수의 표준오차
- 회귀계수의 표준오차의 의미
- 0의 회귀계수
- 모집단의 회귀계수가 0일 확률 측정하기
- 주관적인 결정으로서의 통계적인 추론
- t-비와 F비
- 간격척도와 명목척도
- 상관관계의 제곱, R2
- 추정의 표준오차
- t분포와 표준오차
- 잔차의 표준편차로서의 표준오차
- 등분산성: 균등하게 퍼짐
- LINEST()의 F비의 이해
- 분산분석과 F비의 일반적인 사용
- 분산분석과 회귀에서의 F비
- 회귀에서 제곱의합의 분할
- 분산분석에서의 F비
- 회귀분석에서의 F비
- F비와 R2의 비교
- 일반선형모델, ANOVA, 회귀분석
- LINEST()의 기타 보조 통계량
- 배열을 입력받는 LINEST()
- 5장. 다중회귀분석
- 합성 예측변수
- 단일 예측변수에서 다중 예측변수로의 일반화
- 오차제곱의합의 최소화
- 추세선의 이해
- LINEST() 결과를 워크시트에 매핑하기
- 다중회귀분석을 기초부터 만들어 가기
- 변수를 상수로 고정하기
- 두 개의 예측변수가 있는 회귀에서의 준부분상관
- 제곱의합 구하기
- R2과 추정의 표준오차
- F비와 잔차자유도
- 회귀계수의 표준오차 계산
- 몇 가지 추가 예제
- 회귀계수의 표준오차 사용
- 양쪽꼬리검정
- 한쪽꼬리검정
- 예측변수를 평가하기 위한 모델 비교 접근법 사용
- 모델 통계량 얻기
- R2 대신 제곱의합을 사용
- R2의 축소 추정
- 합성 예측변수
- 6장. 회귀분석에 관한 가정과 주의 사항
- 가정에 관하여
- 강건성: 문제가 되지 않을 수도 있다
- 가정과 통계적 추론
- 허수아비
- 비선형과 기타 분포 다루기
- 균등퍼짐 가정
- 더미코딩 사용
- 회귀 접근법과 t-검정 접근법 비교
- 같은 목적지를 향하는 두 개의 경로
- 불균등 분산과 표본 크기
- 불균등퍼짐: 보수적 검정
- 불균등퍼짐 : 진보적인 검정
- 불균등퍼짐과 균등 표본 크기
- 분석 도구 대신 LINEST() 사용
- T.DIST() 함수들 간의 차이 이해
- 웰치의 보정 사용
- TTEST() 함수
- 가정에 관하여
- 7장. 회귀분석을 이용한 그룹 평균 간 차이 검정
- 더미코딩
- 더미코딩의 예
- 벡터 자동으로 채우기
- 던네트 다중비교 과정
- 효과코딩
- 0 대신 -1로 코딩
- 일반선형모델과의 관계
- 효과코딩으로 다중비교
- 직교코딩
- 대비 설정하기
- ANOVA를 통한 계획된 직교대비
- LINEST()를 사용한 계획된 직교대비
- 요소분석
- 직교코딩을 사용한 요소분석
- 효과코딩으로 요인분석
- 통계적 검증력, 제1종 오류, 제2종 오류
- 통계적 검증력 계산하기
- 통계적 검증력 높이기
- 불균등한 셀 크기 다루기
- 회귀 접근법 사용
- 순차적 분산 할당
- 더미코딩
- 8장. 공분산분석
- 결과 대조
- ANCOVA 도표화
- 일반적인 ANCOVA 구조화
- 공변량 없이 분석
- 공변량을 포함한 분석
- 회귀를 사용한 ANCOVA 구조화
- 공통 회귀선 확인
- 분석 요약
- 조정된 평균 검정: ANCOVA에서 계획된 직교코딩
- 회귀접근법을 사용한 ANCOVA와 다중비교
- 계획된 비직교대비를 통한 다중비교
- 사후 비직교대비를 통한 다중비교
- 결과 대조
도서 오류 신고
정오표
정오표
[p.33 : 7행]
((28-18)/1)
->
((28-18)/10)
[p.35 : 1행]
정규곡선과 그 아래 구역에서의 표준편차들의 관계 덕분에 무작위로 선택된 남성의 키가 5.5인치와 6.5인치 사이에 있게 될 확률이 96%에 가깝다는 것을 알 수 있다.
->
정규곡선과 그 아래 구역에서의 표준편차들의 관계 덕분에 무작위로 선택된 남성의 키가 65인치와 75인치(5.5피트와 6.5피트) 사이에 있게 될 확률이 96%에 가깝다는 것을 알 수 있다.
[p.41 : 10행]
분포의 평균 0.0은 장기간 평균 205와 새로운 드라이버의 실제 평균(모집단의 모수) 사이의 차이가 0.0야드인 현실을 나타낸다.
->
분포에서 평균값 0.0은 장기간의 평균인 205와 새로운 드라이버의 실제 평균(모집단의 모수) 사이의 차이가 0.0야드인 상황을 나타낸다.
[p.53 : 1행]
연속체의 반대편에는 자연적으로는 발생하지 않는 강한 관계가 있다.
->
완전한 임의 관계의 반대편에는 자연적으로는 발생하지 않는 강한 관계가 있다.
[p.56 : 6~7행]
(기억하라. z-점수의 평균은 0.0이고 표준편차의 평균은 1.0이다).
->
(기억하라. z-점수 분포의 평균은 0.0이고 표준편차는 1.0이다.)
[p.77 : 아래에서 3행]
몸무게가 키의 오른쪽으로
->
몸무게가 키의 왼쪽으로
[p.103 : 아래에서 2행]
에측되는
->
예측되는