빅데이터 통계 분석과 오픈소스 R
도서명:빅데이터 통계 분석과 오픈소스 R
저자/출판사:폴,제라드,라디아,M,존슨/성안당
쪽수:448쪽
출판일:2016-03-10
ISBN:9788931554014
목차
저자 소개 4
이 책의 컬러차트, 강의 자료용 소스 다운로드하는 법 5
저자 서문 / 통계 공용어 오픈소스 R / Paul Gerrad·Radia M. Johnson 12
역자 서문 / R을 분석도구로 하는 문제 해결 안내서 / 정석오·최대우 13
이 책을 읽기 전에 14
Chapter 1·R로 프로그래밍 하기·19
R의 자료구조 23 / R로 데이터로드하기 45 / 기본 도표 및 ggplot2 패키지 51 /
제어문 60 / 함수 66 / 프로그래밍 및 디버깅 도구 70 / 요약 74
Chapter 2·R로 배우는 통계 방법론·75
기술통계량 78 / 확률분포 83 / 데이터에 분포를 적합(fit)시키기 88 / 가설 검정 99 / 요약 115
Chapter 3·선형모형·117
통계 모델링에 대한 개괄 118 / 선형회귀 122 / 군집분석 159 / 요약 162
Chapter 4·비선형방법·163
비모수적 모형과 모수적 모형 164 / 흡착 데이터셋과 체위 데이터셋 166 / 이론에 기반한 비선형회귀 166 / 시각화를 통해 비선형성 탐색하기 168 / 선형 프레임워크 확장하기 171 / 비모수적 비선형 방법론 181 / np 패키지의 비모수적 방법론들 195 / 요약 198
Chapter 5·선형대수·199
행렬과 선형대수학 200 / 신체기능(physical functioning) 데이터셋 203 / 기본 행렬 연산 204 / 삼각행렬 217 / 행렬의 분해 218 / 응용 예들 226 / 요약 239
Chapter 6·주성분분석과 요인분석·241
상관 및 공분산 구조 242 / 이 장에서 사용할 데이터셋 242 / 주성분분석과 총분산 243 / PCA를 이용한 형성적 구성개념 259 / 요약 280
Chapter 7·구조방정식모형과 확인적 요인분석·281
데이터셋 282 / SEM의 기본 아이디어 284 / SEM의 행렬 표현 285 / SEM 모형 적합 및 추정 방법 295 / OpenMx와 lavaan의 비교 309 / 요약 313
Chapter 8·모의실험·315
기초적인 샘플링 방법을 이용한 모의실험 316 / 의사난수 317 / 몬테카를로 모의실험 329 / 몬테카를로 적분 352 / 기각샘플링 357 / 중요샘플링 363 / 물리적 시스템 시뮬레이션하기 365 / 요약 367
Chapter 9·최적화·369
일차원 최적화 371 / 선형계획법 392 / 이차계획법 402 / 일반적인 비선형 최적화 404 / 요약 407
Chapter 10·고급 데이터 매니지먼트·409
R에서 데이터 정제하기 410 / 문자열 처리 및 패턴 매칭 412 / 부동소수점 연산 및 수치 데이터 타입 418 / R에서 메모리 관리 420 / 결측 데이터 424 / Amelia 패키지 431 / 요약 443
주요 용어 인덱스 444
주석 인덱스 447