데이터 과학 입문자를 위한 R
도서명:데이터 과학 입문자를 위한 R
저자/출판사:재리드,랜더/에이콘출판
쪽수:648쪽
출판일:2017-12-27
ISBN:9791161750989
목차
1장. R 설치
__1.1 R 다운로드하기
__1.2 R 버전
__1.3 32비트 대 64비트
__1.4 설치
____1.4.1 윈도우에서 설치하기
____1.4.2 맥 OS X에 설치하기
____1.4.3 리눅스에 설치하기
__1.5 마이크로소프트 R 오픈
__1.6 결론
2장. R 환경
__2.1 커맨드라인 인터페이스
__2.2 RStudio
____2.2.1 RStudio 프로젝트
____2.2.2 RStudio 툴
____2.2.3 깃 통합
__2.3 마이크로소프트 비주얼 스튜디오
__2.4 결론
3장. R 패키지
__3.1 패키지 인스톨
____3.1.1 패키지 제거
__3.2 패키지 로딩
____3.2.1 패키지 언로딩
__3.3 패키지 만들기
__3.4 결론
4장. R의 기초
__4.1 기초 수학
__4.2 변수
____4.2.1 변수 할당
____4.2.2 변수 제거
__4.3 데이터 유형
____4.3.1 숫자형 데이터
____4.3.2 문자열 데이터
____4.3.3 날짜
____4.3.4 논리형
__4.4 벡터
____4.4.1 벡터 연산
____4.4.2 팩터형 벡터
__4.5 함수 호출하기
__4.6 함수에 대한 도움말 문서
__4.7 결측값
____4.7.1 NA
____4.7.2 NULL
__4.8 파이프
__4.9 결론
5장. 고급 데이터 구조
__5.1 데이터 프레임
__5.2 리스트
__5.3 행렬
__5.4 배열
__5.5 결론
6장. R로 데이터 읽어 오기
__6.1 CSV 파일 읽기
____6.1.1 read_delim
____6.1.2 fread
__6.2 엑셀 데이터
__6.3 데이터베이스에서 데이터 읽기
__6.4 다른 통계 툴의 데이터
__6.5 R 바이너리 파일
__6.6 R에 포함돼 있는 데이터
__6.7 웹 사이트에서 데이터 추출하기
__6.8 JSON 데이터 읽기
__6.9 결론
7장. R 통계 그래프
__7.1 기본 그래픽스
____7.1.1 기본 히스토그램
____7.1.2 기본 산점도
____7.1.3 상자그림
__7.2 ggplot2
____7.2.1 ggplot2로 히스토그램과 밀도 곡선
____7.2.2 ggplot2 산점도
____7.2.3 ggplot2 상자그림과 바이올린 플롯
____7.2.4 ggplot2 꺾은선그래프
____7.2.5 테마
__7.3 결론
8장. R 함수 작성
__8.1 헬로 월드
__8.2 함수 인자
____8.2.1 디폴트 인자
____8.2.2 부가 인자들
__8.3 Return Values
__8.4 do.call
__8.5 결론
9장. R 제어문
__9.1 if와 else
__9.2 switch
__9.3 ifelse
__9.4 복합 테스트
__9.5 결론
10장. 루프, R에서는 그다지 환영받지 못하는 존재
__10.1 for 루프
__10.2 while 루프
__10.3 루프 조절
__10.4 결론
11장. 그룹별 데이터 조작
__11.1 Apply 패밀리
____11.1.1 apply 함수
____11.1.2 lapply와 sapply 함수
____11.1.3 mapply 함수
____11.1.4 기타 apply 함수들
__11.2 집계
__11.3 plyr 패키지
____11.3.2 llply
____11.3.3 plyr 헬퍼 함수
____11.3.4 속도 대 편이성
__11.4 data.table
____11.4.1 키
____11.4.2 데이터 테이블 집계
__11.5 결론
12장. dplyr 패키지로 빠르게 그룹 단위로 데이터 다루기
__12.1 파이프(Pipes)
__12.2 tbl
__12.3 select
__12.4 filter
__12.5 slice
__12.6 mutate
__12.7 summarize
__12.8 group_by
__12.9 arrange
__12.10 do
__12.11 데이터베이스와 dplyr 사용
__12.12 결론
13장. purrr 패키지를 사용한 순회
__13.1 map
__13.2 반환값의 유형을 정의한 map 함수
__13.3 데이터 프레임에서 순회하기
__13.4 여러 입력값에 대해 map 사용하기
__13.5 결론
14장. 데이터 재구조화
__14.1 cbind와 rbind
__14.2 조인
__14.3 결론
15장. 타이디버스로 데이터 재구조화
__15.1 행과 열을 붙이기
__15.2 dplyr를 사용한 조인
__15.3 데이터 포맷 변환
__15.4 결론
16장. 문자열 처리
__16.1 paste 함수
__16.2 sprintf 함수
__16.3 텍스트 추출
__16.4 정규 표현식
__16.5 결론
17장. 확률 분포
__17.1 정규 분포
__17.2 이항 분포(Binomial Distribution)
__17.3 포아송 분포
__17.4 기타 분포들
__17.5 결론
18장. 기초 통계학
__18.1 요약 통계
__18.2 상관과 공분산(Correlation, Covariance)
__18.3 t-검정
__18.3 단일-표본 t 검정
__18.4 ANOVA
__18.5 결론
19장. 선형 모형
__19.1 단순선형회귀
__19.3 결론
20장. 일반화 선형 모형
__20.1 로직스틱 회귀
__20.2 포아송 회귀
__20.3 기타 일반화 선형 모형들
__20.4 생존 분석
__20.5 결론
21장. 모형 진단
__21.1 잔차(Residuals)
__21.2 모형들을 비교하는 방법
__21.3 교차 타당성 검증(Cross-Validation)
__21.4 부트 스트랩
__21.5 단계적 변수 선택
__21.6 결론
22장. 정형화(Regularization)와 축소(Shrinkage)
__22.2 베이즈 축소(Bayesian Shrinkage)
__22.3 결론
23장. 비선형 모형
__23.1 비선형 최소 제곱
__23.2 스플라인(splines)
__23.3 일반화 가법 모형(Generalized Additive Models)
__23.4 의사결정 나무(decision trees)
__23.5 부스팅 의사결정 나무(boosted tress)
__23.6 랜덤 포리스트(Random Forests)
__23.7 결론
24장. 시계열과 자기상관
__24.1 자기회귀이동평균(Autoregressive Moving Average)
__24.2 벡터자기회귀모형(VAR)
__24.3 일반화 자동회귀 조건부 이분산 모형(GARCH)
__24.4 결론
25장. 군집화
__25.1 K-평균 군집화
__25.2 PAM
__25.3 계층적 군집화
__25.4 결론
26장. Caret을 사용한 모형 적합
__26.1 caret 패키지의 기초
__26.2 Caret 옵션들
__26.3 부스팅 의사결정 나무에 대한 조율
__26.4 결론
27장. 니터(knitr)를 활용한 재현성과 보고서
__271. 레이텍 프로그램 인스톨
__27.2 레이텍의 기초
__27.3 레이텍과 함께 니터 사용하기
__27.4 결론
28장. R 마크다운으로 다양한 포맷의 문서 만들기
__28.1 문서 컴파일
__28.2 문서 헤더
__28.3 마크다운의 기초
__28.4 마크다운 코드 청크
__28.5 htmlwidgets
__28.6 R 마크다운 슬라이드 쇼
__28.7 결론
29장. 샤이니로 인터랙티브 대시보드 만들기
__29.1 R 마크다운 문서 안에서 샤이니 사용하기
__29.2 샤이니에서의 반응성 표현식
__29.3 서버와 UI
__29.4 결론
30장. R 패키지 개발
__30.1 폴더 구조
__30.2 패키지 파일들
__30.3 패키지 문서화
__30.4 테스트
__30.5 체킹, 빌딩, 인스톨링
__30.6 CRAN에 패키지 제출하기
__30.7 C++ 코드
__30.8 결론
부록 A. 주변에서 찾을 수 있는 R 리소스
부록 B. 용어 정리