현장에서 바로써먹는 데이터 분석 with R
도서명:현장에서 바로써먹는 데이터 분석 with R
저자/출판사:김임용/심통
쪽수:392쪽
출판일:2021-08-05
ISBN:9791197529504
목차
Chapter 1 데이터 분석의 이해
1 데이터란?
1-1 데이터의 정의
1-2 데이터 → 정보 → 지식 → 지혜
1-3 빅데이터의 등장
1-4 빅데이터가 만들어 내는 변화
1-5 빅데이터의 활용
1-6 빅데이터와 인공지능
2 데이터 분석이란?
2-1 데이터 과학? 데이터 분석? 데이터 마이닝?
2-2 데이터 분석가와 데이터 과학자
2-3 도메인 지식
3. 데이터 분석의 발달 과정
3-1 통계학의 등장
3-2 사람들이 통계를 어려워하는 이유
3-3 컴퓨터의 등장과 인공지능
3-4 인공지능, 머신러닝 그리고 딥 러닝
4 데이터 분석 과정
4-1 데이터 분석의 결과물
4-2 데이터 분석 과정
5 데이터 분석 가이드 맵
[요약]
[연습문제]
Chapter 2 데이터 분석을 위한 준비
1 데이터 수집
1-1 데이터 수집 방법
1-2 데이터베이스에서의 데이터 수집 방법-SQL
1-3 웹에서의 데이터 수집 방법-웹 크롤링
1-4 API에서의 데이터 수집 방법
2 데이터 셋 준비 시 주의해야 할 점
2-1 분석에 적합한 데이터 형태
2-2 이항 데이터
2-3 범주형 데이터를 수치화시키는 방법-One-Hot Encoding
3 R & RStudio 설치하기
3-1 R이 무엇인가요?
3-2 R의 특징
3-3 R을 배울까요? 파이썬을 배울까요?
3-4 R 설치하기(Windows 기반)
3-5 R 설치하기(Mac OS 기반)
3-6 RStudio 설치하기(Windows 기반)
3-7 RStudio 화면 구성
4 Studio 새 프로젝트 만들기
4-1 새 프로젝트 만들기
4-2 프로젝트 저장하기
4-3 새 소스 탭 추가하기
4-4 소스 파일 불러오기
5 패키지 설치하기
5-1 패키지란?
5-2 패키지 설치하기(인터넷 연결 환경)
5-3 패키지 설치하기(Off-Line 환경)
[요약]
[연습문제]
Chapter 3 데이터 다루기
1 R 문법에 대한 이해
1-1 R 문법 체계
1-2 변수
1-3 주석 사용하기
1-4 도움말 및 예제 불러오기
2 데이터 프레임 다루기
2-1 데이터 프레임이란?
2-2 데이터 프레임 다루기
2-3 나머지 데이터 타입
3. 데이터 정제
3-1 결측치(NA)
3-2 이상치(Outlier)
3-3 스케일링(Scaling)
[요약]
[연습문제]
Chapter 4 통계 분석과 기본 그래프
1 어제까지 몇 마리의 병아리가 부화했을까?(기초 통계량)
1-1 데이터 불러오기
1-2 데이터 확인하기
1-3 기초 통계량 구하기
1-4 데이터 정렬하기
1-5 막대 그래프 그려보기
1-6 그래프 색상 바꿔보기
1-7 그래프 위에 텍스트 추가하기
1-8 그래프 위에 선 추가하기
1-9 파이 차트 그려보기
2 부화한 병아리들의 체중은 얼마일까?(정규분포와 중심극한정리)
2-1 데이터 불러와서 구조와 유형 확인하기
2-2 통계량으로 분포 확인하기
2-3 히스토그램으로 분포 확인하기
2-4 상자그림으로 분포 확인하기
2-5 다중 그래프로 분포 확인하기
3 사료 제조사별 성능 차이가 있을까?(가설검정)
3-1 데이터 불러와서 확인하기
3-2 상자그림으로 분포 비교하기
3-3 정규분포인지 검정하기
3-4 t-test로 두 집단 간 평균 검정하기
[요약]
[연습문제]
Chapter 5 상관 분석과 회귀 분석
1 병아리의 성장에 영향을 미치는 인자는 무엇일까?(상관분석)
1-1 상관분석이란?
1-2 데이터 불러와서 확인하기
1-3 상관분석을 위한 별도 데이터 셋 만들기
1-4 상관분석 실시
1-5 상관분석 결과 표현하기
2 병아리의 체중을 예측할 수 있을까?(회귀분석)
2-1 회귀분석이란?
2-2 단순 선형 회귀분석
2-3 다중 회귀분석
2-4 다중공선성
2-5 비선형 회귀분석
[요약]
[연습문제]
Chapter 6 분류 및 군집 분석
1 병아리의 성별을 구분할 수 있을까?(로지스틱 회귀)
1-1 로지스틱 회귀란?
1-2 데이터 불러와서 확인하기
1-3 로지스틱 회귀분석
1-4 분류 알고리즘의 성능 평가 방법
1-5 로지스틱 회귀모델의 성능 평가
2 병아리의 품종을 구분할 수 있을까?(분류 알고리즘)
2-1 다양한 분류 알고리즘
2-2 나이브 베이즈 분류
2-3 k-최근접 이웃
2-4 의사결정나무
2-5 배깅
2-6 부스팅
2-7 랜덤 포레스트
2-8 서포트 벡터 머신
2-9 XGBoost와 하이퍼 파라미터 튜닝
2-10 분류 알고리즘 결과 정리
3 효과적인 사육을 위해 사육환경을 분리해보자!(군집 알고리즘)
3-1 군집 알고리즘
3-2 k-평균 군집 알고리즘
[요약]
[연습문제]
Chapter 7 인공 신경망과 딥 러닝
1 성장한 닭의 체중을 예측할 수 있을까?(회귀)
1-1 인공신경망이란?
1-2 데이터 확인 및 분할하기
1-3 상관계수 확인 및 간단한 신경망 구현
1-4 회귀모델의 성능 평가
1-5 딥 러닝이란?
1-6 H2O 활용 딥 러닝 구현(회귀)
2 딥 러닝을 이용해 병아리 품종을 다시 구분해 보자!(분류)
2-1 Keras 활용 딥 러닝 구현(분류)
2-2 과적합을 줄이는 방법(드롭아웃)
[요약]
[연습문제]
Chapter 8 텍스트 마이닝
1 고객 리뷰에서 어떻게 핵심을 파악할 수 있을까?(워드 클라우드)
1-1 워드 클라우드란?
1-2 Rtools 설치하기
1-3 패키지 설치하기
1-4 세종사전 및 데이터 불러오기
1-5 텍스트 데이터 가공하기
2 고객들은 정말로 만족했을까?(감성 분석)
2-1 감성 분석이란?
2-2 감성 사전 준비
2-3 데이터 가공 3
2-4 감성 분석
2-5 결과 시각화
[요약]
[연습문제]
Chapter 9 참고할 만한 내용들
1 데이터베이스 연결 및 SQL 사용법
1-1 데이터베이스 연결 방법
1-2 데이터베이스 테이블의 데이터 조회(Select)
1-3 데이터베이스 테이블의 데이터 입력(Insert)
1-4 데이터베이스 테이블의 데이터 삭제(Delete)
2 비대칭 데이터
2-1 비대칭 데이터란?
2-2 언더 샘플링
2-3 오버 샘플링
3 차원축소와 주성분 분석(PCA)
3-1 차원축소란?
3-2 주성분 분석(PCA)
4 데이터 재구조화(Melt & Cast)
4-1 데이터 재구조화
4-2 열을 행으로 변환(Melt)
4-3 행을 열로 변환(Cast)
5 학습을 위한 대표적인 데이터 셋 소개
5-1 R 내장 데이터 셋
5-2 MNIST
5-3 학습용 데이터 셋 취득
6 데이터 분석 학습 사이트 소개
6-1 생활코딩
6-2 데이터 사이언스 스쿨
6-3 코세라
6-4 캐글
연습문제 정답