실무 프로젝트로 배우는 데이터 분석 with R
도서명:실무 프로젝트로 배우는 데이터 분석 with R
저자/출판사:박기군/위키북스
쪽수:448쪽
출판일:2021-05-13
ISBN:9791158392567
목차
▣ 01장: 데이터 분석 과정의 이해
1.1 데이터 분석에 필요한 요소
___1.1.1 실무에서 마주치는 데이터 분석
___1.1.2 데이터 분석의 목적 설정과 진행 과정
___1.1.3 데이터 분석 방법론
___1.1.4 데이터 분석 결과의 검증 방법
___1.1.5 분석 결과를 표현하는 능력
1.2 데이터 분석의 유형
___1.2.1 요리할 것인가? 건물을 지을 것인가?
___1.2.2 보고서 작성을 위한 데이터 분석
___1.2.3 주기적으로 진행해야 하는 데이터 분석
1.3 데이터 분석에서 주의할 점
___1.3.1 데이터 분석과 도메인 지식
___1.3.2 데이터 분석 결과의 가시성
1.4 정리
▣ 02장: 실무 데이터 분석을 위한 R 기본 문법과 통계 지식
2.1 R 분석 환경 구성
___2.1.1 R, RStudio 설치 방법
___2.1.2 R 설치 후 환경 설정
2.2 데이터 타입 소개
___2.2.1 데이터 특성에 대한 이해
___2.2.2 수집된 데이터의 기본 가정
___2.2.3 비정형 데이터
2.3 R 1차원 데이터 다루기
___2.3.1 1차원 벡터 변수 다루기
___2.3.2 1차원 벡터 변수 특성 다루기
___2.3.3 문자열 다루기
___2.3.4 1차원 벡터 인덱싱
___2.3.5 1차원 벡터의 연산
___2.3.6 1차원 벡터 샘플링
2.4 R 행렬, 데이터프레임 다루기
___2.4.1 행렬 생성
___2.4.2 행렬 인덱싱
___2.4.3 행렬의 연산
___2.4.4 데이터프레임 생성
___2.4.5 데이터 행/열의 이름 변경, 인덱싱
___2.4.6 데이터프레임 변수 추가 및 변경
___2.4.7 데이터프레임 병합
2.5 R 리스트 데이터 다루기
___2.5.1 리스트 데이터 생성 및 인덱싱 - list()
2.6 R 데이터 불러오기 및 저장
___2.6.1 데이터 불러오기
___2.6.2 데이터 저장하기
2.7 반복문과 조건문
___2.7.1 for 문을 활용한 반복문 작성
___2.7.2 assign을 활용한 할당문 작성
___2.7.3 if, ifelse를 활용한 조건문 적용
2.8 결측치 처리
___2.8.1 결측치 데이터 탐색 - is.na()
___2.8.2 결측치 제거
___2.8.3 결측치 데이터 대체
2.9 사용자 함수 정의
___2.9.1 function() 소개
___2.9.2 function() 응용
2.10 R 패키지
___2.10.1 R 패키지 설치
2.11 중고차 데이터를 활용한 데이터 전처리 1
___2.11.1 데이터 연산 동시 처리
2.12 중고차 데이터를 활용한 데이터 전처리 2
___2.12.1 체인 연산자
___2.12.2 데이터셋에 새로운 변수 추가
___2.12.3 데이터 집계
___2.12.4 데이터 정렬
___2.12.5 조건에 따른 데이터 추출
___2.12.6 데이터 병합
___2.12.7 데이터 샘플링
___2.12.8 중복 데이터 처리
2.13 dplyr 활용 응용
___2.13.1 데이터 전처리 응용 1
___2.13.2 데이터 전처리 응용 2
___2.13.3 데이터 전처리 응용 3
2.14 중고차 데이터를 활용한 데이터 시각화 기초
___2.14.1 ggplot2의 기본 문법
___2.14.2 ggplot2 활용
2.15 데이터 구조 변환
___2.15.1 reshape 패키지 활용
2.16 정리
▣ 3장: 중고차 판매 데이터를 활용한 데이터 분석 기초
3.1 데이터 분석을 위한 확률과 평균 기초
___3.1.1 확률변수
___3.1.2 확률
___3.1.3 모수와 통계량
3.2 데이터 분석을 위한 확률분포
___3.2.1 이산형 확률분포
___3.2.2 중심극한정리
___3.2.3 연속형 확률분포
3.3 확률분포 함수
___3.3.1 난수 생성
___3.3.2 확률밀도, 누적분포, 분위수
3.4 중고차 가격 분포 확인을 위한 데이터 분포 탐색
___3.4.1 왜도와 첨도
___3.4.2 데이터 변환을 통한 분포 탐색
3.5 중고차 가격 분석을 위한 통계적 가설 검정
___3.5.1 귀무가설과 대립가설
___3.5.2 검정통계량과 임곗값
3.6 중고차 특성 분석을 위한 평균 분석
___3.6.1 일표본 t 검정
___3.6.2 독립표본 t 검정
___3.6.3 분산분석
3.7 중고차 가격에 미치는 영향 파악을 위한 관계 분석
___3.7.1 상관분석
___3.7.2 회귀분석
___3.7.3 회귀분석 성능 개선 방법
___3.7.4 회귀분석을 활용한 예측
___3.7.5 예측 성능 개선을 위한 비선형 모형
3.8 중고차 판매 가격 예측을 위한 분석
___3.8.1 범주형 변수를 활용한 예측 분석
___3.8.2 다중 회귀분석을 활용한 예측 분석
___3.8.3 예측 모형의 성능 평가
3.9 중고차 등급 분석을 위한 분류 모형
___3.9.1 로지스틱 회귀분석
___3.9.2 로지스틱 회귀분석의 평가 방법
___3.9.3 다중 로지스틱 회귀분석
3.10 중고차 등급 분석을 위한 머신러닝 기초
___3.10.1 의사결정나무
___3.10.2 랜덤 포레스트
3.11 정리
▣ 4장: 중고차 판매 데이터를 활용한 데이터 분석 심화
4.1 중고차 데이터 분할을 위한 데이터 분석 기법
___4.1.1 비슷한 유형의 중고차 탐색 - 유사도 분석
___4.1.2 계층적 군집분석
___4.1.3 비계층적 군집분석
4.2 중고차 특성의 차원 축소를 위한 데이터 분석 기법
4.3 정리
▣ 5장: 내 중고차 시세 확인 서비스 예측 분석
5.1 분석 개요
5.2 데이터 전처리
___5.2.1 데이터 및 패키지 불러오기
___5.2.2 데이터 전처리
5.3 현재 시세 정보 서비스 구현
___5.3.1 서비스 구현을 위한 함수 정의
5.4 신규 서비스 구현
___5.4.1 신규 서비스 구현을 위한 함수 정의
5.5 신규 서비스 테스트
5.6 정리
▣ 6장: 마케팅의 핵심 RFM 분석
6.1 분석 개요
6.2 데이터 전처리
___6.2.1 데이터 및 패키지 불러오기
___6.2.2 이벤트 로그 데이터
6.3 고객 구매 데이터 분석
___6.3.1 데이터 전처리
___6.3.2 데이터 시각화
6.4 대시보드 설계
___6.4.1 대시보드를 위한 통계치 표현
___6.4.2 대시보드 예시
6.5 고객 분류를 위한 RFM 분석
___6.5.1 RFM 분석 접근 방식
___6.5.2 RFM 분석
___6.5.3 코호트 분석
6.6 정리
▣ 7장: 리뷰 데이터 분석을 통한 감성사전 만들기
7.1 분석 개요
7.2 데이터 전처리
___7.2.1 데이터 및 패키지 불러오기
7.3 리뷰 데이터 기본 분석
___7.3.1 데이터 전처리
___7.3.2 데이터 기본 분석
7.4 감성사전 생성을 위한 모델링
___7.4.1 키워드 점수 계산을 위한 데이터셋 생성
___7.4.2 고차원 분류 모형
7.5 고객 리뷰 감성분석
___7.5.1 감성분석 진행
7.6 정리
▣ 8장: 마켓 데이터 분석
8.1 분석 개요
8.2 데이터 전처리
___8.2.1 데이터 및 패키지 불러오기
8.3 상위 판매 상품 분석
___8.3.1 판매 상품 분석
8.4 고객 구매 패턴 분석
___8.4.1 고객 재방문 시기 분석
___8.4.2 고객 구매 물품 분석
___8.4.3 고객의 구매 패턴에 따른 군집 생성
8.5 추천 시스템
___8.5.1 추천 시스템의 개념
___8.5.2 추천 시스템 구현
8.6 정리