R과 하둡을 이용한 빅데이터 분석
도서명:R과 하둡을 이용한 빅데이터 분석
저자/출판사:비그니쉬,프라자파티/에이콘출판
쪽수:252쪽
출판일:2016-02-19
ISBN:9788960778276
목차
1 R과 하둡 준비
__R 설치
__RStudio 설치
__R 언어 특성의 이해
____R 패키지 사용
____데이터 작업 수행
____커뮤니티 지원의 증가
____R에서 데이터 모델링 수행
__하둡 설치
____여러 가지 하둡 모드의 이해
____하둡 설치 단계
________우분투 리눅스에 하둡 설치(단일 노드 클러스터)
________우분투 리눅스에 하둡 설치(멀티 노드 클러스터)
________우분투에 클라우데라 하둡 설치
__하둡 기능의 이해
__HDFS의 이해
________HDFS의 특성
________맵리듀스
__HDFS와 맵리듀스 아키텍처
____HDFS 아키텍처
________HDFS 컴포넌트
___맵리듀스 아키텍처
_______맵리듀스 컴포넌트
___HDFS와 맵리듀스 아키텍처를 그림으로 이해
__하둡 하위 프로젝트의 이해
__요약
2 하둡 맵리둡스 프로그램 작성
__맵리듀스의 기본 이해
__하둡 맵리듀스 소개
____하둡 맵리듀스 개체 나열
____하둡 맵리듀스 시나리오
________HDFS로 데이터 로딩
________맵 단계 수행
________셔플링과 정렬
________리듀스 단계 수행
____맵리듀스의 제약
____문제 해결을 위해 하둡의 능력
____하둡 프로그래밍에서 사용되는 여러 가지 자바 컨셉
__하둡 맵리듀스의 기초
____맵리듀스 객체의 이해
____맵리듀스에서 맵의 개수 결정
____맵리듀스에서 리듀서의 개수 결정
____맵리듀스의 데이터 흐름
____하둡 맵리듀스에서 사용하는 용어
__하둡 맵리듀스 예제 작성
____맵리듀스 잡 수행 과정
________하둡 맵리듀스 잡을 모니터링하고 디버깅하는 방법
________HDFS 데이터 살펴보기
____비즈니스 문제를 해결하는 여러 가지 맵리듀스 정의
__R에서 하둡 맵리듀스를 작성하는 다양한 방법 소개
____RHadoop 소개
____RHIPE 소개
____하둡 스트리밍 소개
__요약
3 R과 하둡 연동
__RHIPE 소개
____RHIPE 설치
________하둡 설치
________R 설치
________프로토콜 버퍼 설치
________환경변수
________rJava 패키지 설치
________RHIPE 설치
____RHIPE 아키텍처의 이해
____RHIPE 예제 살펴보기
________RHIPE 예제 프로그램(단일 맵 프로그램)
________단어 수 세기
____RHIPE 함수의 레퍼런스
________초기화
________HDFS
________맵리듀스
__RHadoop 소개
____RHadoop 아키텍처의 이해
____RHadoop 설치
____RHadoop 예제 살펴보기
________단어 수 세기
____RHadoop 함수의 레퍼런스
________hdfs 패키지
________rmr 패키지
__요약
4 R로 하둡 스트리밍 사용
__하둡 스트리밍의 기본 이해
__R로 하둡 스트리밍을 수행하는 방법
____맵리듀스 애플리케이션의 이해
____맵리듀스 애플리케이션 작성 방법
____맵리듀스 애플리케이션 실행 방법
________명령 프롬프트에서 하둡 스트리밍 잡 실행
________R 또는 RStudio에서 하둡 스트리밍 잡 실행
____맵리듀스 애플리케이션의 결과를 살펴보는 방법
________명령 프롬프트에서 결과 살펴보기
________R 또는 RStudio 콘솔에서 결과 살펴보기
____하둡 맵리듀스 스크립트에서 사용된 기본 R 함수의 이해
____하둡 맵리듀스 잡 모니터링
__R 패키지 HadoopStreaming 살펴보기
____hsTableReader 함수
____hsKeyValReader 함수
____hsLineReader 함수
____하둡 스트리밍 잡 수행
________하둡 스트리밍 잡 실행
__요약
5 R과 하둡으로 데이터 분석
__데이터 분석 프로젝트의 라이프 사이클 이해
____문제 확인
____데이터 요구사항 디자인
____데이터 전처리
____데이터 분석 수행
____데이터 시각화
__데이터 분석 문제의 이해
____웹 페이지의 카테고리 분석
________문제 확인
________데이터 요구사항 디자인
________데이터 전처리
________데이터 분석 수행
________데이터 시각화
____주식 시장 변화의 빈도 계산
________문제 확인
________데이터 요구사항 디자인
________데이터 전처리
________데이터 분석 수행
________데이터 시각화
____불도저를 위한 시험 답안지의 판매 가격 예측
________문제 확인
________데이터 요구사항 디자인
________데이터 전처리
________데이터 분석 수행
________포아송 근사 재표본화의 이해
________RHadoop을 이용한 랜덤 포레스트 학습
__요약
6 기계학습을 이용한 빅데이터 분석
__기계학습 소개
____기계학습 알고리즘의 유형
__감독 학습 알고리즘
____선형 회귀
________R을 이용한 선형 회귀
________R과 하둡을 이용한 선형 회귀
____로지스틱 회귀
________R을 이용한 로지스틱 회귀
________R과 하둡을 이용한 로지스틱 회귀
__무감독 기계학습 알고리즘
____군집화
________R을 이용한 군집화
________R과 하둡을 이용한 군집화 수행
__추천 알고리즘
____R에서의 추천 생성 과정
____R과 하둡으로 추천 생성
__요약
7 다양한 DB에서 데이터 가져오기와 내보내기
__데이터 파일을 데이터베이스로 사용
____다양한 형태의 파일 이해
____R 패키지 설치
____R로 데이터 가져오기
____R에서 데이터 내보내기
__MySQL 사용
____MySQL 설치
____RMySQL 설치
____테이블과 테이블의 구조 알아보기
____R로 데이터 가져오기
____데이터 조작 살펴보기
__엑셀 사용
____엑셀 설치
____R로 데이터 가져오기
____R과 엑셀로 데이터 가공
____데이터를 엑셀로 내보내기
__MongoDB 사용
____MongoDB 설치
________SQL과 MongoDB 용어 매핑
________SQL과 MongoQL 용어 매핑
____rmongodb 설치
____R로 데이터 가져오기
____데이터 조작 살펴보기
__SQLite 사용
____SQLite의 기능 이해
____SQLite 설치
____RSQLite 설치
____R로 데이터 가져오기
____데이터 조작 살펴보기
__PostgreSQL 사용
____PostgreSQL의 기능 이해
____PostgreSQL 설치
____RPostgreSQL 설치
____R에서 데이터 내보내기
__하이브 사용
____하이브의 기능 이해
____하이브 설치
________하이브 설정 세팅
____RHive 설치
____RHive 작업 살펴보기
__HBase 사용
____HBase의 기능 이해
________HBase 설치
____쓰리프트 설치
____RHBase 설치
____R에서 데이터 가져오기
____데이터 조작 살펴보기
__요약
부록 참고자료
__R + 하둡 도움말 문서
__R 그룹
__하둡 그룹
__R + 하둡 그룹
__인기 있는 R 컨트리뷰터
__인기 있는 하둡 컨트리뷰터