마스터링 아파치 스파크(Mastering Apache Spark)
도서명:마스터링 아파치 스파크(Mastering Apache Spark)
저자/출판사:마이크,프램톤/정보문화사
쪽수:356쪽
출판일:2016-06-08
ISBN:9788956746951
목차
1장 아파치 스파크
1.1. 개요
1.2. 클러스터 디자인
1.3. 클러스터 관리
1.4. 성능
1.5. 클라우드
1.6. 요약
2장 아파치 스파크 MLlib
2.1. 환경 설정
2.2. 나이브 베이즈(Naive Bayes) 분류
2.3. K-평균(K-Means) 클러스터링
2.4. ANN - 인공 신경망(Artificial Neural Networks)
2.5. 요약
3장 아파치 스파크 스트리밍(Streaming)
3.1. 개요
3.2. 오류 및 복구
3.3. 스트리밍 소스
3.4. 요약
4장 아파치 스파크 SQL
4.1. SQL 콘텍스트
4.2. 데이터 불러오기 및 저장하기
4.3. 데이터프레임
4.4. SQL 사용하기
4.5. 사용자 정의 함수
4.6. 하이브 사용하기
4.7. 요약
5장 아파치 스파크 GraphX
5.1. 그래프 개요
5.2. GraphX 코딩
5.3. Neo4j용 메이즈러너(Mazerunner)
5.4. 요약
6장 그래프 기반 스토리지
6.1. 타이탄(Titan)
6.2. 팅커팝(TinkerPop)
6.3. 타이탄 설치
6.4. HBase와 함께 타이탄 사용하기
6.5. 카산드라(Cassandra)와 함께 타이탄 사용하기
6.6. 스파크를 사용하여 타이탄에 접근하기
6.7. 요약
7장 H2O를 사용한 스파크 확장
7.1. 개요
7.2. 프로세싱 환경
7.3. H2O 설치
7.4. 빌드 환경
7.5. 아키텍쳐
7.6. 데이터 소싱
7.7. 데이터 품질
7.8. 성능 튜닝
7.9. 딥 러닝(Deep Learning)
7.10. H2O FLOW
7.11. 요약
8장 스파크 데이터브릭스(Databricks)
8.1. 개요
8.2. 데이터브릭스 설치
8.3. AWS 과금
8.4. 데이터브릭스 메뉴
8.5. 계정 관리
8.6. 클러스터 관리
8.7. 노트북과 폴더(Notebooks and folders)
8.8. 작업과 라이브러리(Jobs and libraries)
8.9. 개발 환경
8.10. 데이터브릭스 테이블
8.11. DbUtils 패키지
8.12. 요약
9장 데이터브릭스 시각화(Visualization)
9.1. 데이터 시각화
9.2. REST 인터페이스
9.3. 데이터 이동
9.4. 참고 도서
9.5. 요약