초보자를 위한 아파치 스파크. 2
도서명:초보자를 위한 아파치 스파크. 2
저자/출판사:라자나라야난,토투바이카투마나/에이콘출판
쪽수:384쪽
출판일:2018-01-31
ISBN:9791161751054
목차
1장. 스파크 기초
__아파치 하둡 소개
__스파크 분석
__스파크 설치
____파이선 설치
____R 설치
____스파크 설치
____개발 도구 설치
____추가 소프트웨어 설치
________IPython
________RStudio
________아파치 제플린
__참고문헌
__요약
2장. 스파크 프로그래밍 모델
__스파크 함수 프로그래밍
__스파크 함수 프로그래밍
____스파크 RDD 불변성
____스파크 RDD 분산 용이성
____스파크 RDD 메모리 상주
____스파크 RDD의 강력한 데이터 타입 지원
__스파크 RDD를 이용한 데이터 변환과 액션
__스파크 모니터링
__스파크 프로그래밍 기초
____맵리듀스
____조인
____추가 액션
__파일에서 RDD 생성
____스파크 라이브러리 스택
__참고문헌
__요약
3장. 스파크 SQL
__데이터 구조
__왜 스파크 SQL인가?
__스파크 SQL 해부
__데이터프레임 프로그래밍
____SQL 프로그래밍
____데이터프레임 API 프로그래밍
__스파크 SQL 집계
__스파크 SQL을 사용한 다중 데이터 소스 연결
__데이터셋
__데이터 카탈로그
__참고문헌
__요약
4장. 스파크 R 프로그래밍
__SparkR의 필요성
__R 언어의 기초
__R 데이터프레임과 스파크
__R을 이용한 스파크 데이터프레임 프로그래밍
____SQL 프로그래밍
____R 데이터프레임 API를 이용한 프로그래밍
__스파크 R을 이용한 집계
__SparkR을 이용한 다중 데이터 소스 조인
__참고문헌
__요약
5장. 파이선과 함께하는 스파크 데이터 분석
__차트 및 그래프 작성 라이브러리
__데이터셋 설정
__데이터 분석 유스 케이스
__차트와 그래프
____히스토그램
____밀도 그래프
____막대 차트
________누적 막대형 차트
____파이 차트
________도넛 차트
____상자 그래프
____수직 막대 그래프
____산점도
________강화된 산점도
____라인 그래프
__참고문헌
__요약
6장. 스파크 스트림 처리
__데이터 스트림 처리
__마이크로 배치 데이터 처리
____DStream 프로그래밍
__로그 이벤트 처리기
____넷캣 서버 시작
____파일 정리
____스파크 클러스터 작업 제출
____애플리케이션 모니터링
____스칼라 애플리케이션 구현
____애플리케이션 컴파일 및 실행
____출력 결과물 처리
____파이선 애플리케이션 실행
__구간 데이터 처리
____스칼라 애플리케이션 로그 이벤트 메시지 빈도수 세기
____파이선 애플리케이션 로그이벤트 메시지 빈도수 세기
__추가 처리 옵션
__카프카 스트림 처리
____주키퍼와 카프카 시작하기
____스칼라 애플리케이션 구현
____파이선 애플리케이션 구현
__실제 스파크 스트리밍 작업
____스파크 데이터 처리 애플리케이션 실패-내구성 구현
____구조 데이터 스트리밍
__참고문헌
__요약
7장. 스파크 머신 러닝
__머신 러닝
__스파크가 머신 러닝에 적합한 이유
__와인 품질 예측
__모델 저장
__와인 분류
__스팸 필터링
__특징 알고리즘
__동의어 찾기
__참고문헌
__요약
8장. 스파크 그래프 처리
__그래프와 사용 사례 이해
__스파크 GraphX 라이브러리
____GraphX overview
____그래프 분할
____그래프 처리
____그래프 구조 처리
__테니스 토너먼트 분석
__페이지랭크 알고리즘 적용
__연결된 구성 요소 알고리즘
__그래프프레임
__그래프프레임 쿼리
__참고문헌
__요약
9장. 스파크 애플리케이션 디자인
__람다 아키텍처
__람다 아키텍처 마이크로****
____SfbMicroBlog 오버뷰
____데이터 이해
____데이터 사전 설정
__람다 아키텍처 구현
____배치 레이어
____서빙 레이어
____스피드 레이어
________쿼리
__스파크 애플리케이션 작업
__코딩 스타일
__소스 코드 셋업
__데이터 소화
__뷰와 쿼리 생성
__커스텀 데이터 처리 이해
__참고문헌
__요약