빅데이터
도서명:빅데이터
저자/출판사:네이선,마츠,제임스,워렌/정보문화사
쪽수:384쪽
출판일:2016-01-15
ISBN:9788956746531
목차
1장 빅데이터를 위한 새로운 패러다임
1.1 이 책의 구성
1.2 전통적인 데이터베이스를 사용하여 확장하기
1.3 NoSQL은 만병통치약이 아닙니다.
1.4 기본 원칙
1.5 빅데이터 시스템에 요구되는 속성
1.6 완전 증분 아키텍처의 문제점
1.7 람다 아키텍처
1.8 최근의 기술 동향
1.9 예제 애플리케이션: SuperWebAnalytics.com
1.10 요약
2장 빅데이터를 위한 데이터 모델
2.1 데이터의 속성
2.2 데이터 표현을 위한 팩트 기반 모델
2.3 그래프 스키마
2.4 SuperWebAnalytics.com에 대한 최종 데이터 모델
2.5 요약
3장 빅데이터를 위한 데이터 모델: 사례
3.1 어째서 직렬화 프레임워크인가요?
3.2 아파치 스리프트
3.3 직렬화 프레임워크의 한계
3.4 요약
4장 일괄처리 계층의 데이터 저장소
4.1 마스터 데이터 집합 저장소의 요구 사항
4.2 일괄처리 계층을 위한 저장소 솔루션 선택
4.3 분산 파일시스템의 동작 방식
4.4 분산 파일시스템을 사용하여 마스터 데이터 집합을 저장하기
4.5 수직 분할
4.6 분산 파일시스템의 하위 수준 속성
4.7 SuperWebAnalytics.com의 마스터 데이터 집합을 분산 파일시스템에 저장하기
4.8 요약
5장 일괄처리 계층의 데이터 저장소: 사례
5.1 하둡 분산 파일시스템 사용하기
5.2 페일을 사용하여 일괄처리 계층에 데이터를 저장하기
5.3 SuperWebAnalytics.com의 마스터 데이터 집합 저장하기
5.4 요약
6장 일괄처리 계층
6.1 일괄처리의 구실로 좋은 예제
6.2 일괄처리 계층에서 계산을 수행하기
6.3 재계산 알고리즘 대 증분 알고리즘
6.4 일괄처리 계층에서의 확장성
6.5 맵리듀스: 빅데이터 계산을 위한 패러다임
6.6 맵리듀스의 하위 수준 속성
7장 일괄처리 계층: 사례
7.1 사례가 되는 보기
7.2 데이터 처리 코드에서 생기는 흔한 함정
7.3 J캐스캘로그 소개
7.4 합성
7.5 요약
8장 일괄처리 계층 예제: 아키텍처와 알고리즘
8.1 SuperWebAnalytics.com 일괄처리 계층의 설계
8.2 전체 작업흐름
8.3 새 데이터 채워 넣기
8.4 URL 정규화
8.5 사용자 식별자 정규화
8.6 페이지뷰의 중복 제거
8.7 일괄처리 뷰 계산
8.8 요약
9장 일괄처리 계층 예제: 구현
9.1 시작점
9.2 작업흐름 구현 준비
9.3 새 데이터 채워 넣기
9.4 URL 정규화
9.5 사용자 식별자 정규화
9.6 페이지뷰의 중복 제거
9.7 일괄처리 뷰 계산
9.8 요약
10장 서빙 계층
10.1 서빙 계층에 대한 성능 측정기준
10.2 정규화/비정규화 문제에 대한 서빙 계층의 해결책
10.3 서빙 계층 데이터베이스에 대한 요구 사항
10.4 SuperWebAnalytics.com을 위한 서빙 계층 설계
10.5 완전 증분 솔루션과의 대조
10.6 요약
11장 서빙 계층: 사례
11.1 엘리펀트DB의 기본
11.2 SuperWebAnalytics.com의 서빙 계층 구축하기
11.3 요약
12장 실시간 뷰
12.1 실시간 뷰 계산하기
12.2 실시간 뷰 저장하기
12.3 증분식 계산의 어려운 점
12.4 비동기식 대 동기식 갱신
12.5 실시간 뷰 만료시키기
12.6 요약
13장 실시간 뷰: 사례
13.1 카산드라의 데이터 모델
13.2 카산드라 사용하기
13.3 요약
14장 큐잉과 스트림 처리
14.1 큐잉
14.2 스트림 처리
14.3 ‘한 번에 하나’ 방식의 상위 수준 스트림 처리
14.4 SuperWebAnalytics.com 속도 계층
14.5 요약
15장 큐잉과 스트림 처리: 사례
15.1 아파치 스톰으로 토폴로지 정의하기
15.2 아파치 스톰 클러스터와 배포
15.3. 메시지 처리 보장하기
15.4 SuperWebAnalytics.com의 시간대별 순방문자 수를 구하는 속도 계층 구현하기
15.5 요약
16장 ‘미세 일괄’ 스트림 처리
16.1 ‘정확히 한 번’ 의미구조 달성하기
16.2 ‘미세 일괄’ 처리의 핵심 개념
16.3 ‘미세 일괄’ 처리용으로 파이프 다이어그램을 확장하기
16.4 SuperWebAnalytic.com을 위한 속도 계층 완성하기
16.5 다른 관점에서 보는 이탈률 분석 예제
16.6 요약
17장 ‘미세 일괄’ 스트림 처리: 사례
17.1 트라이던트 사용하기
17.2 SuperWebAnalytic.com을 위한 속도 계층 완성하기
17.3 완전한 내결함성을 가진, 인-메모리 방식 ‘미세 일괄’ 처리
17.4 요약
18장 람다 아키텍처, 더 깊이 살펴보기
18.1 데이터 시스템을 정의하기
18.2 일괄처리 계층과 서빙 계층
18.3 속도 계층
18.4 질의 계층
18.5 요약