Hadoop Hacks
도서명:Hadoop Hacks
저자/출판사:나카노,다케시,야마다,신이치,사루타,고스케,우에신,가/와우북스
쪽수:528쪽
출판일:2015-12-09
ISBN:9788994405261
목차
·크레딧
·시작하며
1장 시스템 구축/운용 Hacks
01 Hadoop 동작에 필요한 Parameter
02 Hadoop용 node의 Linux OS 설정
03 Master Node의 HA화
04 Hadoop에 관련된 통계정보
05 HDFS의 업그레이드
06 Sqoop의 구조와 동작
07 PostgreSQL에서의 동작
08 Azkaban 입문
09 Azkaban의 이용
2장 Application 개발 Hacks
10 Cluster 외부로부터 Hadoop의 조작
11 InMapperCombiner
12 사용자 정의 Writable형을 만드는 방법
13 사용자 Partitioner를 만드는 방법
14 DistributedCache의 사용방법
15 CombineFileInputFormat
16 MapReduce 작업 테스트하기
17 보조 정렬(Secondary sort)
18 Map 사이드 조인
19 Reduce 사이드 조인
20 다단 MapReduce
21 InputFormat/OutputFormat의 사용방법
22 Cassandra와의 연계
23 API로 HDFS 조작
24 MapReduce 작업 분석
25 Hadoop에서의 압축 파일 취급
3장 HBase Hacks
26 Bulk 로드 도구
27 MySQL에서 가져오기
28 HFile에 직접 액세스하는 MapReduce
29 pre-split 테이블 만들기
30 Coprocessor 만드는 법
31 사용자 Filter 만드는 법
32 export/import 도구
33 클러스터 복제(Cluster Replication)
4장 Hive Hacks
34 SQL과 HiveQL의 다른 점
35 Hive의 실제 운용에서 관리해야 할 것
36 쿼리의 고속화(입문편)
37 쿼리의 고속화(응용편)
38 사용자 정의 함수
39 다른 시스템과 연계하기
40 자체 처리를 통합하기
41 다중 사용자의 이용
42 인덱스의 사용
43 Hive 로그
44 Sqoop에서 데이터 로드
45 차분 데이터의 교환
5장 Pig Hacks
46 custom storage 작성방법
47 PigLatin과 SQL의 차이
48 사용자 정의 함수
49 Embedded Pig
50 MapReduce로의 변환 분석
51 Pig에서 바로 이용할 수 있는 함수 301
6장 Mahout Hacks
52 Mahout 입문
53 설치와 실행방법
54 기초 용어 배우기
55 추천하기(Recommend)를 실행
56 연계분석
57 예측 모델 만들기
58 기계학습과 MapReduce
59 자체 드라이버 만들기
60 Mahout을 이용한 클러스터링
7장 ZooKeeper Hacks
61 ZooKeeper의 API
62 ZooKeeper의 액세스 제어
63 Eclipse를 사용한 개발
64 ZooInspector 사용
65 REST에서 ZooKeeper 사용
66 FUSE에서 ZooKeeper 사용
67 tickTime 구조 이해하기
68 ZAB의 구조 이해하기
69 리더 선택의 구조 이해하기
70 상태와 역할을 이해하기
71 그룹핑.중가치 이용하기
72 분산 애플리케이션 구축
72 ZooKeeper를 중심으로 한 시스템(BookKeeper)
74 BookKeeper를 사용한 시스템
column 1 Cloudera’s Distribution including Apache Hadoop(CDH)에 대해서
column 2 MapR에 대해서
·찾아 보기