본문 바로가기
장바구니0

하둡 인 프랙티스 > 프로그래밍/언어

상품간략정보 및 구매기능

하둡 인 프랙티스

기본설명

상품 선택옵션 0 개, 추가옵션 0 개

제조사 위키북스
원산지 국내산
브랜드 위키북스
시중가격 40,000원
판매가격 36,000원
배송비결제 주문시 결제
최소구매수량 1 개
최대구매수량 999 개
  • 하둡 인 프랙티스
    +0원

관련상품

등록된 관련상품이 없습니다.

  • 상품 정보

    상품 상세설명

    하둡 인 프랙티스

    9788998139339.jpg

    도서명:하둡 인 프랙티스
    저자/출판사:알렉스,홈즈/위키북스
    쪽수:652쪽
    출판일:2013-09-16
    ISBN:9788998139339

    목차
    [1부] 배경과 기초

    ▣ 01장: 하둡 살펴보기

    1.1 하둡이란?
    1.2 하둡 실행
    1.3 정리

    [2부] 데이터 로지스틱스

    ▣ 02장: 하둡 데이터 이동

    2.1 주요 인그레스 및 이그레스 고려 요소
    2.2 하둡으로 데이터 옮기기
    - 기법 1. 플룸을 활용한 HDFS로의 시스템 로그 발행
    - 기법 2. HDFS로의 파일 자동 복사 메커니즘
    - 기법 3. 우지를 활용한 정기적인 인그레스 활동 예약
    - 기법 4 맵리듀스를 활용한 데이터베이스 인그레스
    - 기법 5. 스쿱을 활용해 MySQL 데이터 불러오기
    - 기법 6. HDFS로의 HBase 인그레스
    - 기법 7. HBase를 데이터 소스로 활용하는 맵리듀
    2.3 하둡 밖으로 데이터 옮기기
    - 기법 8. HDFS 외부로의 파일 복사 자동화
    - 기법 9. 스쿱을 활용한 MySQL로의 데이터 내보내기
    - 기법 10. HBase로의 HDFS 이그레스
    - 기법 11. 맵리듀스에서의 HBase 데이터 싱크 활용
    2.4 장 정리

    ▣ 03장: 데이터 직렬화 텍스트 및 고급 데이터 형식

    3.1 맵리듀스에서의 입출력 이해
    3.2 자주 사용하는 직렬화 형식의 처리
    - 기법 12. 맵리듀스와 XML
    - 기법 13. 맵리듀스와 JSON
    3.3 빅 데이터 직렬화 형식
    - 기법 14. 시퀀스 파일의 활용
    - 기법 15. 맵리듀스에서의 프로토콜 버퍼 연동
    - 기법 16. 쓰리프트 활용
    - 기법 17. 맵리듀스의 차세대 데이터 직렬화 방식
    3.4 커스텀 파일 형식
    기법 18. CSV용 입력 및 출력 형식 쓰기
    3.5 장 정리

    [3부] 빅 데이터 패턴

    ▣ 04장: 빅 데이터에 맵리듀스 패턴 적용하기

    4.1 조인
    - 기법 19. 리파티션 조인 최적화
    - 기법 20. 세미조인의 구현
    4.2 정렬
    - 기법 21. 2차 정렬의 구현
    - 기법 22. 여러 리듀서를 이용한 키 정렬
    4.3 샘플링
    - 기법 23. 저장소 샘플링
    4.4 장 정리

    ▣ 05장: 빅 데이터를 위한 HDFS 스트리밍

    5.1 작은 파일의 처리
    - 기법 24. 애브로를 활용한 여러 개의 작은 파일 저장
    5.2 압축을 활용한 효과적인 저장
    - 기법 25. 데이터에 적합한 압축 코덱의 선택
    - 기법 26. HDFS, 맵리듀스, 피그, 하이브에서의 압축 활용
    - 기법 27. 맵리듀스, 하이브, 피그에서의 분할 가능한 LZOP 활용
    5.3 장 정리

    ▣ 06장: 성능 문제 진단 및 튜닝

    6.1 맵리듀스 및 환경의 측정
    6.2 성능을 저해하는 원인의 파악
    - 기법 28. 입력값의 갑작스러운 증가 여부 조사
    - 기법 29. 맵사이드 데이터 불균형 문제 진단
    - 기법 30. 맵 태스크 쓰루풋이 전반적으로 낮은지 여부 판단
    - 기법 31. 작은 파일
    - 기법 32. 분할 불가능한 파일
    - 기법 33. 지나치게 적거나 많은 리듀서 개수
    - 기법 35. 리듀스사이드 데이터 불균형 문제 판단
    - 기법 35. 리듀스 태스크의 낮은 쓰루풋 여부 판단
    - 기법 36. 느린 셔플 및 정렬
    - 기법 37. 경쟁 잡과 스케줄러 병목
    - 기법 38. 스택 덤프를 활용한 최적화되지 않은 사용자 코드 진단
    - 기법 39. 하드웨어 장애 감지
    - 기법 40. CPU 경쟁
    - 기법 41. 메모리 스와핑
    - 기법 42. 디스크 건강
    - 기법 43. 네트워킹
    6.3 시각화
    - 기법 44. 태스크 실행 시간의 추출 및 시각화
    6.4 튜닝
    - 기법 45. 맵 및 리듀스 태스크의 프로파일링
    - 기법 46. 리듀서 제거
    - 기법 47. 필터 및 투영
    - 기법 48. 컴바이너의 활용
    - 기법 49. 비교기를 활용한 고속 정렬
    - 기법 50. 불균형적 데이터 수집
    - 기법 51. 리듀스 데이터 불균형 문제 최소화
    6.5 장 정리

    [4부] 데이터 사이언스

    ▣ 07장: 데이터 구조 및 알고리즘의 활용

    7.1 그래프를 활용한 데이터 모델링 및 문제 해결
    - 기법 52. 두 사용자 사이의 최단 거리 찾기
    - 기법 53. 친구의 친구 계산
    - 기법 54. 웹 그래프에서의 페이지랭크 계산
    7.2 블룸필터
    - 기법 55. 맵리듀스에서의 병렬적 블룸필터 생성
    - 기법 56. 블룸필터를 활용한 맵리듀스 세미조인
    7.3 장 정리

    ▣ 08장: 통계 및 그 이상을 위한 R과 하둡의 연동

    8.1 R과 맵리듀스 연동 기술의 비교
    8.2 R 기본
    8.3 R과 스트리밍
    - 기법 57. 주가의 일 평균 가격 계산
    - 기법 58. 주식의 누적 이동 평균 주가 계산
    8.4 Rhipe?클라이언트사이드 R 및 하둡 연동 툴
    - 기법 59. Rhipe를 활용한 이동 평균 주가 계산
    8.5 RHadoop?R과 하둡의 경량 클라이언트사이드 연동 툴
    - 기법 60. RHadoop을 활용한 이동 평균 주가 계산
    8.6 장 정리

    ▣ 09장: 머하웃을 활용한 예측적 분석

    9.1 추천인을 활용한 제품 추천
    - 기법 61. 영화 평점을 활용한 항목 기반 추천인
    9.2 분류기
    - 기법 62. 머하웃을 활용한 스팸 분류기 훈련 및 테스트
    9.3 K-평균을 활용한 클러스터링
    - 기법 63. 합성 2D 데이터셋의 K ?평균
    9.4 장 정리

    [5부] 코끼리 길들이기

    ▣ 10장: 하이브 공략하기

    10.1 하이브의 기본
    10.2 하이브를 활용한 데이터 분석
    - 기법 64. 로그 파일 로딩
    - 기법 65. UDF 및 압축 파티션 테이블 쓰기
    - 기법 66. 하이브 조인 튜닝
    10.3 장 정리

    ▣ 11장: 피그 프로그래밍 파이프라인

    11.1 피그의 기본
    11.2 피그를 활용한 로그 데이터 분석 및 악의적인 사용자 찾기
    - 기법 67. 풍부한 스키마를 갖춘 아파치 로그 로딩
    - 기법 68. 필터 및 투영을 활용한 데이터 줄이기
    - 기법 69. IP 주소 그루핑 및 개수 계산
    - 기법 70. 분산 캐시를 활용한 IP 위치 판단
    - 기법 71. 피그와 스크립트의 결합
    - 기법 72. 피그에서의 데이터 결합
    - 기법 73. 튜플 정렬
    - 기법 74. 시퀀스파일로의 데이터 저장
    11.3 피그에서의 사용자 작업 흐름 최적화
    - 기법 75. 빠르게 빅 데이터를 처리하기 위한 4단계 프로세스
    11.4 성능
    - 기법 76. 피그 최적화
    11.5 장 정리

    ▣ 12장: 크런치 및 그 외 기술

    12.1 크런치란?
    12.2 로그에서 가장 인기 있는 URL 찾기
    - 기법 77. 크런치 로그 파싱 및 기본적인 분석
    12.3 조인
    - 기법 78. 크런치의 리파티션 조인
    12.4 캐스케이딩
    12.5 장 정리

    ▣ 13장: 테스트 및 디버깅

    13.1 테스트
    - 기법 79. 맵리듀스 함수, 잡, 파이프라인의 단위 테스트
    - 기법 80. LocalJobRunner를 활용한 잡 테스트
    13.2 사용자 공간 문제 디버깅
    - 기법 81. 태스크 로그 살펴보기
    - 기법 81. 입력 값 분할에서의 문제 진단
    - 기법 83. 태스크의 JVM 시작 인자 판단
    - 기법 84. 디버깅 및 에러 처리
    13.3 맵리듀스 주의 사항
    - 기법 85. 맵리듀스 안티패턴
    13.4 장 정리

    ▣ 부록 A: 관련 기술

    A.1 하둡 1.0.x 및 0.20.x
    A.2 플룸
    A.3 우지
    A.4 스쿱
    A.5 HBase
    A.6 애브로
    A.7 프로토콜 버퍼
    A.8 아파치 쓰리프트
    A.9 스내피
    A.10 LZOP
    A.11 엘리펀트 버드
    A.12 후프
    A.13 MySQL
    A.14 하이브
    A.15 피그
    A.16 크런치
    A.17 R
    A.18 RHIPE
    A.19 RHadoop
    A.20 머하웃

    ▣ 부록 B: 하둡 내장 인그레스 및 이그레스 툴

    B.1 명령행
    B.2 자바 API
    B.3 파이썬/펄/루비에서의 쓰리프트 활용
    B.4 하둡 퓨즈
    B.5 네임노드 임베디드 HTTP
    B.6 HDFS 프록시
    B.7 후프
    B.8 WebHDFS
    B.9 분산 복사
    B.10 WebDAV
    B.11 맵리듀스

    ▣ 부록 C: HDFS 해부

    C.1 HDFS란?
    C.2 HDFS가 파일을 쓰는 방식
    C.3 HDFS가 파일을 읽는 방식

    ▣ 부록 D: 최적화된 맵리듀스 조인 프레임워크

    D.1 최적화된 리파티션 조인 프레임워크
    D.2 복제 조인 프레임워크
    delivery.jpg
  • 사용후기

    사용후기가 없습니다.

  • 상품문의

    상품문의가 없습니다.

  • 배송/교환정보

    배송정보

    배송업체 : 한진택배 (1588-0011)
     배송비
     2,500원 (25,000원 이상 구매 시 무료 배송/일부상품제외) 군부대 및 도서산간 지역은 추가 배송비가 발생할 수 있습니다.
     ◆배송기간
     : 평일 오전 7시 이전 주문 시 당일 발송 (2~3일 소요) : 단, 공휴일, 연휴, 천재지변 등으로 인해 발송이 지연될 수 있습니다.
     ◆배송추적
     : 당일 발송건에 한해 익일 오전 9시 이후 확인 가능합니다.


    교환/반품

     ◆반품/교환을 원하는 경우 반드시 고객센터로 연락 후 신청하시기 바랍니다.
     ◆반품/교환은 상품 수령일로 부터 7일 이내에만 가능합니다. 단, 상품이 훼손되지 않았거나, 속 비닐이 있는 경우 듣지 않았을    때 가능합니다.
     •고객님의 변심 또는 잘못 주문하신 경우에는 왕복 배송비는 고객님의 부담입니다.
     ◆오배송, 파본, 불량 상품에 대해서는 고객센터로 연락주시면 상담 후 교환해 드립니다.
     ◆오배송, 파본, 불량상품의 배송비는 환불처에서 부담합니다.
     교환/반품
     ◆환불은 상품이 환불에 도착 시 처리됩니다. (카드 취소는 3~5일이 소요될 수 있습니다.)

고객센터 1234-5678

회사명 (주)꼭대기 주소 서울 특별시 마포구 연희로 11,5층 S-537호
사업자 등록번호 795-87-00429 대표 오주봉 전화 02-356-5779 팩스 02-356-5779
통신판매업신고번호 제2017-서울마포-0052호 개인정보 보호책임자 dhwnqhd

Copyright © 2001-2013 (주)꼭대기. All Rights Reserved.

상단으로