빅데이터 분석을 위한 스파크2 프로그래밍 > 전산통계/해석

본문 바로가기
쇼핑몰 검색
  • 회원가입
    2000

    로그인

    다양한 서비스와 이벤트 혜택을 누리실 수 있습니다.

    아이디 비밀번호
빅데이터 분석을 위한 스파크2 프로그래밍 > 전산통계/해석

빅데이터 분석을 위한 스파크2 프로그래밍 요약정보 및 구매

기본설명

상품 선택옵션 0 개, 추가옵션 0 개

제조사 위키북스
원산지 국내산
브랜드 위키북스
시중가격 35,000원
판매가격 31,500원
배송비결제 주문시 결제
최소구매수량 1 개
최대구매수량 999 개

선택된 옵션

  • 빅데이터 분석을 위한 스파크2 프로그래밍
    +0원
위시리스트

관련상품

등록된 상품이 없습니다.

  • 상품정보
  • 사용후기 0
  • 상품문의 0
  • 배송정보
  • 교환정보
  • 상품정보

    상품 기본설명

    기본설명

    상품 상세설명

    빅데이터 분석을 위한 스파크2 프로그래밍

    9791158391034.jpg

    도서명:빅데이터 분석을 위한 스파크2 프로그래밍
    저자/출판사:백성민/위키북스
    쪽수:644쪽
    출판일:2018-04-12
    ISBN:9791158391034

    목차
    ▣ 01장: 스파크 소개
    1.1 스파크
    ___1.1.1 빅데이터의 등장
    ___1.1.2 빅데이터의 정의
    ___1.1.3 빅데이터 솔루션
    ___1.1.4 스파크
    ___1.1.5 RDD(Resilient Distributed Dataset) 소개와 연산
    ___1.1.6 DAG
    ___1.1.7 람다 아키텍처
    1.2 스파크 설치
    ___1.2.1 스파크 실행 모드의 이해
    ___1.2.2 사전 준비
    ___1.2.3 스파크 설치
    ___1.2.4 예제 실행
    ___1.2.5 스파크 셸
    ___1.2.6 실행 옵션
    ___1.2.7 더 살펴보기
    1.3 개발 환경 구축
    ___1.3.1 로컬 개발 환경 구축
    1.4 예제 프로젝트 설정
    ___1.4.1 WordCount 예제 실행
    1.5 데이터프레임과 데이터셋
    1.6 정리

    ▣ 02장: RDD
    2.1 RDD
    ___2.1.1 들어가기에 앞서
    ___2.1.2 스파크컨텍스트 생성
    ___2.1.3 RDD 생성
    ___2.1.4 RDD 기본 액션
    ___2.1.5 RDD 트랜스포메이션
    ___2.1.6 RDD 액션
    ___2.1.7 RDD 데이터 불러오기와 저장하기
    ___2.1.8 클러스터 환경에서의 공유 변수
    2.2 정리

    ▣ 03장: 클러스터 환경
    3.1 클러스터 환경
    ___3.1.1 클러스터 모드와 컴포넌트
    ___3.1.2 클러스터 모드를 위한 시스템 구성
    ___3.1.3 드라이버 프로그램과 디플로이 모드
    3.2 클러스터 매니저
    ___3.2.1 스탠드얼론 클러스터 매니저
    ___3.2.2 아파치 메소스
    ___3.2.3 얀
    ___3.2.4 히스토리 서버와 매트릭스
    ___3.2.5 쿠버네티스(Kubenetes)
    3.3 정리

    ▣ 04장: 스파크 설정
    4.1 스파크 프로퍼티
    4.2 환경변수
    4.3 로깅 설정
    4.4 스케줄링
    ___4.4.1 애플리케이션 간의 자원 스케줄링
    ___4.4.2 단일 애플리케이션 내부에서의 자원 스케줄링
    4.5 정리

    ▣ 05장: 스파크 SQL
    5.1 데이터셋
    5.2 연산의 종류와 주요 API
    5.3 코드 작성 절차 및 단어 수 세기 예제
    5.4 스파크세션
    5.5 데이터프레임, 로우, 칼럼
    ___5.5.1 데이터프레임 생성
    ___5.5.2 주요 연산 및 사용법
    5.6 데이터셋
    ___5.6.1 데이터셋 생성
    ___5.6.2 타입 트랜스포메이션 연산
    5.7 하이브 연동
    5.8 분산 SQL 엔진
    5.9 Spark SQL CLI
    5.10 쿼리플랜(Query Plan)과 디버깅
    ___5.10.1 스파크세션(SparkSession)과 세션스테이트(SessionState), 스파크컨텍스트(SparkContext)
    ___5.10.2 QueryExecution
    ___5.10.3 LogicalPlan과 SparkPlan
    5.11 정리

    ▣ 06장: 스파크 스트리밍
    6.1 개요 및 주요 용어
    6.1.1 스트리밍컨텍스트
    ___6.1.2 DStream(Discretized Streams)
    6.2 데이터 읽기
    ___6.2.1 소켓
    ___6.2.2 파일
    ___6.2.3 RDD 큐(Queue of RDD)
    ___6.2.4 카프카
    6.3 데이터 다루기(기본 연산)
    ___6.3.1 print()
    ___6.3.2 map(func)
    ___6.3.3 flatMap(func)
    ___6.3.4 count(), countByValue()
    ___6.3.5 reduce(func), reduceByKey(func)
    ___6.3.6 filter(func)
    ___6.3.7 union()
    ___6.3.8 join()
    6.4 데이터 다루기(고급 연산)
    ___6.4.1 transform(func)
    ___6.4.2 updateStateByKey()
    ___6.4.3 윈도우 연산
    ___6.4.4 window(windowLength, slideInterval)
    ___6.4.5 countByWindow(windowLength, slideInterval)
    ___6.4.6 reduceByWindow(func, windowLength, slideInterval)
    ___6.4.7 reduceByKeyAndWindow(func, invFunc, windowLength, slideInterval, [numTasks])
    ___6.4.8 countByValueAndWindow(windowLength, slideInterval, [numTasks])
    6.5 데이터의 저장
    ___6.5.1 saveAsTextFiles(), saveAsObjectFiles(), saveAsHadoopFiles()
    ___6.5.2 foreachRDD()
    6.6 CheckPoint
    6.7 캐시
    6.8 모니터링
    6.9 주요 설정

    ▣ 07장: 스트럭처 스트리밍
    7.1 개요
    7.2 프로그래밍 절차
    7.3 데이터프레임과 데이터셋 생성
    7.4 스트리밍 연산
    ___7.4.1 기본 연산 및 집계 연산
    ___7.4.2 윈도우 연산
    ___7.4.3 워터마킹
    ___7.4.4 조인 연산
    ___7.4.5 스트리밍 중복 데이터 제거
    ___7.4.6 스트리밍 쿼리
    7.5 정리

    ▣ 08장: MLlib
    8.1 개요
    8.2 관측과 특성
    8.3 레이블
    8.4 연속형 데이터와 이산형 데이터
    8.5 알고리즘과 모델
    8.6 파라메트릭 알고리즘
    8.7 지도학습과 비지도학습
    8.8 훈련 데이터와 테스트 데이터
    8.9 MLlib API
    8.10 의존성 설정
    8.11 벡터와 LabeledPoint
    ___8.11.1 벡터
    ___8.11.2 LabeledPoint
    8.12 파이프라인
    8.13 알고리즘
    ___8.13.1 Tokenizer
    ___8.13.2 TF-IDF
    ___8.13.3 StringIndexer, IndexToString
    8.14 회귀와 분류
    ___8.14.1 회귀
    ___8.14.2 분류
    8.15 클러스터링
    8.16 협업 필터링
    8.17 정리

    ▣ 09장: SparkR
    9.1 개요
    9.2 R 설치 및 실행
    9.3 데이터프레임
    9.4 데이터프레임 생성
    ___9.4.1 R데이터프레임으로부터 생성
    ___9.4.2 파일로부터 생성
    9.5 데이터프레임 연산
    ___9.5.1 조회 및 기본 연산
    ___9.5.2 그룹 및 집계 연산
    ___9.5.3 칼럼 연산
    ___9.5.4 집합 연산
    ___9.5.5 dapply(), dapplyCollect()
    ___9.5.6 gapply(), gapplyCollect()
    ___9.5.7 spark.lapply()
    ___9.5.8 createOrReplaceTempView()
    ___9.5.9 write()
    9.6 하이브 연동
    9.7 머신러닝
    9.8 정리

    ▣ 10장: GraphX
    10.1 주요 용어
    ___10.1.1 유방향 그래프
    ___10.1.2 유방향 멀티 그래프
    ___10.1.3 속성 그래프
    10.2 데이터 타입
    ___10.2.1 RDD
    ___10.2.2 VertextID
    ___10.2.3 꼭짓점
    ___10.2.4 선(Edge)
    ___10.2.5 EdgeTriplet
    ___10.2.6 VertexRDD
    ___10.2.7 EdgeRDD
    ___10.2.8 Graph
    10.3 그래프 생성
    10.4 그래프 연산
    ___10.4.1 numEdges, numVertices
    ___10.4.2 inDegrees, outDegrees, degrees
    ___10.4.3 vertices, edges, triplets
    ___10.4.4 mapVertices(), mapEdges(), mapTriplets()
    ___10.4.5 reverse()
    ___10.4.6 subgraph()
    ___10.4.7 mask()
    ___10.4.8 groupEdges()
    ___10.4.9 joinVertices(), outerJoinVertices()
    ___10.4.10 collectNeighborIds(), collectNeighbors()
    ___10.4.11 aggregateMessages()
    ___10.4.12 pregel()
    10.5 VertextRDD, EdgeRDD 연산
    10.6 그래프 알고리즘
    10.7 정리

    ▣ 부록: 스칼라란?
    스칼라 설치
    스칼라 셸
    변수 타입과 변수 선언
    Range와 형변환
    클래스, 객체, 컴패니언 오브젝트
    트레이트와 상속
    apply
    튜플과 옵션, 케이스클래스
    패턴 매치
    패키지 객체
    type
    임포트
    함수와 메서드
    제네릭
    암묵적 변환과 타입 클래스 패턴
    정리
    delivery.jpg
  • 사용후기

    등록된 사용후기

    사용후기가 없습니다.

  • 상품문의

    등록된 상품문의

    상품문의가 없습니다.

  • 배송정보

    배송정보

    배송업체 : 한진택배 (1588-0011)
     배송비
     2,500원 (25,000원 이상 구매 시 무료 배송/일부상품제외) 군부대 및 도서산간 지역은 추가 배송비가 발생할 수 있습니다.
     ◆배송기간
     : 평일 오전 7시 이전 주문 시 당일 발송 (2~3일 소요) : 단, 공휴일, 연휴, 천재지변 등으로 인해 발송이 지연될 수 있습니다.
     ◆배송추적
     : 당일 발송건에 한해 익일 오전 9시 이후 확인 가능합니다.


  • 교환정보

    교환/반품

     ◆반품/교환을 원하는 경우 반드시 고객센터로 연락 후 신청하시기 바랍니다.
     ◆반품/교환은 상품 수령일로 부터 7일 이내에만 가능합니다. 단, 상품이 훼손되지 않았거나, 속 비닐이 있는 경우 듣지 않았을    때 가능합니다.
     •고객님의 변심 또는 잘못 주문하신 경우에는 왕복 배송비는 고객님의 부담입니다.
     ◆오배송, 파본, 불량 상품에 대해서는 고객센터로 연락주시면 상담 후 교환해 드립니다.
     ◆오배송, 파본, 불량상품의 배송비는 환불처에서 부담합니다.
     교환/반품
     ◆환불은 상품이 환불에 도착 시 처리됩니다. (카드 취소는 3~5일이 소요될 수 있습니다.)

장바구니

오늘본상품

오늘 본 상품

  • 빅데이터 분석을 위한 스파크2 프로그래밍
    빅데이터 분석을 위 31,500

위시리스트

  • 보관 내역이 없습니다.
회사명 (주)꼭대기 주소 서울 특별시 마포구 연희로 11,5층 S-537호
사업자 등록번호 795-87-00429 대표 오주봉 전화 02-356-5779 팩스 02-356-5779
통신판매업신고번호 제2017-서울마포-0052호 개인정보 보호책임자 dhwnqhd

Copyright © 2001-2013 (주)꼭대기. All Rights Reserved.