프로그래머를 위한 강화학습 > 컴퓨터공학

본문 바로가기
쇼핑몰 검색
  • 회원가입
    2000

    로그인

    다양한 서비스와 이벤트 혜택을 누리실 수 있습니다.

    아이디 비밀번호
프로그래머를 위한 강화학습 > 컴퓨터공학

프로그래머를 위한 강화학습 요약정보 및 구매

기본설명

상품 선택옵션 0 개, 추가옵션 0 개

제조사 프리렉
원산지 국내산
브랜드 프리렉
시중가격 25,000원
판매가격 22,500원
배송비결제 주문시 결제
최소구매수량 1 개
최대구매수량 999 개

선택된 옵션

  • 프로그래머를 위한 강화학습
    +0원
위시리스트

관련상품

등록된 상품이 없습니다.

  • 상품정보
  • 사용후기 0
  • 상품문의 0
  • 배송정보
  • 교환정보
  • 상품정보

    상품 기본설명

    기본설명

    상품 상세설명

    프로그래머를 위한 강화학습

    9788965402930.jpg

    도서명:프로그래머를 위한 강화학습
    저자/출판사:멀티코어,김남준,윤철희/프리렉
    쪽수:336쪽
    출판일:2021-03-31
    ISBN:9788965402930

    목차
    시작하며
    01장 강화학습 기본 개념
    1.1 강화학습이란
    1.2 확률과 확률 과정
    1.3. 마르코프 연쇄
    1.4 마르코프 보상 과정

    02장 강화학습 기본 알고리즘
    2.1 마르코프 결정 과정
    2.2 MDP 행동 가치 함수
    2.3 MDP 최적 가치 함수
    2.4 강화학습에 사용되는 다양한 용어
    2.5 다이내믹 프로그래밍
    2.6 몬테카를로 방법
    2.7 TD와 SARSA
    2.8 Q 러닝

    03장 인공지능의 개념
    3.1 머신러닝
    3.2 선형 회귀 분석
    3.3 분류 분석
    3.4 딥러닝
    3.5 개발 환경 설치
    3.6 텐서플로우

    04장 함수 근사법
    4.1 미분
    4.2 편미분
    4.3 스칼라와 벡터
    4.4 그래디언트
    4.5 경사하강법
    4.6 확률적 경사하강법
    4.7 강화학습에서 편미분과 경사하강법의 표기법
    4.8 함수 근사법

    05장 가치 기반 강화학습과 DQN 알고리즘
    5.1 DQN 알고리즘
    5.2 카트폴
    5.3 탐험과 탐욕의 문제
    5.4 DQN 알고리즘 기본 구조
    5.5 DQN 알고리즘 전체 코드 리뷰
    5.6 DQN 알고리즘 세부 구조 살펴보기
    5.7 DQN 알고리즘 학습 결과 분석

    06장 정책 기반 강화학습 REINFORCE 알고리즘
    6.1 인공신경망 다시 보기
    6.2 정책 그래디언트
    6.3 REINFORCE 알고리즘 동작 방식
    6.4 REINFORCE 알고리즘 기본 구조
    6.5 REINFORCE 알고리즘 전체 코드 리뷰
    6.6 REINFORCE 알고리즘 세부 구조 살펴보기
    6.7 REINFORCE 알고리즘 학습 결과 분석

    07장 정책 기반 A2C 알고리즘
    7.1 액터 크리틱 알고리즘
    7.2 어드밴티지 액터 크리틱
    7.3 A2C 알고리즘 기본 구조
    7.4 A2C 알고리즘 전체 코드 리뷰
    7.5 A2C 알고리즘 세부 구조 살펴보기
    7.6 A2C 알고리즘 학습 결과 분석

    08장 정책 기반 PPO 알고리즘
    8.1 중요도 샘플링
    8.2 오프 폴리시 정책 그래디언트
    8.3 클리핑 기법
    8.4 GAE
    8.5 PPO 알고리즘 기본 구조
    8.6 PPO 알고리즘 전체 코드 리뷰
    8.7 PPO 알고리즘 세부 구조 살펴보기
    8.8 PPO 알고리즘 알고리즘 학습 결과 분석

    09장 인공신경망 튜닝
    9.1 인공신경망 튜닝 개요
    9.2 입력 데이터 전처리
    9.3 비용 함수의 선택
    9.4 활성화 알고리즘
    9.5 가중치 초기화
    9.6 최적화 알고리즘
    9.7 노드와 은닉층 개수에 대한 논의
    9.8 PPO 알고리즘 인공신경망 튜닝
    9.9 PPO 알고리즘 튜닝 코드 적용
    9.10 PPO 알고리즘 튜닝 결과 분석

    10장 그리드 서치 기반 최적화 기법
    10.1 그리드 서치 개념
    10.2 그리드 서치 코딩
    10.3 그리드 서치 전체 코드
    10.4 그리드 서치 결과 분석
    10.5 그리드 서치 파라미터 튜닝 적용

    11장 베이지****최적화 기법
    11.1 빈도주의 확률과 베이지****확률
    11.2 베이지****확률 계산
    11.3 베이지****최적화 패키지 소개
    11.4 베이지****최적화 패키지 활용
    11.5 베이지****최적화 전체 코드
    11.6 베이지****최적화 결과 분석

    마무리하며
    찾아보기
    delivery.jpg
  • 사용후기

    등록된 사용후기

    사용후기가 없습니다.

  • 상품문의

    등록된 상품문의

    상품문의가 없습니다.

  • 배송정보

    배송정보

    배송업체 : 한진택배 (1588-0011)
     배송비
     2,500원 (25,000원 이상 구매 시 무료 배송/일부상품제외) 군부대 및 도서산간 지역은 추가 배송비가 발생할 수 있습니다.
     ◆배송기간
     : 평일 오전 7시 이전 주문 시 당일 발송 (2~3일 소요) : 단, 공휴일, 연휴, 천재지변 등으로 인해 발송이 지연될 수 있습니다.
     ◆배송추적
     : 당일 발송건에 한해 익일 오전 9시 이후 확인 가능합니다.


  • 교환정보

    교환/반품

     ◆반품/교환을 원하는 경우 반드시 고객센터로 연락 후 신청하시기 바랍니다.
     ◆반품/교환은 상품 수령일로 부터 7일 이내에만 가능합니다. 단, 상품이 훼손되지 않았거나, 속 비닐이 있는 경우 듣지 않았을    때 가능합니다.
     •고객님의 변심 또는 잘못 주문하신 경우에는 왕복 배송비는 고객님의 부담입니다.
     ◆오배송, 파본, 불량 상품에 대해서는 고객센터로 연락주시면 상담 후 교환해 드립니다.
     ◆오배송, 파본, 불량상품의 배송비는 환불처에서 부담합니다.
     교환/반품
     ◆환불은 상품이 환불에 도착 시 처리됩니다. (카드 취소는 3~5일이 소요될 수 있습니다.)

장바구니

오늘본상품

오늘 본 상품

  • 프로그래머를 위한 강화학습
    프로그래머를 위한 22,500

위시리스트

  • 보관 내역이 없습니다.
회사명 (주)꼭대기 주소 서울 특별시 마포구 연희로 11,5층 S-537호
사업자 등록번호 795-87-00429 대표 오주봉 전화 02-356-5779 팩스 02-356-5779
통신판매업신고번호 제2017-서울마포-0052호 개인정보 보호책임자 dhwnqhd

Copyright © 2001-2013 (주)꼭대기. All Rights Reserved.