파이썬을 활용한 머신러닝 자동화 시스템 구축
도서명:파이썬을 활용한 머신러닝 자동화 시스템 구축
저자/출판사:Gil’s,LAB/위키북스
쪽수:412쪽
출판일:2022-08-31
ISBN:9791158393427
목차
▣ 들어가며
머신러닝 자동화란?
__머신러닝 자동화 시스템 도입에 따른 효과
__관련 패키지 및 시스템
__머신러닝 자동화를 배워야 하는 이유
분석 및 개발 환경
__파이썬 환경 및 패키지
__폴더 구조
활용 데이터 소개
__데이터 출처
__데이터 구성
__분류용 데이터
__회귀용 데이터
[01부] 머신러닝 핵심 개념
▣ 01장: 머신러닝 모델 개발 프로세스
1.1 머신러닝 과제의 분류
__지도 학습
__모델 학습 및 활용 과정
__상태 공간(state space)과 지도 학습 과제의 분류
__객관적인 평가
__일반화와 과적합
__데이터 분할: (1) 학습 데이터와 평가 데이터
__데이터 분할: (2) k-겹 교차 검증
__비지도 학습
__군집화
__이상 탐지
__요약
1.2 문제 정의와 데이터 수집
__머신러닝 프로세스
__문제 정의
__데이터 수집
__요약
1.3 데이터 탐색 및 전처리
__기초 데이터 탐색
__결측치 처리
__범주형 변수 처리
__분포 확인
__클래스 불균형 문제
__특징 공학
__요약
1.4 모델 학습: 모델 선택 및 하이퍼파라미터 튜닝
__모델 선택
__하이퍼파라미터 튜닝
__요약
1.5 모델 평가
__분류 모델 평가
__회귀 모델 평가
__요약
▣ 02장: 파이썬을 이용한 머신러닝 모델 학습
2.1 데이터 준비
__데이터 불러오기
__데이터 확인하기
2.2 데이터 탐색 및 전처리
__사이킷런을 이용한 데이터 전처리
__결측 처리
__범주 및 서열형 변수 처리
__재샘플링
__특징 선택
__요약
2.3 모델 학습 및 평가
__모델 학습
__모델 평가
__요약
2.4 파이프라인과 모델 저장
__머신러닝 파이프라인
__피클 모듈
__요약
▣ 03장: 주요 지도 학습 모델
3.1 선형 모델
__선형 회귀
__로지스틱 회귀
__선형성을 고려한 특징 공학
__요약
3.2 k-최근접 이웃
__작동 과정 및 모델의 장단점
__주요 하이퍼파라미터
__스케일링과 특징 공학의 필요성
__사이킷런 실습
__요약
3.3 결정 나무
__모델 구조와 작동 과정
__모델 특성
__주요 하이퍼파라미터
__사이킷런 실습
__요약
3.4 신경망
__모델 구조와 작동 과정
__학습 과정과 주요 파라미터
__사이킷런 실습
__요약
3.5 앙상블 모델
__앙상블 종류
__결정 나무 기반의 앙상블 모델
__요약
[02부] 머신러닝 자동화를 위한 최적화 알고리즘
▣ 04장: 최적화 문제
4.1 최적화 모델
__최적화 모델의 구성
__최적화 모델 및 그래프 기반의 해법 예제
__머신러닝 자동화를 위한 최적화
__요약
4.2 다양한 해법
__최적화 문제의 해법 개요
__휴리스틱 해법
__초기화
__평가
__속도 계산
__위치 업데이트
__요약
▣ 05장: 그리드 서치와 랜덤 서치
5.1 그리드 서치
__개요
__구현 실습
__요약
5.2 랜덤 서치
__개요
__확률 변수 분포
__관련 함수
__요약
▣ 06장: 유전 알고리즘
6.1 이론
__개요
__유전자 표현
__선택 연산
__교차 연산
__돌연변이 연산
__주요 하이퍼파라미터
__요약
6.2 실습 (1) 특징 선택
__문제 정의
__유전 알고리즘 연산자 정의
__메인 함수
__요약
6.3 실습 (2) 외판원 순회 문제
__문제 정의
__유전 알고리즘 연산자 정의
__메인 함수
__요약
▣ 07장: 베이지****최적화
7.1 이론
__블랙박스 최적화 문제
__베이지****최적화 개요
__대체 모델
__획득 함수
__메인 함수
__요약
[03부] 머신러닝 자동화 시스템 구축
▣ 08장: 머신러닝 자동화를 위한 테크닉
8.1 속도 향상을 위한 테크닉
__조기 종료(early stopping)
__다중 충실도(multi-fidelity)
__확장성(scalability)
__요약
8.2 웜 스타트와 메타 학습
__메타 학습
__실습: 메타 학습을 이용한 하이퍼파라미터 튜닝의 웜 스타트
__요약
8.3 튜닝 범위 설정
__튜닝 범위 설정의 필요성 및 개요
__반복측정 분산분석을 이용한 주요 하이퍼파라미터 식별
__결정 나무를 이용한 하이퍼파라미터 범위 설정
__요약
▣ 09장: 머신러닝 자동화를 위한 파이썬 패키지
9.1 Auto-Sklearn
__이론적 배경
__패키지 실습
__요약
9.2 H2O AutoML
__이론적 배경
__실습
__요약
▣ 10장: 실전 시스템 구축
10.1 시스템 (1) MyAutoML1
__문제 정의
__클래스 설계
__시스템 구현 및 활용
10.2 시스템 (2) MyAutoML2
__클래스 설계
__실험을 통한 하이퍼파라미터 범위 설정
__랜덤 포레스트의 하이퍼파라미터 범위 설정
__XGBoost의 하이퍼파라미터 범위 설정
__LightGBM의 하이퍼파라미터 범위 설정
__시스템 구현 및 활용
10.3 시스템 (3) MyAutoML3
__문제 정의
__클래스 설계
__메타 모델 학습
__시스템 구현 및 활용
▣ 마치며