Scikit-learn으로 머신 러닝 마스터 2/e
도서명:Scikit-learn으로 머신 러닝 마스터 2/e
저자/출판사:개빈,해클링/에이콘출판
쪽수:308쪽
출판일:2018-05-30
ISBN:9791161751603
목차
1장. 머신 러닝 기초
__머신 러닝의 정의
__경험으로부터 학습
__머신 러닝 과제
__훈련 데이터, 테스트 데이터, 검증 데이터
__편향과 분산
__scikit-learn 소개
__scikit-learn 설치
____pip를 사용한 설치
____윈도우에 설치
____우분투 16.04에 설치
____맥 OS에 설치
____아나콘다 설치
____설치 검증
__pandas, Pillow, NLTK, matplotlib 설치
__요약
2장 단순 선형 회귀
__단순 선형 회귀
____비용 함수를 사용한 모델의 적합도 평가
____단순 선형 회귀를 위한 OLS 계산
__모델 평가
__요약
3장. K-최근접 이웃을 이용한 분류와 회귀
__k-최근접 이웃
__게으른 학습과 비매개변수 모델
__KNN을 사용한 분류
__KNN을 사용한 회귀
____특징의 크기 조절
__요약
4장. 특징 추출
__범주형 변수에서 특징 추출
__특징의 표준화
__텍스트에서 특징 추출
____단어 주머니 모델
____불용어 필터링
____형태소 추출과 어휘소 추출
____tf-idf 가중치를 활용한 단어 주머니의 확장
____해싱 기법을 사용한 공간효율적 특징 벡터
____워드 임베딩
__이미지에서 특징 추출
____픽셀 강도에서 특징 추출
____컨벌루션 신경망 활성화를 사용한 특징
__요약
5장. 단순 선형 회귀에서 다중 선형 회귀까지
__다중 선형 회귀
__다항 회귀
__정규화
__선형 회귀의 적용
____데이터 탐색
____적합화와 모델 평가
__기울기 하강법
__요약
6장. 선형 회귀에서 로지스틱 회귀까지
__로지스틱 회귀를 이용한 이진 분류
__스팸 필터링
____이진 분류기 평가 척도
____정확도
____정밀도와 재현율
____F1 척도 계산
____ROC AUC
__그리드 탐색을 활용한 모델 튜닝
__다중 부류 분류
__다중 부류 분류 성능 척도
__다중 부류 분류와 문제 변환
__다중 부류 분류 성능 척도
__요약
7장. 나이브 베이즈
__베이즈 정리
__생성 모델과 판별 모델
__나이브 베이즈
__나이브 베이즈에서의 가정
__scikit-learn으로 구현한 나이브 베이즈
__요약
8장. 의사결정 트리를 이용한 비선형 분류와 회귀
__의사결정 트리
__의사결정 트리 훈련
____문제 선택
______정보 이득
____지니 불순도
__scikit-learn을 사용한 의사결정 트리
____의사결정 트리의 장단점
__요약
9장. 의사결정 트리에서 랜덤 포레스트와 앙상블 기법까지
__배깅
__부스팅
__스태킹
__요약
10장. 퍼셉트론
__퍼셉트론
____활성화 함수
____퍼셉트론 학습 알고리즘
____퍼셉트론을 이용한 이진 분류
____퍼셉트론을 이용한 문서 분류
__퍼셉트론의 한계
__요약
11장. 퍼셉트론에서 서포트 벡터 머신까지
__커널과 커널 트릭
__최대 마진 분류기와 서포트 벡터
__scikit-learn에서 문자 분류
____필기체 숫자 분류
____컬러 이미지에서 문자 분류
__요약
12장. 퍼셉트론에서 인공지능까지
__비선형 결정 경계
__피드포워드와 피드백 ANN
__다층 퍼셉트론
__다층 퍼셉트론 훈련
____역전파
____XOR 근사를 위한 계층 퍼셉트론의 훈련
____필기체 숫자를 분류하기 위한 다층 퍼셉트론 훈련
__요약
13장. K-평균
__군집화
__K-평균
____지역 최적 값
____엘보 기법을 사용한 k 값의 선택
__클러스터의 평가
__이미지 퀀터제이션
__특징 학습을 위한 군집화
__요약
14장. 주성분 분석을 이용한 차원 축소
__주성분 분석
____분산, 공분산, 공분산 행렬
____고유 벡터와 고윳값
__PCA 실행
__PCA를 사용한 고차원 데이터의 시각화
__PCA를 사용한 얼굴 인식
__요약