머신 러닝 인 자바
도서명:머신 러닝 인 자바
저자/출판사:보스티얀,칼루자/에이콘출판
쪽수:308쪽
출판일:2016-11-29
ISBN:9788960779297
목차
1장. 응용 머신 러닝의 개요
__머신 러닝과 데이터 과학
____머신 러닝으로 해결할 수 있는 문제의 종류는?
____응용 머신 러닝 개발 절차
__데이터와 문제의 정의
____측정 단위
__데이터 수집
____데이터의 발견과 관찰
____데이터 생성
____데이터 샘플링의 오류
__데이터 전처리
____데이터 클리닝
____누락된 값 채우기
____이상점 (아웃라이어) 제거
____데이터 변환
____데이터 축소
__비지도 학습
____유사한 아이템 찾기
______유클리드 거리 측정법
______비유클리드 거리 측정법
______차원수의 저수
____클러스터링
__지도 학습
____분류
______의사결정 트리 학습
______확률적 분류기
______커널 기법
______인공신경망
______앙상블 학습
______분류 체계의 평가
____회귀분석
______선형 회귀분석
______회귀분석식 모델의 평가
__일반화와 평가
____언더핏과 오버핏
______학습 데이터와 검증 데이터의 구분
______교차 평가
______리브 원 아웃 교차 평가
______계층화
__정리
2장. 머신 러닝을 위한 자바 라이브러리와 플랫폼
__자바의 필요성
__머신 러닝 라이브러리
____Weka
____자바 머신 러닝
____Apache Mahout
____Apache Spark
____Deeplearning4j
____MALLET
____라이브러리 비교
__머신 러닝 애플리케이션 만들기
____전통적인 머신 러닝 아키텍처
____빅데이터 처리하기
______빅데이터 애플리케이션 아키텍처
__정리
3장. 기본 알고리즘: 분류, 회귀분석, 클러스터링
__시작에 앞서
__분류
____데이터
____데이터 로딩
____속성 선택
____알고리즘 학습
____새로운 데이터의 분류
____모델 평가 및 예측 오류 메트릭스
____혼합 매트릭스
____분류 알고리즘의 선택
__회귀분석
____데이터 로딩
____속성 분석
____회귀분석 모델 개발 및 평가
______선형 회귀분석
______회귀분석 트리
____회귀분석과 관련된 보편적인 문제의 해결책
__클러스터링
____클러스터링 알고리즘
____모델의 평가
__정리
4장. 앙상블을 이용한 고객 관계 예측
__고객 관계 데이터베이스
____챌린지 개요
____도전 과제를 위한 데이터세트
____평가
__나이브 베이즈 분류법에 따른 기본 점수
____데이터 가져오기
____데이터 로딩
__기본적인 모델링
____평가 모델
____기본적인 나이브 베이즈 알고리즘 구현
__앙상블을 이용한 고급 모델 구현
____시작하기에 앞서
____데이터 전처리하기
____속성 선택
____모델 선택
____성능 평가
__정리
5장. 친밀도 분석
__마켓 바스켓 분석
____친밀도 분석
__연관 규칙 학습
____기본 개념
______거래 데이터베이스
______아이템세트와 규칙
______지지도
______신뢰도
____아프리오리 알고리즘
____FP-성장 알고리즘
__슈퍼마켓 데이터세트
__패턴 발견하기
____아프리오리 알고리즘
____FP-성장 알고리즘
__다양한 영역에서 활용되는 애플리케이션
____의료 진단
____단백질 서열 분석
____인구총조사 데이터
____고객 관계 관리
____IT 운영 분석
__정리
6장. 아파치 마홋을 이용한 추천 엔진 구현
__추천 엔진의 기본 개념
____추천 엔진의 주요 개념
____사용자 기반 분석과 아이템 기반 분석
____유사성 계산을 위한 방법
______협업적 필터링
______콘텐트 기반 필터링
______하이브리드 기법
____데이터 채굴과 데이터 탐험
__아파치 마홋 다운로드와 설정
____이클립스에서 메이븐 플러그인을 통한 마홋 환경 설정
__추천 엔진 만들기
____책 평가를 위한 데이터세트
____데이터 로딩
______파일에서 데이터 로딩하기
______데이터베이스에서 데이터 로딩하기
______인메모리 데이터베이스
____협업적 필터링
______사용자 기반 필터링
______아이템 기반 필터링
______추천 알고리즘에 커스텀 규칙 추가하기
______추천 모델의 평가
______온라인 러닝 엔진
__콘텐트 기반 필터링
__정리
7장. 사기와 이상 행동 감지
__이상하고 의심스러운 행동의 감지
____무엇을 모르는지 모른다는 것, 언노운-언노운
__의심스러운 패턴 감지
__이상 행동 패턴의 감지
____분석의 유형
______패턴 분석
______거래 분석
____계획 인지
__보험 청구 사기 사건의 감지
____데이터세트
____의심스러운 행동 패턴의 모델링
______바닐라 기법
______데이터세트 밸런스 재조절
__웹사이트 트래픽의 이상 행동 감지
____데이터세트
____시계열 데이터에서의 이상 행동 감지
______히스토그램 기반 이상 행동 감지
______데이터 로딩
______히스토그램 만들기
______밀집도 기반 k-최인접 이웃 알고리즘
__정리
8장. Deeplearning4j를 활용한 이미지 인식
__이미지 인식 기법의 개요
____신경망 알고리즘
______퍼셉트론
______피드포워드 신경망
______오토인코더
______제한 볼츠만 머신
______심층 나선형 신경망
__이미지 분류
____Deeplearning4j
______DL4J 가져오기
____MNIST 데이터세트
____데이터 로딩
____모델 만들기
______단일층 회귀분석 모델 만들기
______심층 신뢰 신경망 만들기
______다층 나선형 신경망 만들기
__정리
9장. 스마트폰 센서를 활용한 동작 인식
__동작 인식의 개요
____스마트폰 센서
____동작 인식 파이프라인
____앱 개발 기획
__스마트폰에서 데이터 수집하기
____안드로이드 스튜디오 설치
____데이터 콜렉터 프로젝트 로딩하기
______특성 데이터의 추출
____훈련 데이터의 수집
__분류기 알고리즘의 개발
____이상 동작 데이터 감소시키기
____모바일 앱에 분류기 적용하기
__정리
10장. 멜릿을 이용한 텍스트 마이닝: 토픽 모델링과 스팸 감지
__텍스트 마이닝의 개요
____토픽 모델링
____텍스트 분류
__Mallet 설치
__텍스트 데이터의 활용
____데이터 임포트하기
______디렉토리에서 임포트하기
______파일에서 임포트하기
____텍스트 데이터의 전처리
__BBC 뉴스에서 토픽 모델링 구현하기
____BBC 데이터세트
____모델링
____모델의 평가
____모델의 재사용
______모델 저장하기
______모델 복구하기
__이메일 스팸 감지
____이메일 스팸 데이터세트
____특성값 생성
____훈련 및 테스트
______모델의 성능 평가
__정리
11장. 머신 러닝을 향한 다음 여정
__실무적인 문제 해결 방법으로서의 머신 러닝
____노이즈 데이터
____클래스의 불균형
____특성 선택의 까다로움
____모델 연쇄
____평가의 중요성
____서비스 또는 제품에 러닝 모델 적용하기
____모델의 유지 보수
__표준 언어와 마크업 언어
____CRISP-DM
____SEMMA 방법론
____예측 모델 마크업 언어
__클라우드 기반의 머신 러닝
____서비스로서의 머신 러닝
__웹 자료원과 경진대회
____데이터세트
____온라인 학습 과정
____머신 러닝 경진 대회
____머신 러닝 관련 웹사이트와 블로그
____머신 러닝 컨퍼런스
__정리