추천 엔진을 구축하기 위한 기본서
도서명:추천 엔진을 구축하기 위한 기본서
저자/출판사:수레시,고라칼라/에이콘출판
쪽수:424쪽
출판일:2017-09-06
ISBN:9791161750460
목차
1장. 추천 엔진 소개
__추천 엔진 정의
__추천 시스템의 필요성
__추천 시스템을 운영하는 빅데이터
__추천 시스템 종류
____협업 필터링 추천 시스템
____콘텐츠 기반 추천 시스템
____하이브리드 추천 시스템
____상황 인식 추천 시스템
__기술 발전에 따른 추천 시스템의 발전
____확장 가능한 추천 시스템을 위한 머하웃
____실시간 확장 가능 추천 시스템을 위한 아파치 스파크
____실시간 그래프 기반 추천 시스템을 위한 Neo4j
__요약
2장. 첫 번째 추천 엔진 구축하기
__기본 추천 엔진 구축하기
____데이터 로드 및 형식 변환
____사용자 사이의 유사도 계산
____사용자의 등급 예측
__요약
3장. 추천 엔진 이해
__추천 엔진의 진화
__최근접 이웃 기반 추천 엔진
____사용자 기반 협업 필터링
____아이템 기반 협업 필터링
____장점
____단점
__콘텐츠 기반 추천 시스템
____아이템 프로필 생성
____사용자 프로필 생성
____장점
____단점
__상황 인식 추천 시스템
____상황의 정의
____사전 필터링 방식
____사후 필터링 방식
____장점
____단점
__하이브리드 추천 시스템
____가중 방식
____혼합 방식
____캐스케이드 방식
____특징 조합 방식
____장점
__모델 기반 추천 시스템
____확률적 접근법
____머신 러닝 접근법
____수학적 접근법
____장점
__요약
4장. 추천 엔진에서 사용되는 데이터 마이닝 기법
__이웃 기반 기법
____유클리드 거리
____코사인 유사도
____자카드 유사도
____피어슨 상관계수
__수학적 모델 기법
____행렬 인수 분해
____교대 최소 제곱
____특이값 분해
__머신 러닝 기법
____선형 회귀
____분류 모델
______선형 분류
______KNN 분류
______서포트 벡터 머신
______결정 트리
______앙상블 방법
__클러스터링 기법
____K-평균 클러스터링
__차원 축소
____주성분 분석
__벡터 공간 모델
____단어 빈도
____단어 빈도-역문서 빈도
__평가 기법
____교차 검증
____정규화
______평균 제곱근 오차
______평균 절대 오차
______정확도와 재현율
__요약
5장. 협업 필터링 추천 엔진 구축하기
__RStudio에 recommenderlab 패키지 설치하기
__recommenderlab 패키지에서 사용 가능한 데이터 세트
____Jester5K 데이터 세트 탐색
______설명
______사용법
______형식
______상세 설명
__데이터 세트 탐색하기
____평가 값 탐색하기
__recommenderlab으로 사용자 기반의 협업 필터링 구축하기
____훈련 데이터와 테스트 데이터 준비하기
____사용자 기반 협업 모델 생성하기
____테스트 세트에서의 예측
____데이터 세트 분석하기
____k-교차 검증을 통한 추천 모델 평가하기
____사용자 기반 협업 필터링 평가하기
__아이템 기반 추천인 모델 구축하기
____IBCF 추천인 모델 구축하기
____모델 평가
____메트릭을 사용한 모델 정확도
____플롯을 사용한 모델 정확도
____IBCF의 매개변수 튜닝하기
__파이썬을 사용한 협업 필터링
____필요한 패키지 설치하기
____데이터 소스
__데이터 탐사
____평가 행렬 표현
____훈련과 테스트 세트 생성하기
____UBCF를 구축하는 단계
____사용자 기반 유사도 계산
____활성 사용자의 알려지지 않은 평가 예측하기
__k-최접 이웃과의 사용자 기반 협업 필터링
____최접 N 이웃 찾기
__아이템 기반 추천
____모델 평가하기
____k-최접 이웃에 대한 훈련 모델
____모델 평가하기
__요약
6장. 개인화 추천 엔진 구축하기
__개인화 추천인 시스템
__콘텐츠 기반 추천인 시스템
____콘텐츠 기반 추천 시스템 구축하기
____R을 사용한 콘텐츠 기반 추천
______데이터 세트 설명
____파이썬을 사용한 콘텐츠 기반 추천
______데이터 세트 설명
______사용자 활동
______아이템 프로필 생성
______사용자 프로필 생성
__상황 인식 추천인 시스템
____상황 인식 추천인 시스템 구축하기
____R을 사용한 상황 인식 추천
______상황 정의하기
______상황 프로필 생성하기
______상황 인식 추천 생성하기
__요약
7장. 스파크를 사용해 실시간 추천 엔진 구축하기
__스파크 2.0
____스파크 아키텍처
____스파크 구성 요소
____스파크 코어
______스파크 SQL을 이용한 구조화된 데이터
______스파크 스트리밍을 사용하는 스트리밍 분석
______MLlib를 사용하는 머신 러닝
______GraphX를 사용한 그래픽 계산
____스파크의 장점
____스파크 셋업하기
____SparkSession에 대해
____RDD
____ML 파이프라인에 대해
__교대 최소 제곱을 이용한 협업 필터링
__pyspark를 사용한 모델 기반 추천 시스템
__MLlib 추천 엔진 모듈
__추천 엔진 접근 방식
____구현 방법
______데이터 로딩
______데이터 탐색
______기본 추천 엔진 만들기
______예측하기
____사용자 기반 협업 필터링
____모델 평가
____모델 선택 및 하이퍼 매개변수 튜닝
______교차 유효성 검사
______CrossValidator
______학습 유효성 검사 분할
______ParamMaps/매개변수 설정하기
______평가자 객체 설정하기
__요약
8장. Neo4j로 실시간 추천 엔진 구축하기
__서로 다른 그래프 데이터베이스 식별
____레이블이 지정된 프로퍼티 그래프
______GraphDB 핵심 개념 이해하기
__Neo4j
____Cypher 쿼리 언어
______Cypher 쿼리 기본
____노드 문법
____관계 문법
____첫 번째 그래프 만들기
______노드 만들기
______관계 만들기
______관계에 프로퍼티 설정하기
______csv에서 데이터 불러오기
__Neo4j 윈도우 버전 설치하기
__리눅스에서 Neo4j 설치하기
____Neo4j 다운로드하기
____Neo4j 설정하기
____명령행에서 Neo4j 시작하기
__추천 엔진 만들기
____데이터를 Neo4j로 보내기
____Neo4j를 사용해 추천 정보 만들기
____유클리드 거리를 이용한 협업 필터링
____코사인 유사성을 사용한 협업 필터링
__요약
9장. 머하웃을 이용한 추천 엔진 구축하기
__머하웃: 개요
__머하웃 설정하기
____독립 모드: 라이브러리로서 머하웃 사용하기
____분산 모드용 머하웃 설정하기
__머하웃의 코어 빌딩 블록
____사용자 기반 협업 추천 엔진의 컴포넌트
____머하웃을 사용해 추천 엔진 만들기
____데이터 세트 내용
____사용자 기반의 협업 필터링
__아이템 기반의 협업 필터링
__협업 필터링 평가하기
__사용자 기반 추천인 평가
__아이템 기반 추천인 평가
__SVD 추천
__머하웃을 이용한 분산 추천
____하둡에서의 ALS 추천 방법
__확장 가능한 시스템 아키텍처
__요약
10장. 추천 엔진의 미래: 다음은 무엇일까?
__추천 엔진의 미래
__추천 엔진의 단계
____단계 1: 일반적인 추천 엔진
____단계 2: 개인화된 추천인 시스템
____단계 3: 미래 지향적 추천 시스템
______검색의 종료
______웹 검색의 종말
______웹에서의 새로운 등장
____차선책
____유스케이스 고려
______스마트 홈
______헬스케어 추천인 시스템
______추천 뉴스
__인기 있는 방법론
____세렌디피티
__추천 엔진의 시간적 측면
____A/B 테스트
____피드백 메커니즘
__요약