Brightics Studio로 시작하는 금융 빅데이터 분석
도서명:Brightics Studio로 시작하는 금융 빅데이터 분석
저자/출판사:김세미,문소연,박훈,여신영,이장휘,조남용/디지털북스
쪽수:296쪽
출판일:2020-07-30
ISBN:9788960883482
목차
PART 1 금융데이터 분석 트렌드
1.1 금융산업 트렌드의 변화
1.1.1 금융산업 트렌드 변화
1.1.2 금융산업 내 ‘데이터 분석’의 중요도 변화
1.2 빅데이터 in 금융
1.2.1 마케팅 분야 활용 사례
1.2.2 리스크 관리 분야 활용 사례
1.2.3 고객관리 및 상품관리 분야 활용 사례
1.3 데이터 개방의 시대가 온다
1.3.1 금융 데이터 법규 및 정책 변화
1.3.2 금융 빅데이터 개방 시스템
1.3.3 금융 데이터 거래소
1.3.4 마이데이터 산업의 등장
PART 2 데이터 분석 프로세스
2.1 데이터 분석 Flow
2.1.1 데이터 탐색(EDA, Exploratory Data Analysis)
2.1.2 데이터 전처리
2.1.3 데이터 분석 모델링
2.1.4 데이터 분석 모델 평가
2.2 데이터 분석기법: Maching Learning
2.2.1 회귀분석(Regression)
__2.2.1.1 선형회귀(Linear Regression)
__2.2.1.2 Penalized Linear Regression
__2.2.1.3 Regression 평가
2.2.2 분류분석(Classification)
__2.2.2.1 로지스틱 회귀(Logistic Regression)
__2.2.2.2 의사결정나무(Decision Tree)
__2.2.2.3 랜덤 포레스트(Random Forest)
__2.2.2.4 SVM(Support Vector Machine)
__2.2.2.5 Classification 평가
2.2.3 군집분석(Clustering)
__2.2.3.1 계층적 군집분석(Hierarchical Clustering)
__2.2.3.2 비계층적 군집분석(Non-Hierarchical Clustering)
__2.2.3.3 Clustering 평가2.2.4 앙상블(Ensemble)
__2.2.4.1 배깅(Bagging)
__2.2.4.2 부스팅(Boosting)
PART 3 Brightics Studio
3.1 Brightics Studio 소개
3.2 Brightics Studio 시작하기
3.2.1 Brightics Studio 설치
3.2.2 Brightics Studio 실행
3.3 Brightics Studio 활용하기
3.3.1 프로젝트 및 모델 생성
3.3.2 Data Flow 생성
3.3.3 Report 생성
PART 4 Brightics Studio를 활용한 데이터 탐색 및 전처리
4.1 데이터 로드하기
4.2 데이터 EDA
4.2.1 Statistic Analysis
__4.2.1.1 기초 통계자료 살펴보기
__4.2.1.2 카이제곱 검정(Chi-square Test)
__4.2.1.3 T검정(T-Test)
__4.2.1.4 일원분산분석(one-way ANOVA)
4.2.2 Visual Analysis
__4.2.2.1 Bar Chart
__4.2.2.2 Line Chart
__4.2.2.3 Box Plot
__4.2.2.4 Histogram
__4.2.2.5 Scatter Plot
__4.2.2.6 Pie Chart
__4.2.2.7 Tree map
__4.2.2.8 Complex Chart
4.3 데이터 전처리
4.3.1 Manipulation
__4.3.1.1 Filter
__4.3.1.2 결측값 처리
__4.3.1.3 이상치(Outlier) 처리
4.3.2 Transform
__4.3.2.1 Select Column
__4.3.2.2 Join
__4.3.2.3 Random Sampling
__4.3.2.4 Split Data
__4.3.2.5 Pivot
__4.3.2.6 Unpivot
4.3.3 Extraction
__4.3.3.1 One Hot Encoder
__4.3.3.2 Normalization
__4.3.3.3 Add Function Columns
__4.3.3.4 Bucketizer
PART 5 Brightics Studio를 활용한 데이터 분석모델링 및 평가
5.1. Kaggle
5.1.1 Kaggle 알아보기
__5.1.1.1 간단한 Kaggle 사용방법
5.1.2 펀드 수익률 예측(Regression)
_5.1.2.1 예측모형을 위한 전처리
_5.1.2.2 Linear Regression
_5.1.2.3 Penalized Linear Regression - Ridge, Lasso, Elastic Net
_5.1.2.4 XGB Regression
_5.1.2.5 Regression 예측모델 평가
5.2 CreDB
5.2.1 CreDB 알아보기
5.2.2 CreDB 개인신용 샘플 데이터 전처리
__5.2.2.1 대출현황 파생변수 추출
__5.2.2.2 차주정보, 카드발급정보 추출
__5.2.2.3 종속변수(1년 이내 연체여부) 생성
5.2.3 개인신용 채무불이행 예측(Classification)
__5.2.3.1 예측모델을 위한 전처리
__5.2.3.2 Decision Tree
__5.2.3.3 Logistic Regression
__5.2.3.4 Random Forest
__5.2.3.5 Classification 예측모델 평가
5.2.4 개인고객의 군집 생성(Clustering)
__5.2.4.1 예측모델을 위한 전처리
__5.2.4.2 Hierarchical Clustering
__5.2.4.3 K-Means