데이터 분석을 위한 수리 모델 입문
도서명:데이터 분석을 위한 수리 모델 입문
저자/출판사:에자키,타카히로/위키북스
쪽수:288쪽
출판일:2020-12-15
ISBN:9791158392314
목차
[01부] 수리 모델이란
▣ 01장: 데이터 분석과 수리 모델
1.1 데이터를 분석하는 일
___인간이 인지할 수 있는 한계와 데이터 분석
___대상을 데이터 생성 시스템으로 생각한다
___데이터 분석의 세계
___두 가지 접근법
1.2 수리 모델의 역할
___데이터를 바라보는 것 이상의 분석이 필요하다면 수리 모델을 사용할 때
___수리 모델은 ‘가정하는 것’이다
___수리 모델을 구성하는 요소
___일단 변수로 표현해보자
▣ 02장: 수리 모델을 구성하는 요소와 종류
2.1 변수 수리의 구조 매개변수
___수리 모델을 구성하는 요소
___일단 변수로 표현해보자
___수리구조 = ‘수리 모델의 뼈대’
___매개변수는 수리 모델을 ‘움직인다’
2.2 수리 모델과 자연과학의 기초 이론
___확립된 수리 모델은 기초 이론이 된다
___경계조건과 계산의 난이도
2.3 이해 지향형 모델링과 응용 지향형 모델링
___목적에 따라 모델링은 크게 달라진다
___모델이 복잡한 정도와 쉽게 이해할 수 있는 정도
2.4 이해 지향형 모델링
___이해 지향형 모델링 방법
___(1) 수리 구조를 통해 설명하는 방법
___(2) 추정한 매개변수의 값을 통해 설명하는 방법
___(3) 추정된 잠재변수나 내부 표현을 사용해 그 다음 부분을 해석하는 방법
___(4) 수리 모델에 있는 매개변수를 변화시키면서 상황을 시뮬레이팅하는 방법
2.5 응용 지향형 모델링
___수리 모델의 데이터 생성능력을 활용한다
___예측모델의 예1: 값을 예측한다(회귀)
___예측모델의 예2: 분류 문제
___생성모델을 사용한 응용
2.6 수리 모델의 한계와 적용 범위
___‘옳은’ 수리 모델?
___좋은 수리 모델도 항상 옳지는 않다
[02부] 기초적인 수리 모델
▣ 03장: 방정식 모델
3.1 선형모델
___변수 사이의 관계를 등식으로 표현한다
___선형모델
___선형모델을 구한다
___최소제곱법
3.2 실험식과 커브 적합
___BMI와 수리 모델
___멱법칙으로 특징짓는다
___대수플롯으로 멱법칙을 찾는다
___실험식
3.3 최적화 문제
___목적한 양을 제어한다
___대역적 최적과 국소적 최적
___매개변수를 조정하는 일도 최적화
___최적화를 어렵게 만드는 요소
▣ 04장: 미분 방정식으로 구성된 모델
4.1 풀 수 있는 미분 방정식 모델
___미분 방정식을 통해 시간 변화를 나타낸다
___맬서스의 개체 수 모델
___맬서스 모델의 해의 구조
___개체 수가 계속 폭발적으로 늘어나는 것은 아니다
___간단한 연립 선형 미분 방정식
___두 개의 연립 미분 방정식
___연립 1계 선형 상미분 방정식
___‘고윳값’에 의해 해의 성질이 결정된다
4.2 비선형 미분 방정식 모델
___비선형인 항을 포함한 미분 방정식 모델
___로트카-볼테라 방정식
___‘정상’인 상태에 관해 생각해 보자
___정상해의 ‘안정성’
___안정성을 실제로 평가한다
___미분 방정식을 선형화해서 해석한다
___수치 시뮬레이션
4.3 풀 수 있은 모델과 풀 수 없는 모델
___풀 수 있는 미분 방정식은 많지 않다
___선형인 미분 방정식
___1 변수인 비선형 미분방정식
___편미분 방정식
___분석 소프트웨어를 이용한다
4.4 제어이론
___입력변수에 대해 시스템이 어떻게 응답하는가
___미분 방정식을 풀기 위해 사용되는 도구
___라플라스 변환으로 미분 방정식을 푼다
___미분 방정식에 제어항을 넣어보자
___목푯값을 달성하기 위한 피드백을 생각한다
___고전 제어이론과 현대 제어이론, 그리고 그 이후
▣ 05장: 확률모델
5.1 확률과정
___확률적인 상황을 생각해 보자
___확률분포는 확률의 정보를 모아 놓은 것이다
___연속변수의 확률분포
___연속변수의 확률분포: 확률밀도함수
___주사위를 여러 번 던진다
5.2 마르코프 과정
___마르코프 과정은 과거의 상태를 무시한다
___점심 메뉴 정하기
___어떤 비율로 라면을 먹게 될까
___상태확률의 방정식을 세운다
___시간이 충분히 경과한 후
5.3 대기행렬이론
___창구의 대기줄을 확률적으로 표현한다
___평균적인 움직임에 기반한 추측
___사용자가 무작위로 도착하는 모습을 표현한 포와송 과정
___커지고 작아지는 모습을 표현하는 출생사멸 과정
___대기줄의 길이를 확률적으로 구한다
___정상상태 분석
___확률분포를 알면 기댓값을 구할 수 있다
___확률모델의 강점과 한계
___수치적인 해석은 비교적 쉽다
___마르코프 근사
▣ 06장: 통계모델
6.1 정규분포
___뱀 주사위 놀이 결과
___정규분포는 확률분포의 왕
___정규분포의 정의
___다른 정규분포끼리 덧셈한 것도 정규분포
___정규분포를 제곱해서 덧셈하면 어떻게 될까?
6.2 통계적 검정
___분산에 관해 생각해 본다
___우연의 확률
___평균에 관한 검정
___통계검정은 만능이 아니다
___1종 오류와 2종 오류
___통계검정 실시
6.3 회귀분석
___선형모델의 타당성
___같은 선형모델에서 나타나는 차이
___피어슨 상관계수로 평가한다
___선형식과 잘 부합되기만 하면 괜찮을까?
___변수의 개수가 많을 때는 중회귀분석
___X 선형이 아닌 모델
[03부] 수준 높은 수리 모델
▣ 07장: 시계열 모델
7.1 시계열 데이터를 구성하는 구조
___다양한 시계열
___여러 가지 접근법
___트렌드+성분+노이즈
___주파수 성분
___특정한 비선형 구조가 있는 경우
___시계열이 정상인지를 알아본다
___시간을 설명변수로 사용해서 통계검정을 실행하면 ****된다
7.2 관측변수를 사용한 모델
___예측에 사용할 수 있는 모델들
___AR 모델
___ARMA 모델
___ARIMA 모델
___SARIMA 모델
7.3 상태공간 모델
___상태변수를 포함한 모델
___상태공간 모델의 일반적인 표현
___이산시간, 선형, 가우스 모델
___다른 경우의 상태공간 모델
7.4 그 밖의 다양한 시계열 분석법
___자기상관으로 시간구조를 특징짓는다
___이상확산으로 특징짓는다
___푸리에 변환으로 주파수를 해석한다
___카오스, 비선형 시계열 해석
___두 개 이상의 시계열에서 인과관계를 조사한다
▣ 08장: 머신러닝 모델
8.1 머신러닝으로 다루는 모델과 문제의 특징
___머신러닝의 기본적인 개념
___복잡한 문제, 복잡한 모델
___모델의 자유도와 오버피팅
___머신러닝 모델을 사용해서 분석한다
8.2 분류와 회귀 문제
___분류와 회귀
___결정 트리
___랜덤 포레스트
___서포트 벡터 머신
___신경망
8.3 클러스터링
___클러스터링으로 데이터를 해석한다
___k-평균법
___혼합분포 모델
___계층적 클러스터링 기법
8.4 차원축소
___차원축소란
___주성분 분석
___독립성분 분석
___비선형인 차원축소법
8.5 딥러닝
___딥러닝이란
___컨볼루션 신경망
___순환 신경망
___오토인코더
___적대적 생성 네트워크
▣ 09장: 강화학습 모델
9.1 행동 모델인 강화학습
___강화와 학습
___도박 문제
___행동 선택을 포함한다
___모델의 다양성과 발전
___행동모델로 사용한다
9.2 머신러닝 분야의 강화학습
___머신러닝 분야의 강화학습
___가치 함수의 성질을 결정한다
___가치 함수를 갱신한다
___딥러닝을 사용한 Q 학습
___Q 학습 이외의 방법
▣ 10장: 다체계 모델(행위자 기반 모델)
10.1 미크로에서 매크로로
___다체계 모델(행위자 기반 모델)이란
___모델을 구성하는 요소
___시간과 공간의 이산화
___매크로적인 변수로 시스템의 움직임을 특징짓는다
___모델을 분석하는 방식
10.2 다양한 집단 현상 모델
___집단 모델
___동기 현상 모델
___인간의 행동과 의사결정 모델
10.3 상호작용 네트워크
___네트워크 구조를 통해 문제를 본다
___다른 노드와 얼마나 연결됐나
___유유상종?
___네트워크상에서 이동하기 쉬운 정도를 특징짓는다
___‘중심성’으로 중요한 노드를 특징짓는다
___‘친구의 친구’는 친구일까?
___무작위 네트워크를 만든다
___척도 없는 네트워크의 기본 모델
___컨피규레이션 모델
[04부] 수리 모델을 만든다
▣ 11장: 모델을 결정하기 위해 필요한 요소
11.1 수리 모델의 성질
___수리 모델을 만드는 목적
___모델링은 시행착오다
___결정론적 모델 vs. 확률 모델, 통계 모델
___이용할 수 있는 모델을 검토한다
11.2 이해 지향형 모델링의 요점
___이해하기 쉬운 모델이란
___간단한 모델이라고 해서 무엇이든 괜찮은 것은 아니다
___이해하려는 깊이와 모델링 기법
___수리 모델과 연역
___모델에 지정한 메커니즘의 수준보다 근원적인 내용은 설명할 수 없다
11.3 응용 지향형 모델링의 요점
___문제를 정의한다
___성능을 중시해서 모델을 선택한다
___데이터의 성질
▣ 12장: 모델을 결정하기 위해 필요한 요소
12.1 변수를 선택한다
___포함해야 할 변수, 포함하지 않는 변수
___변수의 해석성
___관계없는 변수는 제외한다
___특징량 엔지니어링
___이산값 변수와 연속값 변수
12.2 데이터 수집과 실험계획
___주목하는 변수의 영향을 제어하면서 데이터를 수집한다
___피셔의 삼원칙
___피셔의 삼원칙은 데이터의 치우침을 알아내는 힌트다
12.3 수리 구조와 매개변수 선택
___목적에 맞는 수리 구조를 선택한다
___목적변수의 분산을 무시할 수 없는 경우
___분산을 생각하지 않아도 되는 경우
___매개변수 값의 범위
12.4 모델링에 실패하지 않으려면
___기존 체계와의 일관성과 비교
___망치만 가진 사람에게는 모든 것이 못으로 보인다
___데이터에 적절한 전처리를 가한다
▣ 13장: 매개변수를 추정한다
13.1 목적에 맞는 매개변수 추정
___움직일 수 있는 매개변수와 움직일 수 없는 매개변수
___매개변수를 점추정한다
___변수의 움직임을 정량적으로 데이터에 맞추는 경우
___단순히 오차의 크기의 평균을 계산한다
___대수우도
___확률분포 사이의 ‘차이’를 최소화하는 지표
___교차 엔트로피
13.2 추정에서 목적함수를 최소화한다
___목적함수를 최소화하려면
___해석적으로 푼다
___매개변수를 스윕한다
___경사하강법
___국소해에 빠지지 않으려면
___과대적합을 피한다
___목적함수를 최소화한다
13.3 베이즈 추정과 베이즈 모델링
___베이즈 추정은 매개변수의 분포를 생각하는 것이다
___매개변수의 확률분포란?
___추정된 분포를 특징짓는다
___마르코프 연쇄 몬테카를로법
___메트로폴리스법
▣ 14장: 모델을 평가한다
14.1 ‘좋은 모델’이란
___목적에 맞는 모델을 평가한다
___메커니즘의 이해를 목적으로 한 모델 평가
___통계적 추론을 실행하기 위한 모델 평가
___응용 지향형 모델링에서 모델을 평가한다
14.2 분류 정확도를 측정하는 지표
___적합성과 성능을 측정한다
___정답률, 재현율, 특이도, 적합률, F값
___ROC 곡선과 AUC
14.3 정보량 규준
___모델이 복잡하면 적합도는 높아진다
___아카이케 정보량 규준(AIC)
___베이즈 정보량 규준 BIC
___그 밖의 정보량 규준
14.4 널 모델과 비교, 우도비 검정
___모델에 넣은 요소에 의미가 있는가
___우도비 검정
___통계검정과 널 모델
14.5 교차검증
___모델의 성능을 미지의 데이터로 테스트한다
___누수에 주의한다
___모델의 신빙성과 미지의 데이터