데이터 과학자의 가설 사고

도서명:데이터 과학자의 가설 사고
저자/출판사:고추 다이스케 , 가와치 아키오 , 고노 슌스케 , /비제이퍼블릭
쪽수:272쪽
출판일:2024-02-08
ISBN:9791165922566
목차
목차
들어가며
저자 소개
베타리더
이 책을 활용하는 방법
제1장 디지털 시대에 필요한 데이터 리터러시
1-1. 디지털 시대의 도래
DX 시대의 빅데이터의 역할
Society 5.0의 실현
1-2. 데이터 리터러시는 미래의 직장인에게 필수 스킬
디지털 시대의 「읽기ㆍ쓰기ㆍ셈하기」 같은 소양
모든 대학생ㆍ고등학생이 배우는 데이터 리터러시
신입사원이 더 뛰어난 데이터 리터러시
column: 모든 직장인이 익혀야 할 DX 리터러시
1-3. 데이터 리터러시를 익히자
직장인이 익혀야 할 데이터 리터러시
column: 데이터 과학자란?
제2장 데이터를 읽는 힘을 기른다
2-1. 생각하면서 데이터를 읽자!
퀴즈1 : 데이터를 목적에 맞게 보는 방법을 배운다
퀴즈2 : 데이터의 특징과 경향을 파악하는 방법을 배운다
퀴즈3 : 데이터에서 착안점을 찾는 방법을 배운다
2-2. 전체의 경향을 파악하자!
데이터의 대푯값 : 평균값ㆍ최빈값ㆍ중앙값
퀴즈4 : 평균값ㆍ최빈값ㆍ중앙값 산출 방법을 배운다
퀴즈5 : 대푯값과 데이터 분포의 관계를 배운다
데이터 분포를 확인한다
column: 히스토그램의 폭
실제 사회에서는 평균값=최빈값이 아닌 경우가 많다
일본 국민의 대부분은 552만 3천 엔의 소득이 있다?
대부분의 세대는 1,791만 엔을 저축해 놓았다?
2-3. 데이터의 세부 내용을 확인하자!
퀴즈6 : 상이값ㆍ이상값을 배운다
존재하지 않는 데이터(결측값)
2-4. 데이터의 관계성을 파악하자!
퀴즈7 : 두 개의 데이터의 관계성을 배운다
두 데이터의 관계성 : 상관
상관관계와 인과관계
퀴즈8 : 상관과 인과를 배운다
상관관계를 어떻게 볼 것인가?
제3장 데이터를 설명하는 힘을 기른다
3-1. 데이터를 시각화해보자!
퀴즈1 : 적절한 그래프 표현을 배운다
적절한 그래프 표현
column: 시계열 데이터를 시각화할 때는 꺾은선 그래프?
column: 데이터 과학자는 원 그래프를 쓰지 않는다?
퀴즈2 : 부적절한 그래프 표현을 배운다
3-2. 데이터를 비교한다는 것은?
퀴즈3 : 적절한 비교 대상 설정 방법을 배운다
적절한 비교 대상 설정
데이터를 비교하는 4가지 시점
퀴즈4 : 어떤 시점과의 비교 방법을 배운다
퀴즈5 : 타자와의 비교 방법을 배운다
곱셈에 의한 분해
덧셈에 의한 분해
3-3. 데이터에서 과제를 찾아낸다
퀴즈6~9 : 데이터에서 과제를 찾아내는 순서를 배운다
매출 데이터에서 과제를 찾아내는 순서
포인트 3배 DAY의 매출 증가 효과
운동회의 매출 증가 효과
제4장 데이터를 분류하는 힘을 기른다
4-1. 특징이 비슷한 데이터를 그룹으로 만들자!
퀴즈1 : 데이터를 그룹으로 나누는 의미를 배운다
데이터를 그룹으로 나누는 의미
그룹별 해결 방안을 생각한다
column: 고객의 잠재적인 니즈를 파악한다
데이터의 특징이 비슷하다는 판단
퀴즈2 : 데이터 사이의 거리를 배운다
퀴즈3 : 거리를 계산할 때의 주의사항을 배운다
column: 스케일이 다른 데이터
4-2. 목적에 맞게 데이터를 분류하자!
퀴즈4 : 데이터를 분류하기 위한 관점을 배운다
데이터 분류의 어려움
4-3. 데이터를 기계적으로 분류하자!
퀴즈5 : 그룹의 중심을 배운다
데이터를 분류하는 방법 : k-means법
column: k-means법의 초깃값 문제
4-4. 데이터 분류를 체험하자!
퀴즈6~8 : 데이터를 분류하는 순서를 배운다
제5장 데이터에서 법칙을 발견하는 힘을 기른다
5-1. 데이터에서 법칙을 발견한다!
퀴즈1 : 데이터에서 법칙을 발견하는 방법을 배운다
퀴즈2 : 발견한 법칙을 적용하는 방법을 배운다
판별 문제의 특징
5-2. 판별 문제를 푸는 의사결정 트리 모델
퀴즈3 : 의사결정 트리 모델을 만드는 방법을 배운다
의사결정 트리 모델을 성장시킨다
퀴즈4 : 의사결정 트리 모델을 이용해 결과를 추측하는 방법을 배운다
5-3. 판별 문제의 정밀도를 평가해보자!
퀴즈5 : 판별 문제의 평가 방법을 배운다
2×2칸 크로스 표로 정리한다
판별 문제의 정밀도를 평가하는
적합률과 재현율 가운데 어느 쪽이 중요할까?
5-4. 의사결정 트리 모델을 활용해보자!
퀴즈6 : 데이터에서 법칙을 발견해서 판별 문제를 푸는 순서를 배운다
제6장 데이터를 보고 예측하는 힘을 기른다
6-1. 수치 데이터의 관계성을 확인하자!
퀴즈1 : 수치 데이터의 관계성을 확인하는 방법을 배운다
퀴즈2 : 수치 데이터의 관계성이 좁혀지지 않을 때의 대처 방법을 배운다
수치 이외의 데이터와의 관계성을 확인한다
퀴즈3 : 수치 이외의 데이터와의 관계성을 확인하는 방법을 배운다
6-2. 내삽과 외삽에 주의하자!
퀴즈4 : 데이터를 보고 예측할 때 주의해야 할 내삽과 외삽을 배운다
데이터를 보고 찾아낸 관계성을 적용할 수 있는 경우와 적용할 수 없는 경우
외삽에 의한 예측 예
6-3. 데이터의 치우침에 주의하자!
퀴즈5 : 데이터에 치우침이 있을 때의 주의사항을 배운다
데이터에 치우침이 없는지 확인한다
식료품점의 캠페인 실패
6-4. 시간 변화에 주목하자!
퀴즈6 : 시계열 데이터의 트렌드와 주기성을 배운다
시계열 데이터에서는 다양한 변동을 발견할 수 있다
6-5. 데이터를 보고 예측하자!
퀴즈7~9 : 데이터를 보고 예측하는 순서를 배운다
제7장 업무에서 데이터 리터러시를 활용한다
7-1. 데이터를 읽는 힘을 활용한다
데이터를 읽는 힘을 활용한 사례 : 앙케트 조사
데이터를 읽는 힘을 활용한 사례 : 상권 분석
7-2. 데이터를 설명하는 힘을 활용한다
데이터를 설명하는 힘을 활용한 사례 : 매출 분석
데이터를 설명하는 힘을 활용한 사례 : 품질 관리
7-3. 데이터를 분류하는 힘을 활용한다
데이터를 분류하는 힘을 활용한 사례 : 고객 세그먼테이션
데이터를 분류하는 힘을 활용한 사례 : 점포 뭉치기
7-4. 데이터에서 법칙을 발견하는 힘을 활용한다
데이터에서 법칙을 발견하는 힘을 활용한 사례 : 설비 이상
데이터에서 법칙을 발견하는 힘을 활용한 사례 : 고객 이탈
7-5. 데이터를 보고 예측하는 힘을 활용한다
데이터를 보고 예측하는 힘을 활용한 사례 : 상품 수요 예측
데이터를 보고 예측하는 힘을 활용한 사례 : 이용객 수 예측
맺는 말
참고문헌