파이썬 데이터 분석 실무 테크닉 100
도서명:파이썬 데이터 분석 실무 테크닉 100
저자/출판사:시모야마,테루마사,마쯔다,유마,미키,타카유키/위키북스
쪽수:292쪽
출판일:2020-07-30
ISBN:9791158392178
목차
[1부] 기초편: 데이터 가공
▣ 01장: 웹에서 주문 수를 분석하는 테크닉 10
001 데이터를 읽어 들이자
002 데이터를 결합(유니언)해 보자
003 매출 데이터끼리 결합(조인)해 보자
004 마스터데이터를 결합(조인)해 보자
005 필요한 데이터 칼럼을 만들자
006 데이터를 검산하자
007 각종 통계량을 파악하자
008 월별로 데이터를 집계해 보자
009 월별, 상품별로 데이터를 집계해 보자
010 상품별 매출 추이를 가시화해 보자
▣ 02장: 대리점 데이터를 가공하는 테크닉 10
011 데이터를 읽어 들이자
012 데이터의 오류를 살펴보자
013 데이터에 오류가 있는 상태로 집계해 보자
014 상품명 오류를 수정하자
015 금액의 결측치를 수정하자
016 고객 이름의 오류를 수정하자
017 날짜 오류를 수정하자
018 고객 이름을 키로 두 개의 데이터를 결합(조인)하자
019 정제한 데이터를 덤프하자
020 데이터를 집계하자
[2부] 실전편①: 머신러닝
▣ 03장: 고객의 전체 모습을 파악하는 테크닉 10
021 데이터를 읽어 들이고 확인하자
022 고객 데이터를 가공하자
023 고객 데이터를 집계하자
024 최신 고객 데이터를 집계하자
025 이용 이력 데이터를 집계하자
026 이용 이력 데이터로부터 정기 이용 플래그를 작성하자
027 고객 데이터와 이용 이력 데이터를 결합하자
028 회원 기간을 계산하자
029 고객 행동의 각종 통계량을 파악하자
030 탈퇴 회원과 지속 회원의 차이를 파악하자
▣ 04장: 고객의 행동을 예측하는 테크닉 10
031 데이터를 읽어 들이고 확인하자
032 클러스터링으로 회원을 그룹화하자
033 클러스터링 결과를 분석하자
034 클러스터링 결과를 가시화하자
035 클러스터링 결과를 바탕으로 탈퇴 회원의 경향을 파악하자
036 다음 달의 이용 횟수 예측을 위해 데이터를 준비하자
037 특징이 되는 변수를 추가하자
038 다음 달 이용 횟수를 예측하는 모델을 구축하자
039 모델에 기여하는 변수를 확인하자
040 다음 달의 이용 횟수를 예측하자
▣ 05장: 회원 탈퇴를 예측하는 테크닉 10
041 데이터를 읽어 들이고 이용 데이터를 수정하자
042 탈퇴 전월의 탈퇴 고객 데이터를 작성하자
043 지속 회원의 데이터를 작성하자
044 예측할 달의 재적 기간을 작성하자
045 결측치를 제거하자
046 문자열 변수를 처리할 수 있게 가공하자
047 의사결정 트리를 사용해서 탈퇴 예측 모델을 구축하자
048 예측 모델을 평가하고 모델을 튜닝해 보자
049 모델에 기여하는 변수를 확인하자
050 회원 탈퇴를 예측하자
[3부] 실전편②: 최적화 문제
▣ 06장: 물류의 최적경로를 컨설팅하는 테크닉 10
051 물류 데이터를 불러오자
052 현재 운송량과 비용을 확인해 보자
053 네트워크를 가시화해 보자
054 네트워크에 노드를 추가해 보자
055 경로에 가중치를 부여하자
056 운송 경로 정보를 불러오자
057 운송 경로 정보로 네트워크를 가시화해 보자
058 운송 비용 함수를 작성하자
059 제약 조건을 만들어보자
060 운송 경로를 변경해서 운송 비용 함수의 변화를 확인하자
▣ 07장: 물류 네트워크 최적 설계를 위한 테크닉 10
061 운송 최적화 문제를 풀어보자
062 최적 운송 경로를 네트워크로 확인하자
063 최적 운송 경로가 제약 조건을 만족하는지 확인하자
064 생산 계획 데이터를 불러오자
065 이익을 계산하는 함수를 만들자
066 생산 최적화 문제를 풀어보자
067 최적 생산 계획이 제약 조건을 만족하는지 확인하자
068 물류 네트워크 설계 문제를 풀어보자
069 최적 네트워크의 운송 비용과 그 내역을 계산하자
070 최적 네트워크의 생산 비용과 그 내역을 계산하자
▣ 08장: 수치 시뮬레이션으로 소비자의 행동을 예측하는 테크닉 10
071 인간관계 네트워크를 가시화해 보자
072 입소문에 의한 정보 전파 모습을 가시화해 보자
073 입소문 수의 시계열 변화를 그래프화해 보자
074 회원 수의 시계열 변화를 시뮬레이션해 보자
075 파라미터 전체를 ‘상관관계’를 보면서 파악해 보자
076 실제 데이터를 불러와보자
077 링크 수의 분포를 가시화해 보자
078 시뮬레이션을 위해 실제 데이터로부터 파라미터를 추정하자
079 실제 데이터와 시뮬레이션을 비교하자
080 시뮬레이션으로 미래를 예측해 보자
[4부] 발전편: 이미지 처리 / 언어 처리
▣ 09장: 잠재고객을 파악하기 위한 이미지 인식 테크닉 10
081 이미지 데이터를 불러오자
082 동영상 데이터를 불러오자
083 동영상을 이미지로 나누고 저장하자
084 이미지 속에 사람이 어디에 있는지 검출해 보자
085 이미지 속 사람 얼굴을 검출해 보자
086 이미지 속 사람의 얼굴이 어느 쪽을 보고 있는지 검출해 보자
087 검출한 정보를 종합해서 타임랩스를 만들어보자
088 전체 모습을 그래프로 가시화해 보자
089 거리의 변화를 그래프로 확인해 보자
090 이동 평균을 계산해서 노이즈를 제거하자
▣ 10장: 앙케트 분석을 위한 자연어 처리 테크닉 10
091 데이터를 불러서 파악해 보자
092 불필요한 문자를 제거하자
093 문자 수를 세어 히스토그램으로 표시해 보자
094 형태소 분석으로 문장을 분해해 보자
095 형태소 분석으로 문장에서 ‘동사’, ‘명사’를 추출해 보자
096 형태소 분석으로 자주 나오는 명사를 확인해 보자
097 관계없는 단어를 제거해 보자
098 고객만족도와 자주 나오는 단어의 관계를 살펴보자
099 의견을 특징으로 표현해 보자
100 비슷한 설문지를 찾아보자
▣ 부록
001 데이터 결합과 정규화
002 머신러닝
003 최적화 문제
▣ 맺음말