Do it! 데이터 분석을 위한 판다스 입문
도서명:Do it! 데이터 분석을 위한 판다스 입문
저자/출판사:다니엘,첸/이지스퍼블리싱
쪽수:280쪽
출판일:2018-10-11
ISBN:9791163030287
목차
01장 판다스 실습 환경 준비하기
01-1 아나콘다 설치
아나콘다가 잘 설치되었는지 확인하기
01-2 판다스 실습 준비
실습 프로젝트 준비하고 프로젝트 폴더 살펴보기
01-3 안녕? 주피터 노트북!
01-4 파이썬 패키지 관리자 ㅡ pip
02장 판다스 시작하기
02-1 데이터 집합 불러오기
데이터 분석의 시작은 데이터 불러오기부터
시리즈와 데이터프레임
판다스와 파이썬 자료형 비교
02-2 데이터 추출하기
열 단위 데이터 추출하기
행 단위 데이터 추출하기
인덱스와 행 번호 개념 알아보기
loc, iloc 속성 자유자재로 사용하기
02-3 기초적인 통계 계산하기
02-4 그래프 그리기
03장 판다스 데이터프레임과 시리즈
03-1 나만의 데이터 만들기
03-2 시리즈 다루기 ― 기초
시리즈 속성과 메서드 사용하기 ㅡ index, values, keys
시리즈의 기초 통계 메서드 사용하기
03-3 시리즈 다루기 ― 응용
시리즈와 불린 추출
시리즈와 브로드캐스팅
03-4 데이터프레임 다루기
03-5 시리즈와 데이터프레임의 데이터 처리하기
03-6 데이터 저장하고 불러오기
04장 그래프 그리기
04-1 데이터 시각화가 필요한 이유
앤스콤 4분할 그래프 살펴보기
앤스콤 데이터 집합 모두 사용해 그래프 만들기
04-2 matplotlib 라이브러리 자유자재로 사용하기
기초 그래프 그리기
다변량 그래프 그리기
04-3 seaborn 라이브러리 자유자재로 사용하기
04-4 데이터프레임과 시리즈로 그래프 그리기
04-5 seaborn 라이브러리로 그래프 스타일 설정하기
05장 데이터 연결하기
05-1 분석하기 좋은 데이터
분석하기 좋은 데이터란?
05-2 데이터 연결 기초
행이 1개라도 반드시 데이터프레임에 담아 연결해야 합니다
다양한 방법으로 데이터 연결하기
05-3 데이터 연결 마무리
06장 누락값 처리하기
06-1 누락값이란?
누락값과 누락값 확인하기
누락값이 생기는 이유
누락값의 개수
누락값 처리하기
누락값이 포함된 데이터 계산하기
07장 깔끔한 데이터
07-1 열과 피벗
넓은 데이터
07-2 열 이름 관리하기
하나의 열이 여러 의미를 가지고 있는 경우
split 메서드로 열 이름 분리하기
07-3 여러 열을 하나로 정리하기
07-4 중복 데이터 처리하기
07-5 대용량 데이터 처리하기
여러 개로 나누어진 데이터 불러오기
08장 판다스 자료형
08-1 자료형 다루기
자료형 변환하기
잘못 입력한 데이터 처리하기
08-2 카테고리 자료형
09장 문자열 처리하기
09-1 문자열 다루기
파이썬과 문자열
인덱스로 문자열 추출하기
전체 문자열 추출하기
09-2 문자열 메서드
09-3 문자열 포매팅
문자열 포매팅하기
숫자 데이터 포매팅하기
% 연산자로 포매팅하기
09-4 정규식으로 문자열 처리에 날개 달기
정규식이란?
10장 apply 메서드 활용
10-1 간단한 함수 만들기
10-2 apply 메서드 사용하기 ㅡ 기초
10-3 apply 메서드 사용하기 ㅡ 고급
11장 그룹 연산
11-1 데이터 집계
데이터 집계하기 ㅡ groupby 메서드
분할-반영-결합 과정 살펴보기 ㅡ groupby 메서드
groupby 메서드와 함께 사용하는 집계 메서드
agg 메서드로 사용자 함수와 groupby 메서드 조합하기
여러 개의 집계 메서드 한 번에 사용하기
11-2 데이터 변환
표준점수 계산하기
누락값을 평균값으로 처리하기
11-3 데이터 필터링
11-4 그룹 오브젝트
그룹 오브젝트 살펴보기
한 번에 그룹 오브젝트 계산하기
그룹 오브젝트 활용하기
여러 열을 사용해 그룹 오브젝트 만들고 계산하기
12장 시계열 데이터
12-1 datetime 오브젝트
datetime 오브젝트로 변환하기 ㅡ to_datetime 메서드
시간 형식 지정자
datetime 오브젝트로 변환하기 ㅡ read_csv 메서드
datetime 오브젝트에서 날짜 정보 추출하기
dt 접근자 사용하기
12-2 사례별 시계열 데이터 계산하기
datetime 오브젝트와 인덱스 ㅡ DatetimeIndex
시간 간격과 인덱스 ㅡ TimedeltaIndex
시간 범위와 인덱스
시간 범위 수정하고 데이터 밀어내기 ㅡ shift 메서드