만들면서 배우는 파이토치 딥러닝
도서명:만들면서 배우는 파이토치 딥러닝
저자/출판사:오가와,유타로/한빛미디어
쪽수:544쪽
출판일:2021-08-05
ISBN:9791162244609
목차
CHAPTER 1 화상 분류와 전이학습(VGG)
1.1 학습된 VGG 모델을 사용하는 방법
1.2 파이토치를 활용한 딥러닝 구현 흐름
1.3 전이학습 구현
1.4 아마존 AWS의 클라우드 GPU 머신을 사용하는 방법
1.5 파인튜닝 구현
CHAPTER 2 물체 감지(SSD)
2.1 물체 감지란
2.2 데이터셋 구현
2.3 데이터 로더 구현
2.4 네트워크 모델 구현
2.5 순전파 함수 구현
2.6 손실함수 구현
2.7 학습 및 검증 실시
2.8 추론 실시
CHAPTER3 시맨틱 분할(PSPNet)
3.1 시맨틱 분할이란
3.2 데이터셋과 데이터 로더 구현
3.3 PSPNet 네트워크 구성 및 구현
3.4 Feature 모듈 설명 및 구현(ResNet)
3.5 Pyramid Pooling 모듈 설명 및 구현
3.6 Decoder, AuxLoss 모듈 설명 및 구현
3.7 파인튜닝을 활용한 학습 및 검증 실시
3.8 시맨틱 분할 추론
CHAPTER 4 자세 추정(OpenPose)
4.1 자세 추정 및 오픈포즈 개요
4.2 데이터셋과 데이터 로더 구현
4.3 오픈포즈 네트워크 구성 및 구현
4.4 Feature 및 Stage 모듈 설명 및 구현
4.5 텐서보드X를 사용한 네트워크의 시각화 기법
4.6 오픈포즈 학습
4.7 오픈포즈 추론
CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)
5.1 GAN을 활용한 화상 생성 메커니즘과 DCGAN 구현
5.2 DCGAN의 손실함수, 학습, 생성
5.3 Self-Attention GAN의 개요
5.4 Self-Attention GAN의 학습, 생성
CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)
6.1 GAN을 활용한 이상 화상 탐지 메커니즘
6.2 AnoGAN 구현 및 이상 탐지 실시
6.3 Efficient GAN의 개요
6.4 Efficient GAN 구현 및 이상 탐지 실시
CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)
7.1 형태소 분석 구현(Janome, MeCab+NEologd)
7.2 torchtext를 활용한 데이터셋, 데이터 로더 구현
7.3 단어의 벡터 표현 방식(word2vec, fasttext)
7.4 word2vec, fasttext에서 학습된 모델(일본어)을 사용하는 방법
7.5 IMDb의 데이터 로더 구현
7.6 Transformer 구현(분류 작업용)
7.7 Transformer의 학습/추론, 판단 근거의 시각화 구현
CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)
8.1 BERT 메커니즘
8.2 BERT 구현
8.3 BERT를 활용한 벡터 표현 비교(bank: 은행과 bank: 강변)
8.4 BERT의 학습 및 추론, 판단 근거의 시각화 구현
CHAPTER 9 동영상 분류(3DCNN, ECO)
9.1 동영상 데이터에 대한 딥러닝과 ECO 개요
9.2 2D Net 모듈(Inception-v2) 구현
9.3 3D Net 모듈(3DCNN) 구현
9.4 Kinetics 동영상 데이터셋을 데이터 로더로 구현
9.5 ECO 모델 구현 및 동영상 분류의 추론 실시