자연어 처리 쿡북 with 파이썬
도서명:자연어 처리 쿡북 with 파이썬
저자/출판사:크리슈나,바브사,나레쉬,쿠마르,프라탑,단게티/에이콘출판
쪽수:344쪽
출판일:2019-01-31
ISBN:9791161752655
목차
1장. 말뭉치와 워드넷
__소개
__내장 말뭉치 액세스
__외부 말뭉치 다운로드, 로드하고 액세스하기
__브라운 코퍼스에서 세 가지 장르의 wh 단어 모두 세기
__웹 및 채팅 텍스트 자료 파일 중 하나에서 빈도 분포 작업 탐색
__모호한 단어를 가지고 워드넷을 사용해 모든 의미 탐구
__두 개의 구별되는 동의어 집합을 선택하고 워드넷을 사용해 상위어와 하위어 개념 탐색
__워드넷으로 명사, 동사, 형용사, 부사의 다의어 평균 계산
2장. 처리 전 텍스트, 소싱, 정규화
__소개
__문자열 연산의 중요성
__문자열 연산 심화
__파이썬에서 PDF 파일 읽기
__파이썬에서 워드 문서 읽기
__PDF, DOCX, 일반 텍스트 파일을 가져와 사용자 정의 말뭉치 생성
__RSS 피드에서 내용 읽기
__BeautifulSoup를 사용한 HTML 파싱
3장. 전처리
__소개
__토큰화-NLTK 내장 토크나이저 사용법
__스테밍-NLTK 내장 스테머 사용법
__원형 복원-NLTK WordnetLemmatizer 사용법
__불용어-불용어 말뭉치 사용법과 불용어가 만들어내는 차이점 확인
__편집 거리-두 문자열 간의 편집 거리를 찾기 위한 알고리즘 작성
__두 단문 처리와 둘 사이의 공통 어휘 추출
4장. 정규표현식
__소개
__정규표현식-*, +, ? 사용법
__정규표현식-$와 ^, 단어의 시작과 끝이 아닌 단어를 사용하는 방법
__여러 개의 리터럴 문자열과 하위 문자열 검색
__날짜 정규표현식과 문자 집합 또는 문자 범위 집합 만들기
__문장에서 모든 다섯 글자 단어를 찾고****어 만들기
__자체 정규식 토크나이저 작성법
__자체 정규식 스테머 작성법
5장. 품사 태깅과 문법
__소개
__내장 태거 탐구
__자체 태거 작성
__자체 태거 학습
__자체 문법 작성 학습
__확률적 문맥 무관 문법-CFG 작성
__재귀 CFG 작성
6장. 청킹, 문장 구문 분석, 의존성
__소개
__내장 청커 사용
__간단한 청커 작성
__청커 학습
__재귀 하향 구문 분석
__시프트 변환 구문 분석
__의존 문법과 투사 의존성 구문 분석
__차트 구문 분석
7장. 정보 추출과 텍스트 분류
__소개
__내장 개체명 인식 기능 사용
__딕셔너리 생성, 반전, 사용
__피처셋 선택
__분류기를 사용한 문장 분할
__문서 분류
__문맥 기반 품사 태거 작성
8장. 고급 NLP 레시피
__소개
__NLP 파이프라인 생성
__텍스트 유사도 문제 해결
__주제 식별
__텍스트 요약
__대용어 해결
__단어 의미 명확화
__감정 분석 수행
__고급 감정 분석 탐색
__대화형 비서 또는 챗봇 만들기
9장. NLP의 딥러닝 적용
__소개
__TF-IDF 생성 후 심층 신경망을 이용한 이메일 분류
__합성곱망 CNN 1D를 이용한 IMDB 감정 분류
__양방향 LSTM을 이용한 IMDB 감정 분류
__신경 단어 벡터 시각화를 사용해 고차원의 단어를 2차원으로 시각화
10장. NLP 분야에서 딥러닝의 고급 응용
__소개
__LSTM을 사용해 셰익스피어의 저서에서 고급 자동 텍스트 생성
__메모리 네트워크를 사용해 에피소드 데이터에 대한 질의 응답
__순환 신경망을 사용해 다음 단어를 예측하는 언어 모델링-LSTM
__딥러닝 순환망을 사용하는 생성 챗봇 개발-LSTM