◆ 출판사 ◆

위키북스


◆ 책소개 ◆

이 책은 기존 자연어 처리 서적과는 다른 세 가지 특징을 가지고 있다.

첫째, 자연어 처리에 활용되는 개념적인 설명에서 끝나는 것이 아니라 모델 구현에 집중한다. 그뿐만 아니라 상용 서비스를 지원하는 텐서플로를 기반으로 모델을 개발한다.

둘째, 실무에서 자연어 처리 문제를 해결하는 데 조금이나마 도움이 되고자 캐글 대회의 문제를 활용했으며, 감정분석부터 유사도 처리, 챗봇에 이르기까지 다양한 문제를 다룬다.

셋째, 딥러닝 기반 자연어 처리를 다룬 서적은 대부분 번역서이기 때문에 주로 영어 데이터만 다루지만 이 책에서는 영어 데이터뿐만 아니라 한글 데이터를 활용한 문제 해결까지 다룬다.

◆ 상세이미지 ◆




◆ 목차 ◆

▣ 1장: 들어가며
이 책의 목표와 활용법
__아나콘다 설치

실습 환경 구축
가상 환경 구성
__실습 프로젝트 구성
__pip 설치
__주피터 노트북

정리

▣ 2장: 자연어 처리 준비
텐서플로
__tf.keras.layers
__tf.data
__에스티메이터(Estimator)

사이킷런
__사이킷런을 이용한 데이터 분리
__사이킷런을 이용한 지도학습
__사이킷런을 이용한 비지도학습
__사이킷런을 이용한 특징 추출
__TfidfVecotorizer

자연어 토크나이징 도구
__영어 토크나이징 라이브러리
__한글 토크나이징 라이브러리

그 밖의 라이브러리(전처리)
__넘파이
__판다스
__Matplotlib
__맷플롯립 설치
__Matplotlib.pyplot
__re

캐글 사용법

정리

▣ 3장: 자연어 처리 개요
단어 표현

텍스트 분류
__텍스트 분류의 예시

텍스트 유사도

자언어 생성

기계 이해

데이터 이해하기

정리

▣ 4장: 텍스트 분류
영어 텍스트 분류
__문제 소개
__데이터 분석 및 전처리
__텍스트 모델링 소개
__분류 회귀 모델
__TF-IDF를 활용한 모델 구현
__랜덤 포레스트 분류 모델
__순환 신경망 분류 모델
__컨볼루션 신경망 분류 모델

한글 텍스트 분류
__문제 소개
__데이터 전처리 및 분석
__모델링
__마무리

▣ 5장: 텍스트 유사도
문제 소개

데이터 분석과 전처리
__XG 부스트 텍스트 유사도 분석 모델

모델링
__CNN 텍스트 유사도 분석 모델
__모델 구현
__MaLSTM

정리

▣ 6장: 챗봇 만들기
데이터 소개

데이터 분석

시퀀스 투 시퀀스 모델링
__모델 소개

트랜스포머 네트워크
__모델 구현

정리

▣ 부록
부록 A _ MaLSTM 모델
부록 B _ Seq2Seq 모델
부록 C _ 트랜스포머 모델


◆ 저자소개 ◆

저자: 전창욱 저자 : 전창욱
배우고 성장하기 위해 끊임없이 공부하는 것을 즐기며, 해마다 목표를 정하고 이뤄가는 재미에 푹 빠져 살아가고 있습니다. 배운 것은 만들어보고 이론과 실습을 같이 키워나가고 삶의 방향성을 찾기 위해 책을 읽는 시니어 개발자입니다. 머신러닝을 공부하면서 2016년 Google Hack Fair, Seoul Make Fair에 참여했고, 국립과천과학관 관장상과 2017년 서울혁신챌린지 혁신챌린지상을 수상했으며, KBS 시사교양 프로그램인 《명견만리》에 출연하고, 2018년 국어 정보 처리 시스템 경진 대회에서 금상을 수상했습니다. 현재 DeepNLP 연구실 리더이며 클라이언트, 서버, 데이터를 만지는 일을 하고 있습니다.

저자 : 최태균
클래식 음악을 듣기 좋아하고 오랫동안 산책을 즐기는 소프트웨어 개발자입니다. 컴퓨터 분야에 이것저것 관심을 가지다 딥러닝과 자연어 처리를 우연히 접하게 되어 재미를 키워가고 있습니다. 서경대학교 컴퓨터과학과를 졸업했고 현재는 스타트업에서 일하고 있습니다.

저자 : 조중현
중앙대학교에서 수학을 전공했으며, 우연한 기회로 개발을 접하게 됐습니다. 그 후 딥러닝이라는 분야에 관심을 가지고, 그중에서도 자연어 처리 분야를 집중적으로 공부하고 있습니다. 다양한 어려운 문제를 새로운 모델을 통해 해결하는 것이 딥러닝의 매력이라 생각합니다. 계속해서 세상의 많은 문제들을 딥러닝을 통해 해결하는 것을 목표로 삼고 있습니다.