본문 바로가기

책이야기

[리뷰]만들면서 배우는 파이토치 딥러닝

반응형

 

 

[도서 소개]

딥러닝은 입출력 데이터와 손실함수만 잘 정의한다면 다양한 분야의 과제를 해결할 수 있다. 딥러닝 응용 방법으로 전이학습과 파인튜닝을 활용한 화상(이미지) 분류, 물체 감지, 시맨틱 분할, 자세 추정, GAN을 활용한 화상 생성 및 이상 탐지, 텍스트 데이터 감정 분석, 동영상 데이터 클래스 분류를 다뤘다. 직무 특성에 따른 도메인 지식과 딥러닝 구현 능력을 갖춘 인재로 성장하여 활약하는 데 이 책이 도움이 될 것이다.

 

[작가 소개]

저자 : 오가와 유타로

SIer의 기술본부 개발기술부 소속. 딥러닝을 비롯한 머신러닝 관련 기술의 연구 개발 및 기술 지원을 담당한다. 아카시 공업고등전문학교, 도쿄대학 공학부를 거쳐 도쿄대학 대학원, 짐보/고타니 실험실에서 뇌 기능 측정 및 계산 신경과학을 연구했으며 2016년에 박사 학위를 취득했다. 도쿄대학 특임 연구원을 거쳐 2017년 4월부터 현재 직무에 종사 중이다. 저서로 『PyTorch를 활용한 강화학습/심층강화학습 실전 입문』, 『つくりながら學ぶ! Pythonによる因果分析』 등이 있다.

 

역자 : 박광수(아크몬드)

'아크몬드'라는 필명으로 더 잘 알려진 블로거. 2004년부터 지금까지 최신 윈도우 정보를 꾸준히 나누고 있다. 2007년부터 2019년까지 마이크로소프트 MVP(Windows 부문)를 수상했다. 윈도우 11 등 마이크로소프트의 최신 기술에 열광한다. 현재 일본에서 서버 개발자로 활동하며 딥러닝에 많은 관심을 두고 있다. 번역서로 『처음 배우는 딥러닝 수학』, 『파이썬으로 배우는 머신러닝의 교과서』, 『파이썬으로 배우는 딥러닝 교과서』(이상 한빛미디어) 등이 있다.

 

[목차]

CHAPTER 1 화상 분류와 전이학습(VGG)

CHAPTER 2 물체 감지(SSD)

CHAPTER3 시맨틱 분할(PSPNet)

CHAPTER 4 자세 추정(OpenPose)

CHAPTER 5 GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)

CHAPTER 6 GAN을 활용한 이상 화상 탐지(AnoGAN, Efficient GAN)

CHAPTER 7 자연어 처리에 의한 감정 분석(Transformer)

CHAPTER 8 자연어 처리를 활용한 감정 분석(BERT)

CHAPTER 9 동영상 분류(3DCNN, ECO)

 

[주요 내용]

- 화상 분류와 전이학습

- 물체 인식

- 시맨틱 분할

- 자세 추정

- GAN을 활용한 화상 생성

- 자연어 처리를 활용한 감정 분석

- 동영상 분류

 

[예제 코드 소스]

깃허브 : https://github.com/YutaroOgawa/pytorch_advanced

 

[서평]

구현 환경은 아나콘다와 주피터 노트북을 사용합니다.

  • PC 환경 : 데스크탑(GPU X) 및 AWS를 사용한 GPU서버
  • AWS 환경 : p2.xlarge 인스턴스, Deep learning AMI 머신
  • 파이썬 버전 : 3.6.5
  • 파이토치 버전 : 1.1

 

‘만들면서 배우는 파이토치 딥러닝은 딥러닝 응용기술을 구현하면서 학습을 할수 있습니다. 기초적인 딥러닝(합성곱 신경망을 이용한 화상 분류등)을 구현한 경험이 있는 독자 수준의 난이도 입니다. 딥러닝을 구현하는 패키지는 주로 파이토치를 이용 하고 있습니다. 이 책에서 설명하고 구현한 딥러닝 모델은 비즈니스 현업에서 가장 많이 사용하는 모델로 실전 경험을 쌓는데 도움이 될것이라 생각합니다. 이 책에서 소개 하는 모델을 이해하면 딥러닝 학습이나 연구 및 개발에 도움이 될것입니다. 딥러닝 모델에 익숙 하지 않다면 1장 부터 차례대로 읽는 것을 추천 드립니다. 각 장에서 설명하는 딥러닝 모델을 이해하려면 이전 장의 지식이 필요하기 때문입니다. 1장부터 쉬운 모델부터 구현 하면서 차차 고차원의 딥러닝 응용법을 익힐 수 있습니다.

 

_1장. 화상 분류와 전이학습(VGG)

학습된 VGG 모델을 활용해 소량의 데이터로 딥러닝 모델을 구축할 수 있는 전이학습과 파인튜닝을 알아봅니다. 또한 이 책에서는 AWS의 클라우드 GPU 머신을 사용하여 딥러닝을 설명합니다.

 

 

_2장. 물체 인식(SSD)

물체 감지는 딥러닝 응용 방법 중에서도 특히 복잡한 기술입니다. SSD 모델을 활용해 물체 감지의 흐름을 설명합니다.

_3장. 시맨틱 분할(PSPNet)

픽셀 수준에서 물체를 분류하는 시맨틱 분할을 학습하면서 딥러닝 모델 PSPNet을 설명합니다. 어떻게 픽셀 수준에서 물체를 분류할 수 있는지와 함께 네트워크 구조, 순전파함수, 손실함수도 알아봅니다.

_4장. 자세 추정(OpenPose)

자세 추정은 화상에 포함된 여러 인물을 탐지하여 인체 각 부위의 위치를 식별하고 부위를 연결하는 선(링크)을 구하는 기술입니다. OpenPose가 어떻게 사람의 각 부위를 탐지하고 부위를 서로 연결하는지 구현하며 그 구조를 확인합니다. 모델의 네트워크 구조 확인 방법으로 텐서보드X 사용법을 설명합니다.

_5장. GAN을 활용한 화상 생성(DCGAN, Self-Attention GAN)

Self-Attention은 자연어 처리(NLP)에 활용되는 Transformer와 BERT의 열쇠가 되지만 이해하기 어렵기 때문에 우선은 화상에서 Self-Attention을 구현하고 이해하는 것을 목표로 합니다.

_6장. GAN을 활용한 이상 감지(AnoGAN, Efficient GAN)

이상 화상 검출은 의료 현장에서 질환 및 건강 상태를 판별하거나 제조업에서 이상이 있는 부품을 검출할 경우 등에 사용합니다. 이상 화상이 정상 화상보다 매우 적을 때는 AnoGAN을, 이상 탐지에 걸리는 시간을 해결하기 위해서는 EfficientGAN을 응용할 수 있습니다.

_7장. 자연어 처리를 활용한 감정 분석(Transformer)

텍스트 데이터를 취급하는 자연어 처리를 살펴보고 딥러닝 모델 Transformer를 활용해 텍스트 데이터 내용을 긍정과 부정으로 감정합니다. word2vec과 fasttext를 활용해 단어를 벡터 표현으로 수치화하고 단어에 Attention을 걸어 추론 결과를 시각화해봅니다.

_8장. 자연어 처리를 활용한 감정 분석(BERT)

감정 분석 모델을 구축, 학습하고 추론해 문맥에 따라 단어 벡터가 어떻게 변화하는지 알아보고 Self-Attention으로 시각화해봅니다.

_9장. 동영상 분류(3DCNN, ECO)

화상 분류와 동영상 분류의 차이에 주목하면서 어떻게 동영상을 딥러닝에서 다루고 구현하는지 설명합니다.

 

이 책은 딥러닝 입문서가 아닌 중급 수준의 도서로 꽤 난이도가 있는 책이라 힘든 부분도 있었지만, 이론적으로 어려운 부분은 그림과 표로 자세히 설명을 하고 있습니다. 아마존 서비스인 AWS로 딥러닝 환경을 구축하고, 코드를 실행해가며 본문을 확인해 보니 실무에서 활용할 때 도움이 될 만한 내용들로 가득하다는 것을 알게될 것입니다.

 처음 부터 차근 차근 딥러닝 모델은 구현 하면서 학습을 하면서 점차 고도의 딥러닝 응용법을 익히고, 최고 성능 모델의 구현 경험을 쌓으면서 모델을 이해하면 딥러닝 학습이나 연구 및 개발에 크게 도움이 될 것입니다. 직접 딥러닝 모델을 코딩 하면서 하나씩 알아가는 딥러닝 응용기법을 ‘만들면서 배우는 파이토치 딥러닝’을 통해서 배우시는 걸 추천 드립니다.

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형