본문 바로가기

책이야기

[리뷰]만들면서 배우는 생성 AI

반응형

 

[도서 소개]

『미술관에 GAN 딥러닝 실전 프로젝트』 두 번째 이야기

세상을 변화시킨 생성 AI의 과거와 현재, 미래까지

 

명쾌하고 설득력 있게 생성 AI를 설명하는 데이비드 포스터가 돌아왔습니다. 이 책의 초판인 『미술관에 GAN 딥러닝 실전 프로젝트』는 GAN을 집중적으로 설명했지만, 초판 출간 이후 생성 AI 분야가 크게 발전했습니다. 세상을 놀라게 한 생성 AI의 눈부신 발전을 담아내기 위해 2판을 새롭게 업데이트했습니다. 기존 내용을 최신 기술 정보로 수정하고, 트랜스포머 설명을 더 상세하게 보완하고, 멀티모달 모델 내용을 새롭게 추가했습니다. 업그레이드된 2판은 GAN에만 국한된 내용을 소개하지 않기에 『만들면서 배우는 생성 AI』라는 새로운 이름으로 찾아왔습니다.

 

본격적인 설명에 앞서 흥미를 자극하는 이야기와 실용적인 예시, 활용법까지 최신 기술로 무장한 이 책은 여러분을 생성 AI의 전문가로 업그레이드해줄 것입니다. 컴퓨터로 창작하는 가장 진보한 기술을 활용하는 법을 터득해보세요. 생성 AI를 접한 경험이 없더라도 괜찮습니다. 처음부터 따라 하며 차근차근 기술을 습득할 수 있게 친절히 안내합니다. 여러분에게 필요한 건 파이썬 코딩 경험, 그뿐입니다. 생성 모델의 기본 원리부터 파악한 후 파이썬과 케라스로 직접 코딩하며 생성 AI를 배워보세요.

 

2판에서 달라진 점

 

-1장은 다양한 생성 모델을 소개하고 이들의 연관성을 나타내는 분류 체계를 담았습니다.

-2장은 그림을 개선했으며 주요 개념을 더 자세하게 설명합니다.

-3장은 새로운 예제와 설명을 담았습니다.

-4장은 조건부 GAN 구조를 설명합니다.

-5장은 이미지를 위한 자기회귀 모델(예: PixelCNN)을 설명합니다.

-6장은 완전히 새로운 장으로, RealNVP 모델을 설명합니다.

-7장 역시 새로운 장이며, 랑주뱅 역학 및 대조 발산과 같은 기법에 초점을 맞춥니다.

-8장은 오늘날 많은 최신 애플리케이션의 기반이 되는 잡음 제거 확산 모델을 위해 새로 작성한 장입니다.

-9장은 초판의 마지막 장 내용을 확장한 것으로, 다양한 StyleGAN 모델 구조와 VQ-GAN에 관한 새로운 내용을 심층적으로 다룹니다.

-10장은 트랜스포머 아키텍처를 자세히 살펴보는 새로운 장입니다.

-11장은 초판의 LSTM 모델을 대신하여 최신 트랜스포머 아키텍처를 다룹니다.

-12장은 그림과 설명을 업데이트했으며 이 접근 방식이 오늘날의 최신 강화 학습에 어떻게 영향을 미치는지 소개합니다.

-13장은 새로운 장으로 DALL·E 2, Imagen, 스테이블 디퓨전, 플라밍고와 같은 인상적인 모델이 어떻게 작동하는지 자세히 설명합니다.

-14장은 초판 이후 생성 AI의 놀라운 발전 현황을 반영하고 앞으로 나아갈 방향에 관한 더욱 완벽하고 상세한 시각을 제공합니다.

 

[대상 독자]

-생성형 AI의 작동 방식을 이해하고, 직접 사용해보고 싶은 학부생 및 개발자

-최신 딥러닝 기술에 관심 있는 머신러닝 엔지니어, 데이터 과학자 및 연구원

 

[주요 내용]

-VAE로 사진 속 얼굴 표정 바꾸기

-자체 데이터셋을 학습한 GAN으로 이미지 생성하기

-확산 모델로 새로운 꽃 종류 만들기

-텍스트 생성을 위한 자체 GPT 훈련하기

-대규모 언어 모델인 챗GPT 훈련 방법 알아보기

-StyleGAN2, ViT VQ-GAN과 같은 최신 아키텍처 조사하기

-트랜스포머와 MuseGAN을 사용해 다성 음악 작곡하기

-월드 모델이 강화 학습 과제를 해결하는 방법 이해하기

-DALL·E 2, Imagen, 스테이블 디퓨전과 같은 멀티모달 모델 알아보기 

 

[서평]

제너레이티브 인공지능(GAN)은 David Foster의 책 1판 이후로 패러다임 변화를 겪었고, 최신 기술과 발전 상황을 제공하는 업데이트된 2판인 "Generative AI that learns by making it"은 이 분야의 복잡성을 깊이 있게 파헤치는 종합적인 가이드입니다. 이 판에서 포스터는 생성 AI의 복잡성을 능숙하게 이끌어내며 독자들에게 최신 기법과 진보를 갖추게 합니다.

 

콘텐과 구조: 책은 잘 구성되어 있으며, 초보자부터 숙련된 머신러닝 전문가까지 다양한 독자를 고려하고 있습니다. 서론 장들은 다양한 생성 모델과 그들의 관계를 명확히 설명하며 견고한 기초를 제공합니다. 분류 체계의 포함은 명료성을 높여, 이 분야가 처음인 사람들에게도 접근성을 제공합니다. 후속 장들은 조건부 GAN 구조, 자기회귀 모델, RealNVP, 랑주뱅 역학, 대조 발산 등 본격적인 주제를 더 깊게 다룹니다.

 

기술적 깊이와 명료성: 작가의 기술적 깊이와 명료성 사이에 잘 균형을 맞추며, 독자들이 복잡한 개념을 잘 이해하도록 쉽게 설명합니다. 특히, 세부 설명 전에 흥미로운 이야기, 실용적인 예시, 쉬운 사용 방법을 통합하는 책의 접근 방식은 매우 효과적입니다. 이 방식은 원활한 학습 경험을 제공하며, 기본 원칙에서 고급 기술로 자신감 있게 진행할 수 있게 합니다.

 

업데이트와 추가 내용: 2판은 특히 큰 업데이트와 최신 기술 추가로 인해 두드러집니다. 생성 AI의 핵심 요소인 트랜스포머 설명의 상세화는 값진 개선 사항입니다. 잡음 제거 확산 모델 탐색과 트랜스포머 아키텍처에 대한 자세한 살펴보기 등 새로운 장의 소개는 저자가 빠르게 변화하는 이 분야에 대해 최신 상태를 유지하려는 의지를 보여줍니다. 또한, DALL·E 2와 Imagen과 같은 멀티모달 모델의 다룸은 최신 생성 AI의 발전을 반영하는 미래 지향적인 시각을 추가합니다.

 

대상 독자: 책은 학부생, 개발자, 머신러닝 엔지니어, 데이터 과학자, 연구원 등 다양한 독자에게 적합합니다. 기본적인 파이썬 코딩 능력을 요구하면서도 생성 AI 경험은 가정하지 않음으로써 포스터는 포괄성을 보장하며, 책을 더 넓은 독자에게 접근 가능하게 만듭니다.

 

주목할 만한 주제: 이 책은 실용적인 응용에 중점을 둬 독자들이 제너레이티브 인공지능의 실제적인 활용 가능성을 파악할 수 있도록 돕습니다. 사진에서 표정을 바꾸는 미술적인 작업부터 트랜스포머를 사용하여 다중 음향을 작곡하는 등 다양한 현실 세계 응용 사례를 제시합니다. 더불어, 제너레이티브 모델이 현대 강화 학습에 어떻게 영향을 미치는지, 특히 World Model의 맥락에서 설명한 부분은 제너레이티브 인공지능과 다른 분야의 교차점에 대한 통찰을 제공합니다.

 

결론: David Foster의 "Generative AI that learns by making it" (2판)은 제너레이티브 인공지능을 이해하고 숙달하고자 하는 모든 이에게 권할 만한 도서입니다. 이 책은 포괄적인 내용, 매력적인 스타일, 그리고 포용성 있는 접근 방식으로 빛납니다. 제너레이티브 인공지능의 매혹적인 세계를 철저하고 접근 가능한 탐험을 제공하며, 기초를 탄탄하게 다지려는 초보자든, 최신 기술을 찾는 숙련자든 이 책은 필수적인 안내서 역할을 합니다.





 "한빛미디어 리뷰어 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

반응형