본문 바로가기

책이야기

[리뷰]파이썬을 활용한 머신러닝 쿡북

반응형

 

<나는 리뷰어다> 10월 이벤트 당첨으로 작성한 리뷰 입니다.

 

[한줄평]

머신러닝 개념서를 다 읽고 실무에서 많이 쓰이는 문제를 경험 하고 싶은 분들에게 추천

 

[목차구성]

CHAPTER 1 벡터, 행렬, 배열

CHAPTER 2 데이터 적재

CHAPTER 3 데이터 랭글링

CHAPTER 4 수치형 데이터 다루기

CHAPTER 5 범주형 데이터 다루기

CHAPTER 6 텍스트 다루기

CHAPTER 7 날짜와 시간 다루기

CHAPTER 8 이미지 다루기

CHAPTER 9 특성 추출을 사용한 차원 축소

CHAPTER 10 특성 선택을 사용한 차원 축소

CHAPTER 11 모델 평가

CHAPTER 12 모델 선택

CHAPTER 13 선형회귀

CHAPTER 14 트리와 랜덤 포레스트

CHAPTER 15 k-최근접 이웃

CHAPTER 16 로지스틱 회귀

CHAPTER 17 서포트 벡터 머신

CHAPTER 18 나이브 베이즈

CHAPTER 19 군집

CHAPTER 20 신경망

CHAPTER 21 훈련된 모델 저장과 복원

 

[대상 독자]

머신러닝 이론과 개념에 익숙한 머신러닝 기술자

파이썬 프로그래밍과 패키지관리에 능숙한 개발자

교차검증, 랜덤 포레스트, 경사 하강법 같은 개념에 익숙한 분

 

[주요 내용]

● 벡터, 행렬, 배열

● 수치형과 범주형 데이터, 텍스트, 이미지, 날짜, 시간 다루기

● 특성 추출과 특성 선택을 사용한 차원 축소

● 모델 평가와 선택

● 선형 회귀, 로지스틱 회귀, 트리, 랜덤 포레스트, k-최근접 이웃

● 서포트 벡터 머신(SVM), 나이브 베이즈, 군집, 신경망

● 훈련된 모델의 저장과 복원

 

[서평]

 

‘파이썬을 활용한 머신러닝 쿡북’은 머신러닝 개념서를 숙지한후 실무에서 많이 만날수 있는 문제점과 해결 방법에 대해서 200가지의 케이스를 담고 있습니다. 그래서 현장에서 머신러닝 시스템을 만드는 사람들에게 필요한 책이라고 생각합니다. 데이터 과학자와 머신러닝 엔지니어가 모델을 만들 때 자주 사용하는 작업에 대해 상세히 알려주고 있습니다. 예를 들어 1,000개의 범주와 누락된 데이터가 있는 수치 특성, 불균형한 클래스로 이루어진 범주형 타깃 벡터가 담긴, JSON 파일을 가지고 있다고 가정해보면, 이 문제를 해결하는 방안으로 이책은 다음과 같은 레시피를 제공 합니다.

  1. JSON 파일을 적재하기 (2.5절)
  2. 특성을 표준화하기(4.2절)
  3. 특성 딕셔너리를 인코딩하기(5.3절)
  4. 누락된 클래스 값을 대체하기(5.4절)
  5. 주성분을 사용해 특성을 줄이기(9.1절)
  6. 랜덤 탐색을 사용하여 최선의 모델 선택하기(12.2절)
  7. 랜덤 포레스트 분류기 훈련하기(14.4절)
  8. 랜덤 포레스트에서 중요한 특성 선택하기(14,7절)

 

이책으로 머신러닝 초급에서 중급으로 올라가는데 많은 도움이 될것이라 생각합니다.

 

반응형