본문 바로가기

책이야기

[리뷰]파이썬 라이브러리를 활용한 데이터 분석 2판

반응형

한빛미디어의 <나는 리뷰어다> 6월 이벤트에 당첨되어 작성한 리뷰입니다.

 

[한줄평]

파이썬의 데이터 분석 라이브러리를 딥하게 공부하는 분들에게 추천합니다.

 

[목차구성]

이책은 총 CHAPTER 14로 구성되어 있습니다.

 

1장: 시작하기 전에

-> 왜 데이터 분석에 파이썬을 사용해야 하는지 필수 라이브러리는 어떤것이 있는지 기본적인 파이썬 환경 세팅을 설명 하고 있습니다.

2장: 파이썬 언어의 기본, IPython, 주피터 노트북

-> 파이썬 인터프리터 개념과 IPython, 주피터 노트북의 기초에 대해서 배울수 있습니다.

3장: 내장 자료구조, 함수, 파일

-> 파이썬의 자료구조와 순차 자료형, 함수, 파일과 운영체제의 개념을 배웁니다.

4~5장 : NumPy, pandas

-> NumPy의 기본 사용법과 pandas의 핵심 기능을 배웁니다.

6~8장 : 데이터 로딩과 저장, 데이터 정제 및 준비하기

-> 텍스트 파일에서 데이터를 읽고 쓰는 방법과 문자열 다루는 방법, 데이터 합치기 등을 배울수 있습니다.

9~11장 : 그래프와 시각화, 데이터 집계, 시계열

-> matplotlib API사용법과 pandas로 그래프 그리기, 피벗테이블과 교차 알림표 만들기, 시계열 기초를 배울수 있습니다.

12~14장 : 고급 pandas, 파이썬 모델링 라이브러리, 데이터 분석 예제

-> pandas의 고급 GroupBy 사용법과 메서드 연결 기법을 배우고, 파이썬 모델링 라이브러리의 소개, 데이터 분석 실전 예제를 배웁니다.

 

[2판의 주요 변경 사항]

모든 코드를 파이썬 3.6기반으로 수정

아나콘다 파이썬 배포판과 몇몇 필수 파이썬 패키지로 설치

최신 pandas 라이브러리 사용

pandas 고급 사용법과 사용팁 추가

statsmodels와 scikit-learn 라이브러리 소개

 

[서평]

이책은 데이터분석을 하기전에 필요한 선행 학습에 대해서 진철하게 잘 설명하고 있습니다.

보통 데이터 분석 책들을 보면 데이터 분석에 중점을 두고 설명을 하는데 이책은 처음 파이썬을 시작한다는 가정하게 설명을 하고 있습니다. 그래서 파이썬을의 기초 문법 부터 데이터 분석에 필요한 라이브러리(NumPy, pandas, matplotlib, IPython, Jupyter, SciPy, scikit-learn, statsmodels)등을 자세하게 소개하고 있다.  기본적인 파이썬 기능에 대해 설명 후 데이터 수집, 처리,분석,시각화 리포팅까지 잘 설명해주고 있다. 파이썬의 pandas, Numpy, ipython, 주피터 노트북 등 라이브러리를 활용하여 일반적으로 처리하기 힘든 데이터를 손쉽게 처리하고자 하는 개발자 혹은 사이언티스트에게 어떻게 사용해야 하는지 알려주는 좋은 교재가 될것이라 생각합니다.

 

PS. 파이썬의 어떤 책보다 NumPy를 자세하게 설명하고 고급 기능 까지 잘 알려주는 책입니다. NumPy를 좀더 깊게 공부하고 싶으면 일독하기를 권합니다.

반응형