본문 바로가기

혼공단/혼공분석10기

혼공학습단 10기 혼공분석 1주차

반응형

chapter01 기본미션+선택미션 완료

#혼공학습단 #혼공 #혼공분석

 

기본미션

p. 81의 확인 문제 4번 풀고 인증하기

 

01-3 이 도서가 얼마나 인기가 좋을까? 

확인문제 

4.판다스 read_csv() 함수의 매개변수 설명이 옳은 것은 무엇인가요? 3번

  1. header 매개변수의 기본값은 1로 CSV 파일의 첫 번째 행을 열 이름으로 사용합니다.
  2. names 매개변수에 행 이름을 리스트로 지정할 수 있습니다.
  3. encoding 매개변수에 CSV 파일의 인코딩 방식을 지정할 수 있습니다.
  4. dtype 매개변수를 사용하려면 모든 열의 데이터 타입을 지정해야 합니다.

 

풀이) header 매개변수의 기본값은 ‘infer’이다. names 매개변수에는 열 이름의 리스트를 지정한다. dtype 매개변수에는 필요한 열의 데이터 타입을 저정한다.

 

선택미션

p. 71 ~ 73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기

1.CSV 파일을 데이터프레임으로 읽기: read_csv() 함수

 

 

마무리

5가지 키워드로 정리하는 핵심 포인트

  1. 공개 데이터 세트 : 기업이나 정부에서 무료로 공개하는 데이터 세트, 누구나 저작권에 상관없이 데이터 분석이나 제품 개발에 활용할 수 있다.
  2. CSV : 콤마(,)로 구분된 텍스트 파일이다. 한 줄이 하나의 레코드이며, 레코드는 콤마로 구분되느 ㄴ여러 필드 혹은 열로 구성된다. 데이터가 엑셀처럼 표 형태를 가져야 하기 때문에 레코드에 있는 필드 개수는 모두 동일해야 한다
  3. 판다스 : 표 형식 데이터를 위한 편리한 도구를 다양하게 제공하는 파이썬 기반 데이터 분석 패키지이다. CSV나 엑셀 파일을 읽거나 쓸수 있으며 데이터 분석을 위한 많은 기능을 제공한다.
  4. 데이터프레임 : 판다스의 핵심 데이터 구조로 행과 열로 구성된다. CSV 파일이나 엑셀 파일로부터 데이터프레임을 만들 수 있다.
  5. 시리즈 : 1차원 배열과 흡사한 판다스의 객체이다. 시리즈는 한 종류의 데이터만 포함할 수있다.

 

표로 정리하는 핵심 함수와 메서드

 

함수/메서드 기능능
pandas.read_csv() CSV 파일을 읽어 데이터프레임을 만듭니다.
DataFrame.head() 데이터프레임에서 처음 다섯 개의 행을 반환합니다.
DataFrame.to_csv() 데이터프레임을 CSV파일로 저장합니다.

 

반응형