반응형
chapter01 기본미션+선택미션 완료
#혼공학습단 #혼공 #혼공분석
기본미션
p. 81의 확인 문제 4번 풀고 인증하기
01-3 이 도서가 얼마나 인기가 좋을까?
확인문제
4.판다스 read_csv() 함수의 매개변수 설명이 옳은 것은 무엇인가요? 3번
- header 매개변수의 기본값은 1로 CSV 파일의 첫 번째 행을 열 이름으로 사용합니다.
- names 매개변수에 행 이름을 리스트로 지정할 수 있습니다.
- encoding 매개변수에 CSV 파일의 인코딩 방식을 지정할 수 있습니다.
- dtype 매개변수를 사용하려면 모든 열의 데이터 타입을 지정해야 합니다.
풀이) header 매개변수의 기본값은 ‘infer’이다. names 매개변수에는 열 이름의 리스트를 지정한다. dtype 매개변수에는 필요한 열의 데이터 타입을 저정한다.
선택미션
p. 71 ~ 73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기
1.CSV 파일을 데이터프레임으로 읽기: read_csv() 함수
마무리
5가지 키워드로 정리하는 핵심 포인트
- 공개 데이터 세트 : 기업이나 정부에서 무료로 공개하는 데이터 세트, 누구나 저작권에 상관없이 데이터 분석이나 제품 개발에 활용할 수 있다.
- CSV : 콤마(,)로 구분된 텍스트 파일이다. 한 줄이 하나의 레코드이며, 레코드는 콤마로 구분되느 ㄴ여러 필드 혹은 열로 구성된다. 데이터가 엑셀처럼 표 형태를 가져야 하기 때문에 레코드에 있는 필드 개수는 모두 동일해야 한다
- 판다스 : 표 형식 데이터를 위한 편리한 도구를 다양하게 제공하는 파이썬 기반 데이터 분석 패키지이다. CSV나 엑셀 파일을 읽거나 쓸수 있으며 데이터 분석을 위한 많은 기능을 제공한다.
- 데이터프레임 : 판다스의 핵심 데이터 구조로 행과 열로 구성된다. CSV 파일이나 엑셀 파일로부터 데이터프레임을 만들 수 있다.
- 시리즈 : 1차원 배열과 흡사한 판다스의 객체이다. 시리즈는 한 종류의 데이터만 포함할 수있다.
표로 정리하는 핵심 함수와 메서드
함수/메서드 | 기능능 |
pandas.read_csv() | CSV 파일을 읽어 데이터프레임을 만듭니다. |
DataFrame.head() | 데이터프레임에서 처음 다섯 개의 행을 반환합니다. |
DataFrame.to_csv() | 데이터프레임을 CSV파일로 저장합니다. |
반응형
'혼공단 > 혼공분석10기' 카테고리의 다른 글
혼공학습단 10기 혼공분석 6주차 chapter06 기본미션+선택미션 완료 (0) | 2023.08.14 |
---|---|
혼공학습단 10기 혼공분석 5주차 chapter05 기본미션+선택미션 완료 (0) | 2023.08.10 |
혼공학습단 10기 혼공분석 4주차 (0) | 2023.07.25 |
혼공학습단 10기 혼공분석 3주차 (0) | 2023.07.18 |
혼공학습단 10기 혼공분석 2주차 (0) | 2023.07.16 |