본문 바로가기

혼공단/혼공R이9기

[혼공학습단 9기] 혼공R이 4주차 chapter04 p.169의 iris 내장 데이터 세트의 데이터 구조 출력하고 인증하기

반응형

혼공학습단 9기 혼공R이 4주차 

chapter04 기본미션+선택미션 완료

#혼공학습단9기 #혼공학습단 #혼공 #혼공R이 

 

기본미션

p. 169의 iris 내장 데이터 세트의 데이터 구조 출력하고 인증하기

 

1.내장 데이터 세트 가져와서 데이터 세트 확인하기

 

2.데이터구조 확인하기

5가지 핵심 포인트

  • 데이터 구조를 한눈에 확인하거나 데이터 일부 값을 확인하는 것을 데이터 요약이라고 한다.
  • 기술통계량은 데이터를 요약한 대푯값이다. 데이터를 의미 있는 수치로 요약하여 데이터 특성을 파악할 수 있다.
  • 평균은 데이터를 모두 더한 후 개수로 나눈 값이며, 중앙값은 데이터를 크기 순으로 정렬했을 때 가운데에 있는 값을 말한다.
  • 분산은 데이터가 평균으로부터 퍼진 정도를 설명하는 통계량이며, 표준편차는 데이터 값이 퍼진 정도를 설명하는 통계량이다.



선택미션

p. 191 상자 그림 그래프의 각 요약 값 정리하기

 

 

5가지 핵심 포인트

  • 막대 그래프는 범주형 데이터의 수량이 많고 적음을 나타낼 때 적합한 그래프이다.
  • 데이터 분포에서 벗어난 극단의 데이터를 판단할 때 상자 그림을 사용한다.
  • 히스토그램은 연속형 데이터를 일정하게 구간을 나누어 각 구간에 해당하는 데이터를 그린 그래프이다.
  • 파이차트는 원을 데이터 범주 구성 비례에 따라 파이 조각 모양처럼 표현한 그래프이다.
  • 줄기 잎 그림은 변수 값을 자릿수로 분류하여 시각화한 그래프로 데이터 전체 형태를 파악할 수 있다.

 

 

반응형