본문 바로가기

Do it! 공부단

[1회차] Do it! 쉽게 배우는 R 텍스트 마이닝 / p.18~p.57 /1장 단어 빈도 분석: 무엇을 강조했을까? ,2장 형태소 분석기를 이용한 단어 빈도 분석

반응형

 

 

이책으로 처음 R을 시작하는 분이라면 1장부터 막히지 않았을까 생각합니다. 보통 1장은 R 혹은 RStudio 환경 설치인데 그부분이 생략되어 있네요. 컴퓨터를 조금만 한다면 쉽게 설치 할수 있지만 그래도 입문자를 배려 하는 부분이 조금 부족하지 않았나 생각했습니다. 1장은 단어 빈도 분석으로 텍스트 전치리, 텍스트 데이터를 토큰화하기 그리고 단어 빈도 분석하기를 배우고 워드 클라우드 만들기를 실습하면서 텍스트 마이닝의 기초를 배웠습니다. 2장에서는 형태소 분석기를 이용한 단어 빈도 분석을 합니다. 이번 장에서는 KoNLP 패키지를 이용하여 텍스트를 토큰화해서 추출합니다. 1장에서는 단순한 분석결과를 했다면 이번장에서는 글쓴이가 무엇을 강조했는지 단어 빈도를 알수 있습니다. 1장과 2장의 소스는 같지만 형태소에 따라서 워드 클라우드의 결과가 다르게 나왔습니다. 그리고 RStudio 실행할때 관리자 권한으로 실행해야 패키지가 제대로 설치 됩니다.



 

 

반응형