r wordcloud 예제

다음 예제에서는 “마틴 루터 킹”에서 “꿈의 연설”을 처리하지만 원하는 텍스트를 사용하여 워드 클라우드및 Wordcloud2를 만들 수 있습니다. 아래에서 워드클라우드 사용률의 예를 찾을 수 있습니다. 또 다른 중요한 전처리 단계는 단어를 루트 형식으로 줄이는 텍스트 형태소 분석입니다. 즉, 이 프로세스는 단어에서 접미사를 제거하여 간단하게 만들고 공통의 출처를 얻습니다. 예를 들어 형태소 분석 프로세스는 “이동”, “이동”, “이동”이라는 단어를 루트 단어인 “move”로 줄입니다. rquery.wordcloud() 함수의 형식은 다음과 같습니다 : 세 번째 예로 짐의 의견 덕분에, 나는 뉴욕 타임즈에 사용자 생성 콘텐츠에 액세스하고 기사에 `오늘`코멘트의 워드 클라우드를 생성던컨 템플 랭의 RNYTimes 패키지를 활용합니다. 주의 사항 : RNYTimes 패키지를 사용하려면 여기에서 뉴욕 타임즈 개발자 네트워크 (무료)에 등록하여 얻을 수있는 뉴욕 타임즈의 API 키가 필요합니다. TM, SnowballC 및 워드 클라우드의 세 가지 패키지가 필요합니다. 단어 구름을 만들려면 이전 게시물에 설명된 5개 이상의 기본 텍스트 마이닝 단계가 필요합니다. 다음 섹션에서 설명하는 rquery.wordcloud() 함수를 사용하여 한 줄의 R 코드로 모든 단계는 수행할 수 있습니다. 다음 패키지는 rquery.wordcloud() 함수에 필요합니다 : 위에서 언급했듯이 rquery.wordcloud()의 결과는 두 개체를 포함하는 목록입니다: 변환은 tm_map() 함수를 사용하여 특수 문자를 대체합니다.

텍스트에서. 다음과 같이 용어 문서 행렬에서 자주 용어를 살펴볼 수 있습니다. 아래 예제에서는 적어도 네 번 발생하는 단어를 찾으려고 합니다. 이것은 모든 단어가 줄기로 변환된다는 것을 의미합니다 (예 : 학습 -> 학습, 걷기 -> 걷기 등). 이렇게 하면 다른 형태의 단어가 동일한 형식으로 변환되고 워드클라우드에서 한 번만 플롯됩니다. 열기 RStudio.You는 패키지 “TM”과 “워드 클라우드”를 설치해야합니다. 다음으로 빠른 시각화를 사용하여 텍스트에서 가장 일반적으로 인용되는 단어를 강조 표시해야 할 때 R A 워드 클라우드(또는 태그 클라우드)에 패키지를 로드해야 하는 편리한 도구가 될 수 있습니다. 물론, 당신은 워드 또는 tagxedo와 같은 여러 온라인 서비스 중 하나를 사용할 수 있습니다, 매우 풍부한 좋은 GUI와 기능. R 매니아이기 때문에, 나는 항상 R 내에서 이러한 종류의 이미지를 생산하고 싶었고, 최근에 출시 된 이안 펠로우의 워드 클라우드 패키지 덕분에 마침내 할 수 있습니다! 패키지를 테스트하기 위해 나는 내 RXKCD 패키지에 포함 된 XKCD 웹 만화의 제목을 검색하고 텍스트 마이닝에 대한 강력한 TM 패키지를 사용하여 계산 된 제목의 단어 주파수에 따라 단어 클라우드를 생산 (나는 알고있다, 그것은 바주카와 함께 비행을 죽이는 것과 같다!) .

일반 텍스트 파일은 좋아하는 텍스트 편집기 (예 : Word)를 사용하여 쉽게 만들 수 있습니다. “나는 꿈의 연설을 가지고”(마틴 루터 킹에서) 다음 예에서 처리하지만 당신은 당신이 원하는 텍스트를 사용할 수 있습니다 : 아래의 예에서, 나는 STHDA 웹 사이트에 호스팅 .txt 파일을로드합니다 : 단어 구름을 만드는 절차는 R에서 매우 간단합니다 당신이 차이를 알고있는 경우 t 단계를 실행합니다. 텍스트 마이닝 패키지(tm) 및 워드 클라우드 생성기 패키지(wordcloud)는 텍스트를 분석하고 키워드를 단어 클라우드로 빠르게 시각화하는 데 도움이 되는 R에서 사용할 수 있습니다. 두 번째 예로, eKonometrics 블로그에서이 게시물에서 영감을, 나는 http://cran.r-project.org/web/packages 나열 된 3177 사용 가능한 R 패키지의 설명에서 단어 클라우드를 만들었습니다. 워드 클라우드 (modi_data, scale=c (5,0.5), max.words=1, random.order=FALSE, rot.per=0.35, use.r.layout=0.35, use.r.layout=FALSE, 색상=brewer.pal (8, “Dark2”)) 텍스트 형태소 분석은 패키지 `SnowballC`가 필요합니다.

Posted in Uncategorized