자유게시판

R 워드클라우드로 대통령 취임사 텍스트 마이닝하기 (KoNLP 설치 오류 방안)

페이지 정보

작성자 Ferdianand 작성일25-10-14 16:33 조회72회 댓글0건

본문

최근에 워드클라우드 대학교 중간고사 대체 제출과제로 R 워드클라우드를 이용한 대통령 취임사 텍스트 마이닝을 하고 당시 현안과 사회적 배경을 분석하는 문제가 나와, "R"의 설치부터 "텍스트 마이닝"까지 직접 다양한 곳에서 자료를 찾아가며 과정을 수행해보았습니다.​이 과정을 진행하면서 가장 큰 문제점은 기존에 올려놓은 자료들이 최소 1년이상 지나서, 현재 버전과 문제들을 반영하지 않는다는 점입니다. 그래서 이틀 동안 머리를 감싸고 괴로워하며 워드클라우드 많은 AI 모델들의 도움을 얻어가며, 결국엔 결과를 얻을 수 있었습니다.​여러분들의 시간을 절약하고자, 결론은..최신 버전인 R 4.4.3 절대 받지 말고 R 4.2.0 번호대의 버전을 받아야 한다는 것입니다.알고나면 아주 간단하지만, 유튜브, 다른 블로그, 교재 등을 보아도 해당 내용을 말해주지 않아서, KoNLP 설치가 되지 않았고 해결책도 찾을 수가 없었습니다. 그러던 중 xAI의 Grok이 다운그레이드 해볼 것을 워드클라우드 제안하였고 문제를 해결할 수 있었습니다.​역시, 일론머스크가 만든 회사는 다릅니다. 지금은 "chat GPT"를 구독 중인데, 가격만 쌌다면 바로 "그록"으로 갈아탔을 것입니다.​이제 본격적으로 R의 설치부터 워드클라우드를 통한 텍스트 마이닝을 해보겠습니다.​R을 검색해서 R 홈페이지로 접속합니다.​2. 그리고 왼쪽 메뉴에서 Download &gtCRAN 버튼을 눌러, 페이지를 이동합니다.​​3. 그러면 국가에 대한 URL을 선택하는 화면이 나오는데,"Korea"를 찾아서 선택해줍니다.4. 그러면 "R"을 다운로드를 워드클라우드 할 수 있는 페이지로 이동하는데요. 각자의 운영체제에 맞는 버전을 클릭해줍니다. 저는 Windows를 사용하고 있기 때문에, Download R for Windows 를 눌러줍니다.​5. 그리고 페이지가 이동하면, install R for the first time 버튼을 클릭해줍니다.6. 이제 Download R-4.4.3 for Windows를 눌르면 진짜로 R을 다운 받을 수 있습니다.※ 하지만, 아까 제가 뭐라고 말했죠?? 최신 버전 R을 받으면 워드클라우드 KoNLP 설치가 안 된다고 했었죠! ​7. 아래의 Previous releases 를 눌러서 이전 버전의 R을 받을 수 있는 페이지로 이동합니다.​8. R 4.3.0 번호대의 버전도 KoNLP 충돌이 있을 수 있다고 하여 저는 4.2.0버전을 선택하였습니다.​9. 페이지가 이동하면 R-4.2.0-win.exe 버튼을 눌러서 파일을 받아줍시다.10. 그리고 설치가 완료되면 바로가기 버튼의 속성을 눌러서 경로의 마지막에 "--sdi"를 넣어줍니다. 이렇게 하면, 각각의 워드클라우드 R창을 별도로 사용할 수 있어서 데이터를 비교하거나 여러작업을 할 때 편리합니다.​11. 이제 설치가 완료되었으니, 대통령의 취임사를 받아 줍니다. "행정안전부의 대통령기록관" 웹페이지로 이동합니다. ​12. 그리고 원하는 대통령을 클릭하고 한 후에 대통령 기록물 &gt연설기록 &gt검색 순으로 버튼을 클릭해줍니다.​13. 이제 대통령 취임사를 드래그 한 후에 메모장에 "복사/붙여넣기"하고 txt.파일로 저장해줍니다.​이제 모든 준비가 완료 되었으니, 데이터 마이닝을 시작해보겠습니다.​KoNLP, 워드클라우드 RcolorBrewer, wordcloud 를 설치해줍니다.2. 그리고 설치된 패키지들을 로딩합니다.3. 세종 사진도 로딩해 줍니다. 세종사전은 KoNLP패키지에 포함되어 있어서 KoNLP이 잘 설치되었다면, 문제없이 로딩이 됩니다.4. 텍스트에 컬러를 입힐, 팔레트를 설정해줍니다. 먼저, 팔레트의 목록을 확인하는 명령어를 입력해서 원하는 팔레트를 고릅니다.5. 저는 "RdGy"를 써보기로 결정했습니다.6. 이제, 아까 저장해두었던 텍스트를 불러옵니다. 경로를 쉽게 작성할 수 있게, 저장해두길 바랍니다.7. 명사를 워드클라우드 추출해줍니다.8. 추출된 명사들을 벡터로 통합하고 빈도수를 계산해줍니다.(도수분포표)9. 이제, 마지막으로 워드 클라우드를 출력합니다.10. 워드 클라우드에서 텍스트 마이닝이 정상적으로 완료되었습니다.※ 제가 실행한 R 화면을 추가로 보여드립니다. 중간에 오류문이 있어 다시 작성된 부분들이 있으니, 구분해서 보시기를 부탁드립니다.R에서 명령어를 잘못 입력해 오류가 발생해도, 다시 잘 입력하면 되는 경우가 많습니다. 처음 시작하는 단계에서 많이 걱정하지마시고 마음 편하게 그냥 워드클라우드 시작해보세요. 감사합니다.​

댓글목록

등록된 댓글이 없습니다.

Attention Required! | Cloudflare

Sorry, you have been blocked

You are unable to access bl-333.top

Why have I been blocked?

This website is using a security service to protect itself from online attacks. The action you just performed triggered the security solution. There are several actions that could trigger this block including submitting a certain word or phrase, a SQL command or malformed data.

What can I do to resolve this?

You can email the site owner to let them know you were blocked. Please include what you were doing when this page came up and the Cloudflare Ray ID found at the bottom of this page.

Attention Required! | Cloudflare

Sorry, you have been blocked

You are unable to access bl-666.top

Why have I been blocked?

This website is using a security service to protect itself from online attacks. The action you just performed triggered the security solution. There are several actions that could trigger this block including submitting a certain word or phrase, a SQL command or malformed data.

What can I do to resolve this?

You can email the site owner to let them know you were blocked. Please include what you were doing when this page came up and the Cloudflare Ray ID found at the bottom of this page.