Kaggle의 데이터를 활용하여 한글 데이터 분석
- EDA
- Wordcloud
- konlpy & Gensim.FastText로 토큰화
- SVM으로 카테고리 Classification (분류), KNN으로 카테고리 예측
- HuggingFace의 Pre-Trained Model RoBERTa by KLUE 이용한 Classification.
- Topic Modeling으로 Unsupervised aspect에서 장르 클러스터링
| Name | Name | Last commit date | ||
|---|---|---|---|---|