NLP1
- 요구사항
[ 과제: NLP 제대로 맛보기 ]
Step1. 데이터 확인 (어떤 식으로 분석을 할 것인지 파악하고 들어가는게 좋겠죠?)
Step2. Tokenizing (불용어 처리, 특수 문자 제거 등의 전처리)
Step3. 임베딩 (One-hot encoding, CBOW, Skip-gram, GloVe, FastText 등)
Step4. 유의미한 해석 도출 (유사도, 그래프 해석, Wordcloud, 이진 분류 모델 등)
[ 주의사항 ]
임베딩 모델을 2개 이상 적용해본 후, 해석 결과에 따라 가장 좋은 모델을 선택해주세요. (ex) CBOW, Skip-gram, GloVe, FastText 등)
유의미한 해석을 도출하는 것이 핵심입니다. 워드클라우드, 유사도, 이진분류모델 등을 활 용하여 세 가지 이상의 인사이트를 도출해주세요.
(ex) 그래프 하나 보여주고 한 문장으로 인사이트 끝? – BYE BYE)
이론적 궁금증 해결이나 참고를 위한 구글링은 OK, but 데이터 및 인사이트 그대로? NO!
토크나이저 및 임베딩 모델 선택 과정이나 인사이트 해석은 주석으로 설명 부탁드립니다.
[ 우수과제 선정 기준]
토크나이저 및 임베딩을 선정한 판단 근거가 명확한가 (파라미터 포함)
NLP에 대해 스스로 공부하고 고민한 흔적이 보이는가
인사이트의 창의성
전처리를 얼마나 꼼꼼히 진행하였는가
주석이 가득한 정성이 담긴 과제
2. 우수 과제 선정 이유
사전에 제시한 과제 요구사항을 기대한 이상으로 충족해주셨습니다.
구체적인 주석을 작성해주신 점과 인사이트를 제시하기까지 근거에 기반해 과정을 전개해주셨습니다.