NLP1


  1. 요구사항

[ 과제: NLP 제대로 맛보기 ]

  • Step1. 데이터 확인 (어떤 식으로 분석을 할 것인지 파악하고 들어가는게 좋겠죠?)

  • Step2. Tokenizing (불용어 처리, 특수 문자 제거 등의 전처리)

  • Step3. 임베딩 (One-hot encoding, CBOW, Skip-gram, GloVe, FastText 등)

  • Step4. 유의미한 해석 도출 (유사도, 그래프 해석, Wordcloud, 이진 분류 모델 등)


[ 주의사항 ]

  • 임베딩 모델을 2개 이상 적용해본 후, 해석 결과에 따라 가장 좋은 모델을 선택해주세요. (ex) CBOW, Skip-gram, GloVe, FastText 등)

  • 유의미한 해석을 도출하는 것이 핵심입니다. 워드클라우드, 유사도, 이진분류모델 등을 활 용하여 세 가지 이상의 인사이트를 도출해주세요.

(ex) 그래프 하나 보여주고 한 문장으로 인사이트 끝? – BYE BYE)

  • 이론적 궁금증 해결이나 참고를 위한 구글링은 OK, but 데이터 및 인사이트 그대로? NO!

  • 토크나이저 및 임베딩 모델 선택 과정이나 인사이트 해석은 주석으로 설명 부탁드립니다.


[ 우수과제 선정 기준]

  • 토크나이저 및 임베딩을 선정한 판단 근거가 명확한가 (파라미터 포함)

  • NLP에 대해 스스로 공부하고 고민한 흔적이 보이는가

  • 인사이트의 창의성

  • 전처리를 얼마나 꼼꼼히 진행하였는가

  • 주석이 가득한 정성이 담긴 과제

2. 우수 과제 선정 이유

  • 사전에 제시한 과제 요구사항을 기대한 이상으로 충족해주셨습니다.

  • 구체적인 주석을 작성해주신 점과 인사이트를 제시하기까지 근거에 기반해 과정을 전개해주셨습니다.


3. 제출 과제 (14기 정세영님)