그렇다면 본문은 어떻게 훈련에 참여합니까? 먼저 분명히 말하다. 어떤 모델을 사용하시겠습니까?
전반적으로, 나는 문서를 몇 가지 특징으로 변환하여 모형 훈련에 참여하고 싶다. 주요 문제는 이 문서를 나타낼 수 있는 몇 가지 특징을 추출하는 방법이다. NLP 는 많은 것 들, 일반적인 TF-IDF, 사전 모델, 단어 가방 모델, w2v 벡터 모델을 포함 합니다. 。 。 물론 LSTM/RNN 을 사용하여 피쳐를 추출하는 것을 제외하지 않습니다. 이러한 단계를 거치면 문서는 스칼라 또는 차원의 벡터가 됩니다.