하나의 교육 세트 (텍스트, 텍스트, 데이터) 와 같은 기계 학습 sklearn 에서 텍스트와 데이터를 혼합하는 방법

물론 텍스트는 교육에 직접 참여할 수 없으며 모델은 데이터만 처리할 수 있습니다.

그렇다면 본문은 어떻게 훈련에 참여합니까? 먼저 분명히 말하다. 어떤 모델을 사용하시겠습니까?

전반적으로, 나는 문서를 몇 가지 특징으로 변환하여 모형 훈련에 참여하고 싶다. 주요 문제는 이 문서를 나타낼 수 있는 몇 가지 특징을 추출하는 방법이다. NLP 는 많은 것 들, 일반적인 TF-IDF, 사전 모델, 단어 가방 모델, w2v 벡터 모델을 포함 합니다. 。。 물론 LSTM/RNN 을 사용하여 피쳐를 추출하는 것을 제외하지 않습니다. 이러한 단계를 거치면 문서는 스칼라 또는 차원의 벡터가 됩니다.