단어 가방 모델 (BoW 모델) 은 자연어 처리 및 정보 검색 분야에서 처음 등장했습니다. 이 모델은 텍스트의 구문과 어순을 무시하고 여러 단어의 모음으로 간주하며 문서의 각 단어는 독립적으로 나타납니다. BoW 는 무질서한 단어 세트를 사용하여 텍스트 또는 문서를 나타냅니다. 최근 몇 년 동안 BoW 모델은 컴퓨터 시각에서 광범위하게 응용되었다. 이미지의 특징은 텍스트에 적용된 BoW 에 비해 단어로 간주됩니다.
텍스트 기반 BoW 모델의 간단한 예는 다음과 같습니다.
먼저 다음 두 가지 간단한 텍스트 문서가 제공됩니다.
존은 영화 보는 것을 좋아한다. 메리도 좋아해요.
존도 축구 경기를 보는 것을 좋아한다.
위의 두 문서에 나타나는 단어를 기반으로 사전은 다음과 같이 구성됩니다.
{"존": 1, "좋아": 2, "예": 3, "보기": 4, "영화": 5, "도": 6, "
위 사전에는 10 단어가 포함되어 있으며 각 단어마다 고유한 색인이 있으므로 각 텍스트는 10 차원의 벡터로 나타낼 수 있습니다. 다음과 같습니다.
[1,2,1,1,1,0,0,0,/kloc-0
[1,1,1,1,0,1,/kloc-;
이 벡터는 원문의 어순과는 무관하지만, 사전의 각 단어가 글에서 나타나는 빈도이다. 따라서 아치형 모델은 통계 히스토그램으로 간주될 수 있습니다.