코퍼스와 언어 자료는 사전을 편찬하고 언어 연구를 하는 기초이다. 일반적으로 통계 자연어 처리에서는 대규모 언어 인스턴스를 관찰할 수 없다.
사람들은 단순히 텍스트를 대체물로, 텍스트의 문맥을 현실 세계의 문맥의 대안으로 삼을 뿐이다. 우리는 텍스트 컬렉션을 코퍼스라고 부르는데, 이런 텍스트 모음이 몇 개 있을 때 이를 코퍼스라고 부른다.
코퍼스와 언어 자료는 사전을 편찬하고 언어 연구를 하는 기초이다. 일반적으로 통계 자연어 처리에서는 대규모 언어 인스턴스를 관찰할 수 없다.
사람들은 단순히 텍스트를 대체물로, 텍스트의 문맥을 현실 세계의 문맥의 대안으로 삼을 뿐이다. 우리는 텍스트 컬렉션을 코퍼스라고 부르는데, 이런 텍스트 모음이 몇 개 있을 때 이를 코퍼스라고 부른다.