첫째, 이중 언어 코퍼스 정렬 기술을 연구합니다. 국내외 학자들은 이에 대해 많은 전략과 방법을 제시했고, 이중 언어 또는 다국어 코퍼스 정렬 프로그램이나 도구 [Gale 1993] 가 많이 등장했다.
두 번째는 통계 기반 기계 번역 기술 [Brown 1990], 사례 기반 기계 번역 기술 [고나 1984] 및 이중 언어 사전 편집 기술 [Klavans 및 Tzouke] 과 같은 이중 언어 코퍼스의 다양한 응용 프로그램을 연구하는 것입니다.
셋째, 이중 언어 코퍼스의 설계, 수집, 코딩 및 관리 잘 알려진 코퍼스 인코딩 체계에는 SGML 태그 언어를 기반으로 하는 TEI 텍스트 인코딩 표준 및 CES 표준이 포함됩니다.
둘 이상의 언어를 가진 코퍼스를 나타냅니다. 병렬 코퍼스와 제어 코퍼스로 나뉜다. 병렬 코퍼스는 라이브러리에 있는 둘 이상의 텍스트가 서로의 번역이므로 번역 또는 기계 번역 연구에 사용할 수 있습니다. 코퍼스에서 두 개 이상의 언어로 된 텍스트를 비교하는 것은 번역 관계를 형성하지 않지만 영역은 동일하며 주제는 비슷합니다. 일반적으로 두 개 이상의 언어 비교에만 사용할 수 있습니다.
처음 두 가지 유형의 연구에 대해 우리나라는 이미 대량의 후속 연구를 했지만, 제 3 종 연구, 즉 이중 언어 코퍼스의 건설, 코딩 및 관리에 관한 연구, 특히 중국어에 관한 연구는 탐사 작업이 비교적 적은 것 같다.
현재 국내에서 가장 큰 언어 교류 플랫폼은 와트개원이다.