ПРОБЛЕМА РЕПРЕЗЕНТАТИВНОСТИ ТЕКСТОВ ДЛЯ ЭЛЕКТРОННОГО КОРПУСА УЗБЕКСКОГО ЯЗЫКА
Main Article Content
Abstract
This article is devoted to the issue of text representation for the Uzbek language electronic corpus (http://uzbekcorpus.uz). Factors such as the statistical method, size, quantity of text selection for the corpus are one of the important criteria of the corpus design. According to this, the representativeness of the text is different for oral and written texts. Graphics of written texts, standardization requirements, adaptation of text elements for the accuracy and convenient of use of computer analysis, as well as transliteration of audio texts and assignment of segment units to the corpus manager in the appropriate order are the basis of text representativeness.
Article Details
References
Карпович С.Н. Русскоязычный корпус текстов sctm-ru для построения тематических моделей / Труды СПИИРАН. 2015. Вып. 2(39). ISSN 2078-9181 (печ.), ISSN 2078-9599 (онлайн) www.proceedings.spiiras.nw.ru,
Мелконян Э. Соотношение корпусной лингвистики и типологии / Proceedings of the international conference «CORPUS LINGUISTICS–2019»
Карпович С.Н. Русскоязычный корпус текстов SCTM-RU для построения тематических моделей труды СПИИРАН. 2015. Вып. 2(39). ISSN 2078-9181 (печ.), ISSN 2078-9599 (онлайн) www.proceedings.spiiras.nw.ru,
Захаров В.П., Азарова И.В. и др. Моделирование в корпусной лингвистике: Специализированные корпусы русского языка, ИЗДАТЕЛЬСТВО САНКТ-ПЕТЕРБУРГСКОГО университета, 2019.
Kurs “Korpusnaya lingvistika”/ Kutuzov A.B. / Litsenziya Creative commons Attribution Share-Alike 3.0 Unported. - http://www. ruscorpora.ru.
Sharov S.A. Predstavitelniy korpus russkogo yazika v kontekste mirovogo opita. - https//lamb.viniti.ru.
Захаров В.П., Азарова И.В. и др. Моделирование в корпусной лингвистике: Специализированные корпусы русского языка, ИЗДАТЕЛЬСТВО САНКТ-ПЕТЕРБУРГСКОГО университета, 2019.
Захаров В.П., Азарова И.В. и др. Моделирование в корпусной лингвистике: Специализированные корпусы русского языка, ИЗДАТЕЛЬСТВО САНКТ-ПЕТЕРБУРГСКОГО университета, 2019.