Разработаны правила формирования и ведения Национального корпуса казахского языка

7 марта 2025 г. 16:59
Эльмира Караева
фото: Фото: из открытых источников

Министерство науки и высшего образования подготовило проект Правил формирования и ведения Национального корпуса казахского языка, сообщает prosud.kz.

Читать на сайте prosud.kz

Правила устанавливают общие требования и процедуры для создания, пополнения, обработки, хранения и использования Национального корпуса казахского языка (Корпус), который служит основой для научных, образовательных и практических исследований в области казахского языка и лингвистики.

Корпус непрерывно обновляется за счет добавления новых материалов, отражающих изменения в языке и актуальные достижения в различных областях, также расширяется с учётом изменений в языке, новых тенденций, а также появления новых жанров, стилей и направлений, что гарантирует его актуальность и соответствие языковым инновациям.

Администратор Корпуса — Министерство науки и высшего образования РК. Работу по координации Корпуса осуществляет Институт языкознания имени А. Байтурсынова (Институт).

Все работы, связанные с формированием, ведением и использованием Корпуса, проводятся в рамках единого национального подхода с обеспечением высокого уровня качества, безопасности и доступности данных.

Формирование Корпуса начинается с тщательного сбора и отбора текстов, представляющих все аспекты его функционирования — от письменных источников до устных материалов, которые отражают особенности языка, используемый в различных сферах и временных срезах.

Все материалы Корпуса соответствуют научным стандартам качества, имеют метаданные и источниковедческую информацию, проходят проверку на грамматические и орфографические ошибки, а также редактируются и упорядочиваются в соответствии с единой системой кодирования и классификации.

Корпус отражает разнообразие языковых практик, включая различные жанры, типы текстов, диалекты и стили, а также учитывает региональные и исторические особенности, — говорится в проекте.

При этом все собранные тексты систематизируются и аннотируются по жанру, стилю, времени, источнику, по лексическим и грамматическим уровням.

Правилами определены следующие функции Корпуса:

Корпус имеет следующую структуру:

Для повышения качества и актуальности базы данных обеспечивается взаимодействие с международными научными и лингвистическими организациями.

В корпус могут быть включены материалы из открытых и доступных источников, если их использование не нарушает авторские права и соответствует нормам добросовестного использования.

При ведении Корпуса учитываются этические принципы, включая исключение дискриминационного контента и обеспечение инклюзивности, — говорится в документе. 

Ожидается, что Корпус будет общедоступным и будет служить основой для разработки лексикографических и грамматических проектов, научных и образовательных материалов, а также для создания программных продуктов.

Правила разработаны в целях реализации закона «О внесении изменений и дополнений в некоторые законодательные акты Республики Казахстан по вопросам культуры, образования и наставничества».

Разработчики утверждают, что принятие проекта приказа не повлечет предполагаемых социально-экономических, правовых или иных последствий и не повлияет на обеспечение национальной безопасности. Финансовых затрат из республиканского бюджета также не потребуется.

Проект находится на публичном обсуждении на портале «Открытые НПА» до 28 марта.

Мы сообщали, что нейросети задействуют в создании Национального словарного фонда казахского языка.

Также мы рассказывали, что Министерству науки поручат разработку профстандарта по языковой политике.

Законодательство Казахстан Обзор НПА МНВО РК