Как формируют Национальный словарный фонд казахского языка: утверждены правила

13.05.2025
Автор материала: Эльмира Караева
Словарь казахского языка Фото: pixabay
Читайте нас в:

Министр науки и высшего образования РК приказом от 30 апреля 2025 года утвердил Правила формирования и ведения Национального словарного фонда казахского языка, сообщает prosud.kz.

Целями формирования Национального словарного фонда являются сохранение, защита и развитие казахского языка как культурной ценности, а также укрепление статуса государственного языка, накопление ресурсов, охватывающих все сферы применения казахского языка, упорядочение, цифровизация, генерация действующего лексического состава языка, адаптация его к искусственному интеллекту и современным технологиям, автоматизация процессов обработки, – говорится в документе.

Правилами определены следующие понятия:

  • генерация - процесс автоматического создания нового контента (текста, изображения, звука) на основе данных и заранее установленных правил;
  • модели искусственного интеллекта - процесс внедрения технологий и алгоритмов искусственного интеллекта для обработки данных на казахском языке в различные системы, приложения или платформы;
  • обработка естественного языка - технология машинного обучения, которая дает компьютерам возможность понимать, интерпретировать и обрабатывать человеческий язык.

Формирование и ведение Национального словарного фонда осуществляется юридическим лицом, определенным уполномоченным органом в области развития языков.

Национальный словарный фонд формируется на основании академических и переводческих словарей, Национального корпуса казахского языка, терминологической базы и датасета, который является совокупностью данных различных форматов.

Основными задачами формирования Национального словарного фонда являются:

  • формирование совокупности словарей, позволяющих получить пользователям комплексные сведения о словах;
  • обеспечение размещения, обновления и распространения информации о норме казахского литературного языка;
  • предоставление пользователям возможности пользоваться электронными версиями верифицированных словарей различного типа;
  • предоставление пользователям информации о динамике развития нормы казахского литературного языка.

Формирование Национального словарного фонда включает:

  • разработку поэтапного плана мероприятий по вопросам создания и развития Национального словарного фонда;
  • утверждение функциональных и технических требований к Национальному словарному фонду, графика оказания технических услуг и технических спецификаций информационной системы, предназначенной для сбора, обработки и систематизации данных;
  • обеспечение интерактивного пользовательского интерфейса, поисковой системы и возможности экспорта данных;
  • координацию действий субъектов в области создания и совершенствования Национального словарного фонда;
  • формирование списка информационных ресурсов, способных к интеграции с Национальным словарным фондом;
  • использование платформ открытых данных и обеспечение соответствия государственным стандартам в области информационных технологий и информационной безопасности.

В основе заложены следующие принципы:

  • научная обоснованность, необходимость опираться на научные исследования и фактические данные всех лексических единиц в области общественно-гуманитарных и естественно-математических наук;
  • систематичность, необходимость полного и дальнейшего совершенствования как уникальной системы;
  • обеспечение соблюдения нормы литературного языка;
  • сочетание традиций и новаторства, необходимость гармоничной адаптации и введения новых слов и терминов в соответствии с нормой лексики казахского языка и требованиями современности;
  • доступность и инклюзивность всех данных для пользователей языковых ресурсов.

При этом формирование Национального словарного фонда осуществляется с учетом публичного обсуждения предложений, касающихся создания и совершенствования данного фонда. Публичное обсуждение проводится через открытые онлайн-платформы или публичные мероприятия с возможностью внесения предложений и комментариев от всех заинтересованных сторон.

К формированию и совершенствованию Национального словарного фонда привлекаются независимые эксперты в области общественно-гуманитарных и естественно-математических наук.

Ведение Национального словарного фонда включает:

  • разработку базы словарей, включающих значение, этимологию и модели общего употребления слов;
  • создание централизованной системы языковых корпусов;
  • совершенствование терминологической базы казахского языка;
  • разработку технических требований для сбора датасетов, включающих все сферы применения казахского языка;
  • предоставление доступной платформы для научных исследований;
  • интеграцию моделей искусственного интеллекта, современных технологий на казахском языке;
  • разработку интерактивной поисковой системы;
  • осуществление сбора, обработки, хранения базы данных, вносимых в информационную систему;
  • наличие общедоступной информации в открытом пространстве Интернета;
  • информационный обмен данными между субъектами информационной системы;
  • предоставление текстовых материалов в цифровом формате;
  • обеспечение надежными и высокопроизводительными серверными программами;
  • создание реляционных и семантических связей языковых данных;
  • соблюдение мер информационной безопасности;
  • проведение работы по обновлению и совершенствованию информационной системы;
  • принятие мер по актуализации Национального словарного фонда по его тестированию и апробации;
  • разработку руководства для самостоятельного обучения информационной системы для пользователей;
  • обеспечение деятельности по сортировке и экспертизе слов, терминов и словосочетаний, соответствующих языковой норме, включаемых в Национальный словарный фонд;
  • координацию деятельности коллегиальных действий, осуществляемых вне системы по Национальному словарному фонду.

 Приказ вводится в действие с 23 мая.