Новости

Модель обучения казахскому языку на основе ИИ создана в РК

Редакция

18.01.2025

Модель способна выполнять задачи в таких областях казахского языка, как лексика, морфология, семантика и других

Национальный научно-практический центр «Тіл-Қазына» при комитете языковой политики министерства науки и высшего образования представил первые результаты модели обучения казахскому языку «Tilqazyna». Модель создана на основе на основе искусственного интеллекта и способна выполнять задачи в таких областях казахского языка, как лексика, морфология, семантика и других, сообщает корреспондент Check-point.kz

В частности, она может генерировать текст на казахском языке, создавать перифразы, работать с контекстом, сокращать тексты, исправлять грамматические и пунктуационные ошибки, раскрывать значения фразеологизмов, а также переводить термины.

Эта отраслевая LLM модель уже загружена на платформу Hugging Face и доступна всем пользователям. Использование данной модели позволит разрабатывать множество IT-продуктов на казахском языке с помощью искусственного интеллекта. Это соответствует задачам, изложенным в Послании президента Касым-Жомарта Токаева, где подчеркивалась важность превращения Казахстана в страну, широко использующую искусственный интеллект и развивающую цифровые технологии.

При разработке модели эксперты центра «Тіл-Қазына» применяли алгоритмы обработки естественного языка и целенаправленно анализировали большие объемы данных. В частности:

  • для проверки слов использовались 684 876 лексических единиц;
  • для улучшения системы проверки словосочетаний было использовано 20 212 правильных и ошибочных вариантов;
  • для исправления пунктуационных ошибок проанализировано 5 558 текстов;
  • для коррекции структуры текста было подготовлено 3 000 правильных и неправильных версий текстов;
  • для функции сокращения предложений создана база из 6 000 полных и сокращенных предложений;
  • для функции перифраза собрано 14 790 синонимических рядов;
  • общий объем обработанного корпуса казахского языка составил 35 ГБ.

В этом году в модель будет добавлена функция голосового общения, а также разработан удобный интерфейс для пользователей. Кроме того, проект будет способен обучать казахскому языку на уровнях A1, A2 и B1, а к 2026 году – на уровнях B2 и C1.

Конечным результатом проекта станет голосовой помощник, способный создавать индивидуальную программу обучения казахскому языку в зависимости от уровня знания языка пользователя. Он будет представлен в виде мобильного приложения для систем IOS и Android.

Фото из открытых источников


Редакция

Публикации автора

В свет вышла аудиоверсия книги Касым-Жомарта Токаева

Увеличились размеры пособий на рождение в РК

КНБ и МВД провели спецоперацию в десяти регионах РК

Реестр казахстанских производителей появится в 2025 году

Более 20 млн тенге перевела жительница Костаная мошенникам

Тестирование на добропорядочность введут в Казахстане

Топ-тема

Другие темы

НОВОСТИ | 22.01.2025

В свет вышла аудиоверсия книги Касым-Жомарта Токаева

НОВОСТИ | 22.01.2025

Увеличились размеры пособий на рождение в РК

НОВОСТИ | 22.01.2025

КНБ и МВД провели спецоперацию в десяти регионах РК

НОВОСТИ | 22.01.2025

Реестр казахстанских производителей появится в 2025 году

НОВОСТИ | 22.01.2025

Более 20 млн тенге перевела жительница Костаная мошенникам

НОВОСТИ | 22.01.2025

Тестирование на добропорядочность введут в Казахстане