Download PDFOpen PDF in browser
EN
The title and the abstract of this preprint are also available in English

Машинное Обучение Для Синтаксического И Морфологического Анализа Текста На Казахском Языке

EasyChair Preprint no. 8101

14 pagesDate: May 28, 2022

Abstract

В статье описывается возможность анализа текстов на казахском языке при помощи машинного обучения. Машинное обучение используется при распознании машинного и рукописного текста, речи и изображений. В связи с проблемой определения смысла слов, применяется синтаксический и морфологический анализ текста, которые имеют взаимосвязь и позволяют разделить текст на токены, образуются словоформы. Реализация задачи осложняется большим числом альтернативных вариантов, возникающих в процессе разбора, связанных как с многозначностью входных данных (одна и та же словоформа может быть получена от разных типичных форм), так и неоднозначностью самих правил разбора. Работа проводится с целью расширения задач и возможностей использования, связанных с текстом: улучшение перевода с казахского языка на другие, в том числе на язык жестов.

Keyphrases: Artificial Intelligence, lemmatization, machine learning, Tokenization

BibTeX entry
BibTeX does not have the right entry for preprints. This is a hack for producing the correct reference:
@Booklet{EasyChair:8101,
  author = {Saule Kudubayeva and Botagoz Zhusupova and Meruyert Salkenova},
  title = {Машинное Обучение Для Синтаксического И Морфологического Анализа Текста На Казахском Языке},
  howpublished = {EasyChair Preprint no. 8101},

  year = {EasyChair, 2022}}
Download PDFOpen PDF in browser