Это устаревшая версия, которая была опубликована 2022-06-27. Прочтите самую последнюю версию.

Постредактирование для казахского языка

Post-editing for the kazakh language

Авторы

  • Aliya Zhunussova Kaznu

Аннотация

Современный мир и наше ближайшее будущее зависят от прикладных интеллектуальных систем, так как новые технологии развиваются каждый день. Одной из задач интеллектуальных систем является машинный (автоматизированный) перевод с одного естественного языка на другой. Машинный перевод (МП) позволяет людям общаться вне зависимости от языковых различий, так как снимает языковой барьер и открывает новые языки для общения. Машинный перевод — это новая технология, особая ступень в развитии человечества. Этот вид перевода может помочь, когда вам нужно быстро понять, что ваш собеседник написал или сказал в письме.

Работа онлайн-переводчиков используется для перевода на казахский язык и наоборот. Выявляются ошибки перевода, приводятся общие преимущества и недостатки онлайн-систем машинного перевода на казахский язык. Представлена ​​модель разработки системы постредактирования машинного перевода для казахского языка.

OpenNMT (Open Neural Machine Translation) — это система с открытым исходным кодом для нейронного машинного перевода и обучения нейронных последовательностей. Для изучения языков в OpenNMT нужны параллельные корпуса для языковых пар. Преимущество OpenNMT в том, что его можно применять ко всем языкам и обрабатывать большие корпуса. Экспериментальные данные были получены для англо-казахской языковой пары. Прикладные интеллектуальные системы играют важную роль в современном мире. Одной из их задач является машинного перевода (МП)  перевод с одного языка на другой. МТ позволяет людям свободно общаться, несмотря на языковые барьеры. Эта новая технология — особый шаг, помогающий понять, что собеседник говорит или пишет вам. Автоматическое постредактирование — это задача исправления ошибок, возникших в текстах в результате машинного перевода. Так как МП не всегда может дать желаемый результат, возникает необходимость редактирования перевода. Недостатки перевода приходится устранять постредактированием. Эта потребность в постредактировании во многом определяется качеством машинного перевода: некачественный перевод оставляет много места для постредактирования, а качественный и человеческий перевод требует минимального редактирования текста. В данной работе описывается разработка легкого модуля постредактирования для англо-казахских языковых пар. Модель нейронной сети обучается на парах mt, pe и триплетах src, mt, pe с использованием фреймворка OpenNMT. Затем сравниваются результаты метрик BLEU mt - pe и mt - ape и делается вывод о качестве постредактирования.

Скачивания

Данные скачивания пока недоступны.

Опубликован

2022-06-27

Версии

Как цитировать

Zhunussova, A. (2022). Постредактирование для казахского языка: Post-editing for the kazakh language. ADVANCED TECHNOLOGIES AND COMPUTER SCIENCE, (1). извлечено от http://89.250.84.92/index.php/atcs/article/view/75

Выпуск

Раздел

Технологии искусственного интеллекта