Постредактирование для казахского языка
Post-editing for the kazakh language
Аннотация
Современный мир и наше ближайшее будущее зависят от прикладных интеллектуальных систем, так как новые технологии развиваются каждый день. Одной из задач интеллектуальных систем является машинный (автоматизированный) перевод с одного естественного языка на другой. Машинный перевод (МП) позволяет людям общаться вне зависимости от языковых различий, так как снимает языковой барьер и открывает новые языки для общения. Машинный перевод — это новая технология, особая ступень в развитии человечества. Этот вид перевода может помочь, когда вам нужно быстро понять, что ваш собеседник написал или сказал в письме.
Работа онлайн-переводчиков используется для перевода на казахский язык и наоборот. Выявляются ошибки перевода, приводятся общие преимущества и недостатки онлайн-систем машинного перевода на казахский язык. Представлена модель разработки системы постредактирования машинного перевода для казахского языка.
OpenNMT (Open Neural Machine Translation) — это система с открытым исходным кодом для нейронного машинного перевода и обучения нейронных последовательностей. Для изучения языков в OpenNMT нужны параллельные корпуса для языковых пар. Преимущество OpenNMT в том, что его можно применять ко всем языкам и обрабатывать большие корпуса. Экспериментальные данные были получены для англо-казахской языковой пары. Прикладные интеллектуальные системы играют важную роль в современном мире. Одной из их задач является машинного перевода (МП) перевод с одного языка на другой. МТ позволяет людям свободно общаться, несмотря на языковые барьеры. Эта новая технология — особый шаг, помогающий понять, что собеседник говорит или пишет вам. Автоматическое постредактирование — это задача исправления ошибок, возникших в текстах в результате машинного перевода. Так как МП не всегда может дать желаемый результат, возникает необходимость редактирования перевода. Недостатки перевода приходится устранять постредактированием. Эта потребность в постредактировании во многом определяется качеством машинного перевода: некачественный перевод оставляет много места для постредактирования, а качественный и человеческий перевод требует минимального редактирования текста. В данной работе описывается разработка легкого модуля постредактирования для англо-казахских языковых пар. Модель нейронной сети обучается на парах mt, pe и триплетах src, mt, pe с использованием фреймворка OpenNMT. Затем сравниваются результаты метрик BLEU mt - pe и mt - ape и делается вывод о качестве постредактирования.
Скачивания
Опубликован
Версии
- 2022-06-28 (2)
- 2022-06-27 (1)
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2022 ADVANCED TECHNOLOGIES AND COMPUTER SCIENCE

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.






