Фрагмент для ознакомления
2
Введение
Как отмечает большинство переводоведов, перевод является процессом по преобразованию текста (речевое произведение) на языке А в текст (речевое произведение) на языке В с сохраненным неизменным планом содержания. То есть во время перевода единицы плана выражения (единицы языка) заменяются, а информация, передаваемая текстом (план содержания) не меняется [4, с.18].
При этом перевод посредством систем машинного перевода не всегда позволяет этого добиться. Тем не менее, работа электронных систем ускоряется, поэтому обновление баз и словарей машинных переводчиков сможет занимать меньше времени. Кроме того, в настоящее время наблюдается тенденция к максимальному упрощению интерфейса различных программ, поэтому основные усилия разработчиков будут направлены на развитие самих систем машинного перевода.
При этом не все типы текста подходят для машинного перевода, поскольку тексты имеют разные функции, хотя в принципе, машины могут переводить что угодно, но результат при этом не всегда одинаково хороший.
Работа с фактической документацией - сильная сторона машинного перевода. Он хорошо обрабатывает короткие предложения, простой язык и однозначную терминологию. Также были предприняты попытки заставить программное обеспечение машинного перевода обрабатывать некоторые произведения классической литературы, что пока не дало хороших результатов, т. к. в литературе упор делается не на информационное наполнение, а на эстетические ценности и атмосферу. Литература описывает и повествует «между строк». Однако программное обеспечение машинного перевода умеет только обрабатывать слова, не понимая более широкого контекста и скрытых значений.
Более того, машина не всегда «знает», что делать с орфографическими ошибками или неизвестными словами. Хорошо функционирующее программное обеспечение для перевода может стать достойным соперником для людей-переводчиков, если, например, в качестве критерия используется последовательность. Однако, машины пока так не работают совершают ряд ошибок, которые необходимо различать и классифицировать, в связи с чем данная работа, цель которой – исследование типологии переводческих ошибок при работе систем машинного перевода, является актуальной.
Для достижения поставленной цели были сформулированы следующие задачи:
- изучить и проанализировать существующую теоретическую литературу по теме исследования «Проблемы машинного перевода. Перспективы их решения»;
- проанализировать виды машинного перевода и историю его развития;
- привести обзор переводческих трансформаций, с которыми сталкивается человек-переводчик;
-привести алгоритмы предпереводческого анализа и выбрать наиболее подходящий для данного исследования;
- провести анализ перевода технической статьи человеком-переводчиком;
- провести анализ перевода технической статьи машиной;
- оценить перспективы решения проблем машинного перевода.
Методами исследования в данной работе послужил метод анализа, который помог собрать воедино имеющиеся результаты различных исследований отечественных и зарубежных переводоведов и специалистов машинного перевода, а также, интегральный метод, позволяющий на основе отдельно взятых выводов сделать общее заключение к данному исследованию.
Материалом исследования послужили работы таких переводоведов, как Л. С. Бархударов, И. С. Алексеева, Я. И. Рецкер и др., также труды таких исследователей машинного перевода, как: Е. Н. Марчук, М. В. Шумилина., О. Н. Ясаревская, К. А. Дроздова, Е.Н. Барашко, Б.С. Овчарова, P. Brown, J. Vincet, P. Della, A. Stephen, L. Robert и др., а кроме того, современные разработки облачных технологий в области машинного перевода.
Источниками исследования послужила статья технической направленности, которая была переведена автором данного исследования с применением предпереводческого анализа, а также с применением Google Translate.
Теоретическая значимость данного исследования заключается в том, что полученный результаты могут быть применены в изучении вопросов машинного перевода разножанровых текстов в целом и перевода технических текстов, в частности.
Практическая значимость данного исследования заключается в том, что полученные результаты могут быть применены в практике машинного перевода, основанного на статистическом принципе.
Структура исследования состоит из введения, двух глав с выводами к ним, заключения, списка используемой литературы.
Глава 1 Особенности перевода человеком и машиной
1.1. Интернет (машинный) перевод
1.1.1. Определение и история развития машинного перевода
Говоря о машинном переводе, следует отметить, что существует определенная путаница в терминах «автоматизированный» и «машинный» перевод. Размытые формулировки и неточные термины нередко служат причиной для непрекращающихся споров, особенно среди непрофессионалов [1].
Путаница между ними возникла из-за того, что и первое, и второе чаще всего ассоциируется с выполнением работы программами вместо человека. И в эту ловушку попадают многие – заказчики, студенты специализированных факультетов или начинающие переводчики. Кроме того, машинный и автоматизированный перевод берут своё начало с момента развития компьютерных технологий в XX веке. Таким образом, получается, что эта проблема появляется снова и снова на протяжении многих лет.
Чтобы разобраться в сути вопроса, что такое машинный перевод и автоматизированный перевод, необходимо начать с развёрнутого определения для каждого из понятий.
Автоматизированный перевод – перевод текстов с одного языка на другой человеком с использованием специализированных программ, приложений.
Машинный перевод – процесс перевода текстов с одного языка на другой машиной посредством специальной компьютерной программы.
Между ними есть три главных различия:
• Трудозатраты переводчика.
• Специализированное программное обеспечение.
• Качество.
Так, при автоматизированном переводе основную работу выполняет переводчик, а специальные программы выступают только в качестве вспомогательного инструмента. Его главной целью является сокращение времени процесса, обеспечение единообразия терминов и общего соответствия (качества).
Машинный же перевод производит сама программа, а человек только редактирует полученный результат. И здесь уже цель – заменить труд человека, получая при этом быстрый перевод низкого качества.
Машинный перевод действительно приобрел плохую репутацию, потому что он ассоциируется с низким качеством (а результаты иногда бывают очень нелогичным), но на самом деле эта технология продвинулась с тех пор, как была впервые задумана в 1949 году, очень далеко.
Новая область «машинный перевод» (МП) появляется в Меморандуме о переводе Уоррена Уивера (1949 г.), и первый исследователь в этой области, Иехоша Бар-Хиллель, начинает свои исследования в Массачусетском технологическом институте (1951 г.).
Исследовательская группа Джорджтаунского машинного перевода разрабатывает в 1951 и публично демонстрирует свою систему перевода в 1954 году. МП рекламируется как решение, помогающее США следить за русскоязычными оппонентами. Это исследование также одним из первых для нечисловых приложений для компьютеров. Программы исследований машинного перевода появляются в Японии и России (1955 г.), а первая конференция по машинному переводу проходит в Лондоне (1956 г.).
Исследователи продолжают работать в этой области, поскольку в США (1962 г.) создается Ассоциация машинного перевода и компьютерной лингвистики, а Национальная академия наук формирует комитет ALPAC (Automatic Language Processing Advisory Committee/ Консультативный комитет по автоматической обработке языков) для изучения машинного перевода (1964 г.).
Однако в 1966г в отчете ALPAC говорится, что машинный перевод не может конкурировать с качеством перевода, выполняемым человеком, и предлагается прекратить финансирование исследований в области машинного перевода. Но исследования продолжаются.
Машинный перевод теперь задействован: Французским текстильным институтом для перевода рефератов с французского, английского, немецкого и испанского языков и на эти языки (1970).
Университет Бригама Янга начинает проект по автоматическому переводу мормонских текстов (1971 г.); и Xerox использует Systran для перевода технических руководств (1978).
Открываются различные компании, занимающиеся переводческой памятью, включая Trados (1984), которая первой разработала и выпустила на рынок технологию памяти переводов (1989). Первая коммерческая система машинного перевода для русского / английского / немецко-украинского языков разработана в Харьковском государственном университете (1991).
История машинного перевода в интернете начинается с системы Systran, предлагающей бесплатный перевод небольших текстов (1996 г.).
Далее была AltaVista Babelfish, которая обрабатывала 500 000 запросов в день (1997 г.). Франц-Йозеф Оч (будущий руководитель отдела разработки переводов в Google) побеждает в конкурсе DARPA speed MT (2003).
Другие инновации за это время включают:
-MOSES, статистический механизм машинного перевода с открытым исходным кодом (2007 г.),
-Службу перевода текста / SMS для мобильных телефонов в Японии (2008 г.);
- Мобильный телефон со встроенной функцией перевода речи с японского и китайского на английскй язык (2009).
В 2012 году компанией Google было объявлено, что Google Translate переводит примерно столько текста, чтобы заполнить 1 миллион книг за один день.
Таким образом, машинный перевод — это передовая технология. Его качество ниже, чем у перевода человеком, но это не значит, что он не имеет практического применения.
1.1.2. Виды машинного перевода
В настоящее время существует множество систем машинного перевода.
К самым популярным в России относятся приведенные на рис. 1 системы.
Развитие Promt, отечественной системы машинного перевода, началось в 20 веке.
Компания PROMT была основана на базе отечественной системы МП Stylus и на данный момент обладает расширенным списком направлений перевода. Компания выпускает достаточно широкий ассортимент коммерческих продуктов, среди которых наибольшим количеством модулей обладает PROMT XT Premium. Основной модуль этого комплекта является профессиональной средой для перевода и настроек его режимов. Существуют также такие модули: Dictionary Editor Pro (создание и редактирование собственных словарей), PromtX (редактирование и перевод с возможностью автоматического перевода буфера обмена), PromtE (перевод web-страниц), Electronic Dictionary (электронный словарь, содержащий всю словарную базу специализированных словарей) и др [7].
Переводчик Google Translate, в свою очередь, является более молодой системой, интегрированный, кроме всего прочего, в поисковые системы [3, с.23].
В последние годы произошел значительный шаг вперед в технологии машинного перевода благодаря исследованиям Google по нейронному машинному переводу, которые подразумевают оптимистичный прогноз для будущего отрасли [8, с.156].
Рисунок 1 Популярные в России системы машинного перевода
Стало ясно, что машинный перевод перестает восприниматься как высокоскоростной но низкокачественный вариант перевода и превращается в разумную альтернативу для перевода рутинного контента.
Всего за несколько лет появилось множество поставщиков машинного перевода, обещающих приемлемое качество за небольшую часть стоимости профессиональных лингвистов. Гонка за конкурентное преимущество в качестве идет полным ходом, и поставщики машинного перевода начинают применять дифференцированные подходы к «повышению» качества, которое их системы способны обеспечить. Сегодняшние провайдеры обычно делятся на три категории:
1) Гибридные решения Human-MT (например, Unbabel)
2) Машинный перевод, адаптированный к предметной области (например, Lilt, IBM),
3) Нейронный машинный перевод (например, Google, Microsoft, SDL, Yandex)
Кроме того, существует и классификация машинного перевода, основанная на подходах, а именно [16]:
Фрагмент для ознакомления
3
Литература
1. Автоматизированный и машинный переводы: в чём разница [Электронный ресурс] https://www.toptr.ru/library/translation-truth/avtomatizirovannyij-i-mashinnyij-perevodyi-v-chyom-raznicza.html
2. Алексеева И. С. Введение в переводоведение: Учеб. пособие для студ. филол. и лингв, фак. высш. учеб. заведений. — СПб.: Филологический факультет СПбГУ; М.: Издательский центр «Академия», 2004. — 352 с
3. Барашко Е.Н., Овчарова Б.С. Системы машинного перевода. Реальность и перспективы развития / Общество. – 2019. - №2(13). С.23-26.
4. Бархурдаров, Л.С. Язык и перевод. Вопросы общей и частной теории перевода / Л.С.Бархурадов. – М.: Высш. школа, 1975 – 324с.
5. Витренко А.Г. О стратегии перевода [Электронный ресурс] http://agvitrenko.3dn.ru/publ/1-1-0-8
6. Головин Б. Н. Лингвистические термины и лингвистические идеи //Вопросы языкознания. 1976, № 3.
7. Денисова Д. С. Современные системы машинного перевода. статический машинный перевод [Электронный ресурс] https://www.elibrary.ru/download/elibrary_32330475_63687112.pdf
8. Дроздова К.А. Машинный перевод: история, классификация, методы/ Гуманитарные исследования. – 2015. - №3 (7). С.156-158.
9. Казакова Т.А. Практические основы перевода. – СПб: Союз, 2001. – 320 с.
10. Комиссаров В. Н. Современное переводоведение: учебное пособие. – М. : ЭТС, 2001. – 424 с.
11. Кузнецов П.С., Ляпунов А.А., Реформатский А.А. Основные проблемы машинного перевода / Вопр. языкознания. - 1956. - № 5. С. 40–44.
12. Марчук Е.Н. Проблемы машинного перевода.- М.: Наука, 1983. 232 с.
13. Миньяр-Белоручева А.П., Миньяр-Белоручев К.В., Английский язык.Учебник устного перевода., М. 2004.
14. Рецкер Я.И. Теория перевода и переводческая практика. Очерки лингвистической теории перевода. М., 2016. С.244.
15. Шумилина М.В., Ясаревская О.Н. Способы повышения эффективности перевода // Итоги прошлого и проблемы настоящего плюс: Периодическое научное издание. - Пенза: Изд-во Пенз. Гос. Технолог. Ун.-та, 2015. - Вып. 06/(28) - Т.1. - С. 174 - 178.
16. Ясаревская О. Н. К вопросу о машинном переводе: статистический машинный перевод [Электронный ресурс] https://elibrary.ru/download/elibrary_29100831_27628610.pdf
17. A comparative study of laser beam welding and laser - MIG hybridwelding of Ti Al ZR FE titanium alloy [Электронный ресурс] https://www.sciencedirect.com/science/article/abs/pii/S0921509310011305
18. Brown P., Vincet J. Della Pietra, Stephen A. Della Pietra, Robert L. Mercer / Computational Linguistics, 1993. - Issue 19(2) - PP. 263-311.
19. DeepL [Электронный ресурс] https://www.deepl.com/en/blog/
20. Google Translate [Электронный ресурс] https://translate.google.fi/?hl=en&tab=TT
21. Halliday M. A. K., R. Hasan Cohesion in English, London, 1976
22. Niskanen N. Machine translation, no match for humans: machines translate words, humans the underlying message [Электронный ресурс] https://www.helsinki.fi/en/news/language-culture/machine-translation-no-match-for-humans-machines-translate-words-humans-the-underlying-message
23. Seven Machine Translation Trends in 2020 [Электронный ресурс] https://blog.taus.net/seven-machine-translation-trends-in-2020
Справочные материалы для перевода
24. Справочник по лазерной сварке [Электронный ресурс] https://www.technosphera.ru/lib/book/393?read=1
25. Лазерная сварка металла — оборудование, технология, методы, аппараты [Электронный ресурс] https://intehstroy-spb.ru/spravochnik/lazernaya-svarka-tehnologiya-i-oborudovanie.html
26. Лазерная сварка [Электронный ресурс] http://electricalschool.info/main/electrotehnolog/1382-lazernaja-svarka.html
27. Использование лазерной сварки, особенности [Электронный ресурс] https://www.secretovnet.org/archives/8707?utm_source=rss&utm_medium=rss&utm_campaign=%25d0%25b8%25d1%2581%25d0%25bf%25d0%25be%25d0%25bb%25d1%258c%25d0%25b7%25d0%25be%25d0%25b2%25d0%25b0%25d0%25bd%25d0%25b8%25d0%25b5-%25d0%25bb%25d0%25b0%25d0%25b7%25d0%25b5%25d1%2580%25d0%25bd%25d0%25be%25d0%25b9-%25d1%2581%25d0%25b2%25d0%25b0%25d1%2580%25d0%25ba%25d0%25b8-%25d0%25be%25d1%2581%25d0%25be%25d0%25b1%25d0%25b5