Сергей Савельев, спикер TFR: особенности работы с CAT-tools. Извлечение терминологии: инструменты и приёмы

31.07.2018
3975
0

Продолжаем серию интервью спикеров Translation Forum Russia, который пройдёт в Екатеринбурге с 24 по 26 августа 2018 года.

На этот раз команда TopTR побеседовала с Сергеем Савельевым, переводчиком, преподавателем иностранного языка, заместителем генерального директора бюро переводов ITBFIRST. Сергей верит в «технологическое» будущее отрасли и интеграцию отраслевого опыта в систему подготовки переводчиков в вузах.

Сергей, здравствуйте. Тема вашего доклада на TFR — «Извлечение терминологии: инструменты и приемы». Как Вы считаете, может ли «выжить» на переводческом рынке специалист, не пользующийся CAT-tools? Почему?

Я думаю, что на этот вопрос сложно дать однозначный ответ. Если попытаться упростить, то я бы ответил так: есть такие виды переводческой деятельности, в которых роль инструментов САТ не так велика. Например, устный переводчик, будь это переводчик последовательный или синхронист, использует САТ инструменты не так интенсивно как письменный переводчик. Опять же, использование САТ предполагает машиночитаемый исходный документ, а это значит, что для переводчиков, работающих с рукописным текстом, личными документами или текстами, которые не могут быть переведены в цифровой формат, САТ не станет решением проблем.

Для перевода каких текстов можно использовать «память переводов» для получения хорошего результата?

Технология «памяти переводов» (translation memory, ТМ), как и любая технология, не дает ничего сама по себе.

В упрощенном виде ТМ – это наработанная переводчиком база параллельных предложений на двух или более языках. Иными словами – это коллекция твоих или чужих (если ТМ выдал заказчик) переводческих решений. Пользоваться этими наработками или нет – вопрос выбора переводчика. ТМ дает ощутимый прирост качества (единообразие терминологии и формулировок) при условии, что в эту ТМ заведены данные, которые можно применить для решения конкретной задачи.

Например, я перевожу техническую документацию к, скажем, хонинговальному станку (станок для абразивной обработки конических и цилиндрических поверхностей – прим. ред.), а использую ТМ про, скажем, автомобили. Вроде бы и там и там «техника», но очевидно, что такая ТМ мало чем поможет. Соответственно, нужно подбирать и вести ТМ с учетом тематики или заказчика и стараться придерживаться, если переводимые материалы этого допускают, одних и тех же формулировок. Тогда ТМ будет действительно большим подспорьем. Разумеется, есть еще масса нюансов и специфики конкретных проектов, но в целом так.

В последний год наметился активный рост технологий машинного перевода. Как Вы считаете, может ли машина полностью заменить переводчика? Нужно ли переводчикам бороться с распространением машинного перевода или стоит, наоборот, использовать его в своей работе?

Очень болезненный вопрос для многих. Я не думаю, что сильно ошибусь, если скажу, что у переводчиков и редакторов отношение к МП (машинный перевод.– прим. ред.) как минимум неоднозначное. Машинный перевод – это технология со своими возможностями и ограничениями. Действительно, в последние несколько лет в определенных языковых парах наметился некоторый прирост в качестве при переводе определенных типов текстов. Очевидно, что это успех, но до победы пока далеко.

Если посмотреть на конкретные реализации МП: перевод ответов из базы знаний Microsoft, комментариев на Facebook или TripAdvisor, я бы не сказал, что это провал машинного перевода или что это — победа переводчиков-людей. МП сейчас хорошо справляется с задачей, которую невозможно решить иначе в рамках конкретных условий. Бороться с машинным переводом — занятие как минимум непродуктивное. Лучше потратить это время на саморазвитие. Машинный перевод представляет угрозу для переводчиков, которые переводят чуть хуже (это не опечатка) движка МП. Для нормальных переводчиков МП станет угрозой, когда научится видеть так называемый «мир за текстом», а это даже у «белковых» переводчиков получается не всегда.

Какой программой CAT Вы сами пользуетесь в своей работе?

Все САТ инструменты в целом схожи, то есть базовые функции: запись в ТМ, редактирование перевода, подстановка из ТМ, конкордансный* поиск и тому подобное, – у них практически идентичны. Тем не менее, у каждого инструмента есть либо какие-то уникальные функции, скажем, исправление неточных совпадений и субсегментный* поиск в Atril Déjà vu X3 или SDL Trados Studio 2017. Я лично пользуюсь несколькими САТ: Atril Déjà vu X3, MemoQ, Memsource, SDL Trados 2017 и SmartCAT. Перечень алфавитный. Разные заказчики требуют разные инструменты.

* «Конкордансный поиск» или «поиск в конкордансе» (иногда просто «конкорданс») применительно к САТ — поиск не целого предложения (сегмента) в памяти переводов, а конкретного слова или словосочетания. Например, я перевожу текст в САТ среде и дошел до предложения, где встречается слово "key". Целиком предложение у меня из базы не подставилось, вероятно, такое предложение я не переводил. Но точно знаю, что у меня в базе было предложение с этим словом и мне нужно передать его единообразно. Я ищу в базе это слово, и САТ выдает мне список сегментов из базы, где слово "key" в исходном предложении подсвечено. Соответственно, я могу посмотреть на переводы и выбрать подходящий. Очень полезная функция! Особенно в ситуации, когда ТМ высокого качества, не содержит неправильных переводов, а глоссария нет.

* «Субсегментный поиск», «субсегментные подстановки» — относительно новая (по меркам истории САТ) функция. Субсегментный поиск и подстановка тесно связаны с проблемой использования «неточных совпадений», то есть предложение, которое вам нужно перевести, отличается от сохраненного в ТМ. Например, предложения: «Данный клапан является неразборным» и «Данный узел является неразборным» являются относительно друг друга неточными совпадениями. Это очень простой и очевидный пример. Однако в жизни предложения, которые нам кажутся очень похожими, не являются таковыми для машины. Получается, что сегменты лежат если не мертвым грузом, то не работают на полную.

А бывает так, что переводимое предложение является комбинацией из двух, которые были переведены ранее. Такого «кентавра» разглядеть очень сложно. Вот тут и приходит на помощь субсегментный поиск: САТ анализирует ТМ и выделяет в ней устойчивые соответствия на уровне словосочетаний и позволяет их подставлять, а, в случае дальнейшего развития технологии, еще и исправлять с их помощью частичные совпадения.

Существуют разные разработчики CAT-tools. В чём принципиальное различие их продуктов?

Действительно, если верить недавней инфографике от Nimdzi, сейчас на рынке представлено достаточно много САТ инструментов. Для переводчиков, которые пользуются только базовыми функциями САТ, эти различия не очень существенны. Ключевые и, наверное, наиболее значимые для переводчиков различия — тип установки и цена. То есть: это «облачное» решение или локальное и сколько оно стоит.

Как Вы думаете, есть ли шанс у фрилансеров в будущем получить бесплатный аналог Trados? Сейчас версия для домашнего использования стоит около 20000 рублей, что довольно чувствительно для кошелька начинающего фрилансера.

В настоящее время на рынке представлены бесплатные версии некоторых десктопных САТ – это, например, Déjà vu X3 Free и MemoQ Translator Free. Разумеется, их функциональные возможности несколько усечены относительно полных версий. Не берусь судить, насколько они подходят для полноценной работы, но получить некоторые навыки работы в САТ они позволяют. САТ программы, как, впрочем, и любое другое ПО для профессиональной работы, стоит недешево.

С другой стороны, фрилансер – это, по сути, бизнесмен, и его работа вполне себе бизнес со своими издержками. При грамотной организации работы затраты на приобретение лицензии на САТ окупаются, по самой консервативной оценке, в течение года. Некоторые бюро переводов предоставляют своим удаленным переводчикам временные или «плавающие» лицензии.

В одном своём интервью Вы говорили об опыте использования SmartCAT. Вы упомянули, что даже участвовали в тестировании продукта. Как Вы считаете, насколько безопасно использование облачных сервисов с точки зрения защиты конфиденциальной информации для заказчика?

Безопасность и конфиденциальность данных в облачных решениях – тема большая и многоплановая, и, разумеется, она не ограничивается САТ инструментами. У определенных категорий заказчиков и переводчиков возникают вполне обоснованные опасения, когда их данные находятся в дата-центре на территории недружественного государства. Опять же, уровень конфиденциальности и требования к защите данных варьируются от проекта к проекту. В целом, уровень конфиденциальности и безопасности облачных САТ сопоставим с облачными решениями для почты или обмена файлами. В любом случае, тип САТ и вопросы конфиденциальности обязательно нужно обсуждать с заказчиком.

Что бы Вы предпочли на месте клиента: облачный сервис или программу, требующую установки (например, Trados)?

Буду банален, тут нет однозначного ответа. Необходимо принимать во внимание множество факторов: это и размер команды, и бюджет, и техническое оснащение, и характер поступающих на перевод документов. В любом случае, выбор САТ среды для компании – дело не сиюминутное.

Какой опции для Вас, как для переводчика, не хватает в современных CAT-tools?

Мне, как, вероятно, многим другим переводчикам, не хватает корректной поддержки форматов CAD программ.

Преподают ли в наших лингвистических вузах работу с CAT-tools?

Насколько я знаю, в некоторых российских вузах такие курсы есть, и хочется только пожелать, чтобы преподавание САТ стало нормой. Более того, никто же не запрещает применять те же облачные САТ на обычных занятиях по письменному переводу.

Какую CAT-tool систему Вы рекомендуете для начинающего переводчика-фрилансера?

Я бы не стал проводить жесткой границы между ПО для «новичка» и для «профи». Надо исходить из требований заказчика. Сейчас многие российские бюро переводов активно внедряют SmartCAT и Memsource, которые не требуют от фрилансера никаких вложений в ПО, а некоторые используют десктопные версии и требуют от переводчиков, с которыми они сотрудничают, того же. Если вы свободны в своем выборе, то лучше выбрать ту САТ, в которой вам комфортно работать. У многих программ есть пробные версии — и часто пробного периода вполне хватает, чтобы понять, готовы ли вы купить эту программу.

Какие программы для оптимизации и улучшения работы переводчика Вы можете посоветовать?

Начать, наверное, надо с того, что используемые в работе программы должны корректно работать. Когда программу для оптимизации работы нужно каждый день настраивать по 10-15 минут, ни о какой оптимизации не может быть и речи. Дабы не быть уличенным в рекламе конкретных продуктов, я назову те типы ПО, которые, как мне кажется, нужны переводчику. Буду говорить, скорее, о фрилансерах.

В первую очередь — это надежное решение для резервного копирования данных. Будет очень обидно потерять то, что было наработано за несколько нет. Второе – инструмент для управления временем. В начале карьеры не каждый переводчик способен трезво оценить свои силы и понять, сколько он действительно может перевести. Третье – программа для управления проектами и учета клиентов. За деньгами, как и за временем, надо следить. Понимать сколько ты зарабатываешь также важно, как и грамотно оценивать свою работоспособность. Четвертое – программы для ускорения набора текста (например, Typing Assistant) и проверки орфографии.

Комментарии 0

Чтобы оставить комментарий, пожалуйста, войдите или зарегистрируйтесь