В Казани представили новый русско-татарский и татарско-русский онлайн-переводчик «Татсофт». Он разработан Институтом прикладной семиотики Академии наук РТ при сотрудничестве с ABBYY и «Яндекс».
Разработка проекта заняла около 30 лет, однако более акцентировано ее вели с 2014 года и в 2018 вышла первая версия переводчика. В его основе лежала архитектура encoder-decoder-attention. В новой версии модели были построены на базе архитектуры Transformer, и впервые была использована концепция машинного обучения transfer learning.
Нейросетевой переводчик обучается при помощи параллельного корпуса объемом почти миллион пар русско-татарских предложений, взятых из художественной литературы, текстов новостей и нормативно-правовых актов. Корпус планируется расширить до 10 миллионов таких пар.
Кроме того, на сайте есть кнопки «лайк» (точный перевод) и «дизлайк» (неточный перевод), которые способствуют совершенствованию и обучению системы.
Планируется также создать мобильное приложение и ввести функцию синтеза речи.
Разработчики утверждают, что данный переводчик лучше аналогов (русско-татарский переводчик есть и у «Яндекса»), и им уже заинтересовались другие республики. Сейчас к сотрудничеству и разработке подобного переводчика готовы башкиры.
Комментарии 0