Исследователи новосибирского Института вычислительных технологий СО РАН разработали алгоритм-переводчик с дореволюционного русского языка на современный.
В основу лег «Справочник по старой орфографии русского языка» Павла Давыдова, включающий анализ множества источников и литературы до 1917 года. Учитывая существовавшие в те времена нормы правописания и изменения, возникшие после, ученые вывели закономерности и разделили все слова на группы. Таким образом, алгоритм предполагает, к какой группе может принадлежать то или иное устаревшее слово на основании его морфемы, и переводит его согласно правилам этой группы.
Исследователи указывают на то, что алгоритм может переводить только те слова, которые есть в справочнике, но программу продолжат совершенствовать. А пока он вполне пригоден для упрощения работы редакторов и корректоров, когда речь идет о больших объемах текстов, и предоставляет дополнительные инструменты для анализа информации.
Комментарии 0