Исследователи из Google Brain разработали нейросеть под названием SummAE. Она без помощи человека создает краткие пересказы любых типов текстов.
Ранее уже создавались нейросети, резюмирующие новостные заметки, однако при работе с другими текстами, к примеру, художественными, уже возникали проблемы. В свою очередь алгоритм SummAE является универсальным. Он прошел 100 000 этапов обучения, после которых 80% добровольцев, оценивающих результаты работы, отметили высокое качество сгенерированных ИИ резюме.
Принцип работы SummAE следующий: алгоритм переводит текст в цифровой вид и на его основе генерирует краткий пересказ. Кроме того, он не просто делает выборку предложений, но и перефразирует их, составляя достаточно сложные словосочетания. Это происходит за счет изменения порядка предложений в каждом абзаце и произвольной маркировке отдельно взятых фрагментов.
Разработчики отмечают, что SummAE – это только первый этап в разработке универсального алгоритма для создания кратких резюме. Помочь усовершенствовать нейросеть может любой желающий, набор данных и код алгоритма размещены на GitHub.
Комментарии 0