Крупнейшая социальная сеть России, ВКонтакте, представила своим пользователям функцию текстовой расшифровки видеосообщений. Эта технология полностью автоматизирована и основана на методах машинного обучения, разработанных внутренней командой ВКонтакте. Об этом пишет Портал Strana.LIFE.
Для достижения высокой точности расшифровки видеозаписей применяются три нейросети, которые выполняют следующие задачи: распознают звуки, отделяют их от видеоряда, формируют слова из звуков и определяют границы предложений. Нейросети обучаются на основе субтитров к фильмам, что позволяет повысить качество распознавания, как заявили представители компании.
Теперь пользователи могут расшифровывать как полученные, так и отправленные видеосообщения. Для этого достаточно нажать на символ "Аа" на видеозаписи, и искусственный интеллект ВКонтакте автоматически распознает речь и преобразует ее в текст. Эта функция станет особенно полезной в случаях, когда слушать или смотреть видеосообщение неудобно или невозможно. Более того, она позволит пользователям быстро находить нужную информацию в переписке, так как расшифрованные видеосообщения будут доступны для поиска по тексту.
На данный момент функция уже доступна в веб-версии web.vk.me и части пользователей приложений ВКонтакте и VK Мессенджер на устройствах Android, включая учебный профиль Сферум. В ближайшее время она станет доступна и на устройствах iOS.