Ссылка на кабинет: 1052
Тип проекта: программный
Статус проекта: В работе с 29.10.2021
Предоставить возможность автоматизированного создания протокола встреч и звонков.
Движок и API для мобильного приложения и/или веб сервиса, принимающий на вход аудиофайл и генерирующеий транскрибацию диалогов с разделением на реплики, сказанные разными людьми.
Принцип работы:
Программная часть представляет собой нейронную сеть, преобразующую аудиозаписи в текстовый формат с возможностью разделения текста на реплики принадлежащие разным собеседникам, различая их по голосам.
На начальном этапе будут использованы и усовершенствованы методы распознавания речи с сайта kagle.com и датасет из соревнования “TensorFlow Speech Recognition Challenge”.
Проект является исследовательской работой по созданию прототипа коммерческого продукта. Сайт для размещения веб сервиса будет определен в ходе дальнейшего развития проекта.
Демин Алексей Анатольевич |
---|
не указана |
Руководитель проекта, Инициатор проекта |
aademin@miem.hse.ru |
Мирманова Марья Курмановна | Шевцев Марк Денисович |
---|---|
БПМ203 | БПМ192 |
Программист нейронных сетей | Андроид разработчик |
mkmirmanova@edu.hse.ru | mdshevtsev@miem.hse.ru |