Транскрайб подкастов, интервью и разговоров

Идея рождена из полуручной обработки последнего выпуска Hardcore History, который я сделал: Superhumanly Inhuman.

Показалось что можно сделать автоматический пайплайн, попутно систематизировать свои знания о текущих ML-моделях и инфраструктуре, использовать в личных целях. А как максимум — вырастить из этого публичный сервис. Сначала — переводя чужие классные аудио- и видео- записи в обогащенный текст, а потом предоставляя решение для любых личных целей (записи разговоров с терапевтом; интервью; личные разговоры с друзьямиl; протоколы рабочих встреч).

Но сейчас речь идет о "фанатском" сайте моих любимых подкастеров типа Hardcore History, Search Engine, 99% Invisible, Radiolab и Психополитики.

Решение

Всё это выглядит так что надо использовать AI Speech Technology | Speech-To-Text API | Speechmatics и оно всё (ну, главное) за нас сделает. Дальше можно будет трансформировать и почистить своими руками.

Развитие