Видеохостинг YouTube оснастили новой функцией.
Теперь популярный видеохостинг может автоматически генерировать субтитры, определяя в видеороликах музыку, смех и звуковые эффекты.
Отмечается, что с 2009 года YouTube оснащен функцией автоматической генерации субтитров, работающей на основе системы распознавания речи от Google.
Однако, по словам представителей компании, научить YouTube определять звуковые эффекты и транслировать соответствующие субтитры было гораздо сложнее.
«Четко классифицированную информацию о звуковом окружении найти трудно, но мы смогли сгенерировать достаточно большой объем данных для обучения с использованием сигналов, которые трудно отнести к какой-то категории» – заявили представители сервиса.
Поэтому команда разработчиков сосредоточилась на определении музыки, шума и смеха, так как для людей с ограниченными возможностями они придают значительный контекст диалогу в видеоролике.
«В будущем нашей задачей может стать добавление других общих видов звуковых явлений, например звона, лая и стука, с которыми связаны определенные трудности. Например, в случае звона мы должны уметь различать, что это: сигнал будильника, звонок в дверь или по телефону», – подчеркнул инженер Google Ноа Вана.
Фото: из открытых источников