Компания OpenAI представила обзор своей новейшей разработки Voice Engine, продемонстрировав ее способность генерировать реалистичный звук из 15-секундного ролика и текстовой подсказки. Развивая голосовые возможности, представленные в ChatGPT в сентябре прошлого года, Voice Engine получил известность благодаря своей способности генерировать нюансы голоса с естественными интонациями и тоном, отходя от монотонности, часто ассоциирующейся с синтетической речью. Изначально разработанный в 2022 году для поддержки функции чтения вслух и преобразования текста в речь в ChatGPT, Voice Engine прошел обширное тестирование в различных приложениях, включая помощь детям и нечитающим людям, облегчение общения для невербальных людей и решение задач перевода.
Несмотря на большой потенциал, OpenAI с осторожностью относится к использованию Voice Engine в свете опасений по поводу использования синтетических голосов злоумышленниками. В результате OpenAI решила пока не выпускать Voice Engine в широкое пользование, подчеркнув свою приверженность безопасности ИИ и обратившись к широкому кругу заинтересованных сторон с целью обеспечить ответственную разработку и внедрение технологии.