AI вече може да клонира гласове, нужен е 15-секунден аудиозапис

Снимка: Pixabay

AI вече може да клонира гласове, нужен е 15-секунден аудиозапис

Снимка: Pixabay
Сподели

Компанията Open AI, разработчик на чатбота ChatGPT, представи нов езиков модел, предаде ЮПИ. Той може да клонира гласа на конкретен човек, като използва само няколко секунди от негов аудиозапис.

Компанията сподели предварителни данни от проучването на възможностите на технологията. Моделът на изкуствения интелект, наречен Voice Engine, се

нуждае само от една 15-секундна аудио извадка, за да генерира реч,

имитираща тази на конкретен човек, съобщи Open AI в публикация в блога си. Технологията е разработена за първи път в края на 2022 г. Използва се за предварително зададени гласове в приложно-програмния интерфейс, който преобразува текст в говор (text-to-speech API).

Технологията е тествана с корпоративните партньори на OpenAI с революционни резултати. Разработчиците споделиха аудиозапис на младо момиче, което говори благодарение на лекарите Фатима Мърза, Роаид Али и Константина Свокос от Института по неврология „Норман Принс“.

Момичето е загубило способността си да говори нормално заради съдов мозъчен тумор, съобщи БТА. Въпреки че все още може да образува думи и изречения,

гласът ѝ не звучи по същия начин

като преди. Лекарите използват аудиоклип, който тя записва за училищен проект, за да възстановят нормалния ѝ глас, така че той вече да не звучи увреден, когато говори.

Open AI засега няма да прави алгоритъма общодостъпен. Стартирало е частно тестване на възможностите му с „малка група от доверени партньори“. Компанията уточни, че продължава да води разговори за това дали и как да внедри технологията в по-голям мащаб.

Алгоритъмът Voice Engine може да се използва за

подпомагане на четенето

за тези, които не могат да четат. Компанията си партнира с фирмата за образователни технологии Age of Learning, която използва технологията, за да генерира скриптирано образователно съдържание.

Open AI сподели 15-секундна извадка от оригинален аудиозапис, в който мъж разказвач определя значението на „сила“ във физиката. След това моделът е приложен към други теми, което позволява на изкуствения интелект да генерира аудио, свързано с биологията, химията, четенето и математиката.

Противниците на технологията са все по-загрижени за последиците от алгоритмите на изкуствения интелект, включително способността да създават аудио и видеоклипове.

Актуално

Избрано за вас