Начало » Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

26.09.2023 21:08 2 мин. четене Kosta Gushterov
СПОДЕЛИ: СПОДЕЛЯНИЯ
Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

На 25 септември OpenAI, компанията създател на чатбота ChatGPT разкри, че предстоящите актуализации на модела ще въведат иновативни функции, които ще позволят на потребителите да взаимодействат с него чрез изображения и гласово разпознаване.

Това подобрение има за цел да предложи по-персонализирано изживяване, като позволи на потребителите да използват гласови команди. OpenAI подчерта, че тази функционалност разчита на модел за преобразуване на текст в реч, който може да генерира звук от минимални образци на реч, създадени от професионални гласови актьори. Освен това тя използва възможностите на тяхната система за разпознаване на реч с отворен код, известна като Whisper.

Очаква се включването на гласови функции да разшири обхвата на практическите приложения, като например подпомагане на дейности като четене на приказки за лека нощ, съставяне на рецепти, съставяне на речи, рецитиране на поезия, разясняване на общи фрази или дори разрешаване на спорове на масата за вечеря.

OpenAI също така разкри, че скоро потребителите ще имат възможност да изпращат изображения на ChatGPT или да избират определени области в изображенията, за да бъдат интерпретирани и да получат отговор.

Отчитайки потенциалните рискове, OpenAI призна възможността за измама. Вследствие на това тя ще ограничи гласовите функции до своята платформа за гласови чатове.

OpenAI също така призна загрижеността за неприкосновеността на личния живот, свързана с разпознаването на изображения. За да се справят с това, те са ограничили способността на ChatGPT да прави окончателни изявления за лица в изображения.

Макар да признаха, че ChatGPT невинаги може да предоставя напълно точни описания, те подчертаха, че способността му да предлага общи описания на изображенията се е оказала полезна, позовавайки се на предишното си сътрудничество с Be My Eyes – приложение, предназначено за подпомагане на слепи и слабовиждащи лица.

Telegram

СПОДЕЛИ: СПОДЕЛЯНИЯ
Още Други Новини

БРИКС: Стремежът на Китай да наложи юана среща глобална съпротива

От 2022 г. насам Китай активно популяризира юана като основна валута за търговия между страните от БРИКС, възползвайки се от геополитическите раздори – особено след като западните санкции засегнаха Русия.

22.04.2025 9:00 1 мин. четене Alexander Zdravkov

Разследват американски депутат след 190% печалба от тази европейска компания

Представителката на парламента на Невада, Сузи Лий е подложена на проверка след нейната инвестиция в германската отбранителна компания Rheinmetall AG.

21.04.2025 13:00 1 мин. четене Alexander Zdravkov

Вероятността за рецесия на Polymarket се повиши вследствие на митата на Тръмп

След последния ход на президента Тръмп за налагане на мащабни мита, тревожността на пазара се увеличава, а крипто-базираните платформи за прогнози сигнализират за нарастващо убеждение, че на хоризонта се задава рецесия в САЩ.

21.04.2025 8:00 2 мин. четене Alexander Zdravkov

Заплахите на Тръмп да уволни председателя на Фед предизвикват тревога за стабилността на пазарите

Антъни Помплиано се противопоставя категорично на неотдавнашния стремеж на Доналд Тръмп да отстрани председателя на Федералния резерв Джером Пауъл, като предупреди, че подобен ход може да навреди на доверието във финансовата система на САЩ.

20.04.2025 20:00 2 мин. четене Alexander Zdravkov
Все още няма коментари!

Вашият имейл адрес няма да бъде публикуван.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.