Home

Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

26.09.2023 21:08 2 мин. четене Kosta Gushterov
СПОДЕЛИ: СПОДЕЛЯНИЯ
Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

На 25 септември OpenAI, компанията създател на чатбота ChatGPT разкри, че предстоящите актуализации на модела ще въведат иновативни функции, които ще позволят на потребителите да взаимодействат с него чрез изображения и гласово разпознаване.

Това подобрение има за цел да предложи по-персонализирано изживяване, като позволи на потребителите да използват гласови команди. OpenAI подчерта, че тази функционалност разчита на модел за преобразуване на текст в реч, който може да генерира звук от минимални образци на реч, създадени от професионални гласови актьори. Освен това тя използва възможностите на тяхната система за разпознаване на реч с отворен код, известна като Whisper.

Очаква се включването на гласови функции да разшири обхвата на практическите приложения, като например подпомагане на дейности като четене на приказки за лека нощ, съставяне на рецепти, съставяне на речи, рецитиране на поезия, разясняване на общи фрази или дори разрешаване на спорове на масата за вечеря.

OpenAI също така разкри, че скоро потребителите ще имат възможност да изпращат изображения на ChatGPT или да избират определени области в изображенията, за да бъдат интерпретирани и да получат отговор.

Отчитайки потенциалните рискове, OpenAI призна възможността за измама. Вследствие на това тя ще ограничи гласовите функции до своята платформа за гласови чатове.

OpenAI също така призна загрижеността за неприкосновеността на личния живот, свързана с разпознаването на изображения. За да се справят с това, те са ограничили способността на ChatGPT да прави окончателни изявления за лица в изображения.

Макар да признаха, че ChatGPT невинаги може да предоставя напълно точни описания, те подчертаха, че способността му да предлага общи описания на изображенията се е оказала полезна, позовавайки се на предишното си сътрудничество с Be My Eyes – приложение, предназначено за подпомагане на слепи и слабовиждащи лица.

Telegram

СПОДЕЛИ: СПОДЕЛЯНИЯ
Още Други Новини

Dogecoin се стреми към глобален прием с нови стратегически партньорства

Тимъти Стебинг, директор на Фондация Dogecoin, наскоро сподели вълнуващи идеи за плановете за разширяване на глобалния прием на DOGE.

23.02.2025 19:00 2 мин. четене Alexander Zdravkov

Arkham Intelligence ще стартира спот търговия с криптовалути в САЩ

Arkham Intelligence, компания за крипто обмен и анализи, разширява услугите си и включва спот търговия с криптовалути, която ще стартира в 17 американски щата на 1 март.

23.02.2025 18:00 1 мин. четене Alexander Zdravkov

Чанпен Джао търси съвет за разпределението на неочаквани дарения на стойност $1 милион

Чанпен Джао (CZ), основател на Binance, наскоро се обърна към криптовалутната общност за насоки как да разпредели над $1 милион, натрупани в адрес на портфейл за дарения, който някога е използвал.

23.02.2025 16:00 2 мин. четене Kosta Gushterov

Уорън Бъфет отправи предупреждение за американския долар

Уорън Бъфет изрази загриженост за американската икономика, предупреждавайки, че стабилността и покупателната способност на долара са уязвими.

23.02.2025 13:00 1 мин. четене Alexander Zdravkov

Подкрепете CryptoDNES

QR код към биткойн адреса:

QR код към биткойн адреса:

Все още няма коментари!

Вашият имейл адрес няма да бъде публикуван.

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.