Начало » Други » Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

26.09.2023 21:08 2 мин. четене Kosta Gushterov
СПОДЕЛИ: СПОДЕЛЯНИЯ
Пробив в AI секторът: ChatGPT скоро ще може да “вижда, чува и говори”

На 25 септември OpenAI, компанията създател на чатбота ChatGPT разкри, че предстоящите актуализации на модела ще въведат иновативни функции, които ще позволят на потребителите да взаимодействат с него чрез изображения и гласово разпознаване.

Това подобрение има за цел да предложи по-персонализирано изживяване, като позволи на потребителите да използват гласови команди. OpenAI подчерта, че тази функционалност разчита на модел за преобразуване на текст в реч, който може да генерира звук от минимални образци на реч, създадени от професионални гласови актьори. Освен това тя използва възможностите на тяхната система за разпознаване на реч с отворен код, известна като Whisper.

Очаква се включването на гласови функции да разшири обхвата на практическите приложения, като например подпомагане на дейности като четене на приказки за лека нощ, съставяне на рецепти, съставяне на речи, рецитиране на поезия, разясняване на общи фрази или дори разрешаване на спорове на масата за вечеря.

OpenAI също така разкри, че скоро потребителите ще имат възможност да изпращат изображения на ChatGPT или да избират определени области в изображенията, за да бъдат интерпретирани и да получат отговор.

Отчитайки потенциалните рискове, OpenAI призна възможността за измама. Вследствие на това тя ще ограничи гласовите функции до своята платформа за гласови чатове.

OpenAI също така призна загрижеността за неприкосновеността на личния живот, свързана с разпознаването на изображения. За да се справят с това, те са ограничили способността на ChatGPT да прави окончателни изявления за лица в изображения.

Макар да признаха, че ChatGPT невинаги може да предоставя напълно точни описания, те подчертаха, че способността му да предлага общи описания на изображенията се е оказала полезна, позовавайки се на предишното си сътрудничество с Be My Eyes – приложение, предназначено за подпомагане на слепи и слабовиждащи лица.

Kоста работи в крипто индустрията от над 4 години. Той се стреми да представя различни гледни точки по дадена тема и харесва сектора заради неговата прозрачност и динамика. В работата си той се фокусира върху балансираното отразяване на събитията и развитието в крипто пространството, като предоставя информация на своите читатели от неутрална гледна точка.

Telegram

СПОДЕЛИ: СПОДЕЛЯНИЯ
Още Други Новини

SBI Group инвестира $50 милиона в Circle

Японският финансов гигант SBI Group значително подкрепи емитента на стабилна монета USDC, Circle, като инвестира $50 милиона в неотдавнашното първично публично предлагане (IPO) на компанията на Нюйоркската фондова борса.

10.06.2025 21:00 1 мин. четене Alexander Zdravkov

OpenSea бележи ръст на потребителите, но обемите на NFT пазара все още изостават

След дълъг период на понижена активност, OpenSea отбелязва значителен ръст в ангажираността на потребителите.

10.06.2025 12:00 2 мин. четене Kosta Gushterov

Worldcoin разширява дейността си в Обединеното кралство

Сам Алтман от OpenAI пренася своето противоречиво начинание за проверка на самоличността, Worldcoin, в Обединеното кралство, като стартира в Лондон.

10.06.2025 11:05 2 мин. четене Alexander Zdravkov

Потенциално IPO на Tether може да надхвърли стойността на Coca-Cola според изпълнителния директор

Изпълнителният директор на Tether, Паоло Ардоино, представи смел сценарий за оценка: Aко гигантът в областта на стабилните монети излезе на борсата, пазарната му капитализация може да достигне $515 милиарда, което потенциално би го превърнало в една от 20-те най-ценни компании в света, изпреварвайки традиционни гиганти като Coca-Cola и Costco.

10.06.2025 9:47 1 мин. четене Alexander Zdravkov
Все още няма коментари!

Вашият имейл адрес няма да бъде публикуван.