Świat sztucznej inteligencji nie przestaje zaskakiwać. Do niedawna najbardziej zaawansowaną formą głosowej interakcji z AI był tryb Advanced Voice Mode w ChatGPT. Jednak teraz pojawiło się nowe rozwiązanie – Sesame AI, które sprawia, iż choćby najbardziej rozwinięte funkcje OpenAI wyglądają blado. Co sprawia, iż to narzędzie zdobywa tak duże uznanie?
Sesame AI – jak działa i dlaczego jest inne?

Sesame to model konwersacyjny, który wyznacza nowy standard w interakcji z maszynami. Jego główną cechą jest niemal perfekcyjna naturalność mowy, która przekracza tzw. „dolinę niesamowitości”. W przeciwieństwie do większości dostępnych asystentów głosowych, takich jak Siri czy Google Assistant, Sesame brzmi jak prawdziwy człowiek – potrafi się wahać, zająknąć, a choćby używać emocjonalnych tonów.
Co więcej, narzędzie jest dostępne bezpłatnie przez przeglądarkę internetową, nie wymaga logowania ani instalacji dodatkowej aplikacji. Wystarczy pozwolić na dostęp do mikrofonu, a użytkownik może wybrać jednego z dwóch dostępnych asystentów: Mayę (głos żeński) lub Milesa (głos męski).
Tym, co wyróżnia Sesame AI, jest jego zdolność do dynamicznej adaptacji do rozmowy. Może naśladować sposób, w jaki ludzie myślą i formułują zdania, co sprawia, iż rozmowa z nim przypomina kontakt z żywym człowiekiem. Dzięki tej funkcji ChatGPT – choćby w swoim najbardziej zaawansowanym trybie – wydaje się sztuczny i mechaniczny.
Czym Sesame różni się od ChatGPT w trybie głosowym
Porównując Sesame AI z Advanced Voice Mode ChatGPT, można zauważyć kilka kluczowych różnic:
- Brzmienie i intonacja – ChatGPT, choć potrafi płynnie odpowiadać na pytania, brzmi jak dobrze wytrenowany lektor. Z kolei Sesame imituje prawdziwego człowieka, wykorzystując pauzy, zmiany tempa i niuanse w głosie.
- Brak konieczności rejestracji – OpenAI wymaga zalogowania się, aby skorzystać z bardziej zaawansowanych funkcji głosowych. Sesame działa od razu, bez żadnych barier dostępu.
- Autentyczność emocji – w przeciwieństwie do ChatGPT, który ma raczej neutralny ton, Sesame potrafi oddać emocje i dostosować styl wypowiedzi do kontekstu.
- Dostępność językowa – największa wada Sesame AI dla polskich użytkowników to brak obsługi języka polskiego. Narzędzie działa wyłącznie w języku angielskim, co ogranicza jego potencjalną grupę odbiorców.
Czy Sesame AI to przyszłość interakcji z maszynami?
Sesame AI pokazuje, iż kluczem do naturalnych rozmów z AI nie jest tylko precyzja odpowiedzi, ale także niedoskonałość ludzkiej mowy. To właśnie te drobne „błędy” – zawahania, westchnienia, zmiany intonacji – sprawiają, iż użytkownicy odbierają rozmowę jako autentyczną.
Nie jest wykluczone, iż technologia ta znajdzie zastosowanie w obsłudze klienta, cyfrowych asystentach osobistych czy choćby w rozwoju AI w grach komputerowych. To krok w stronę bardziej naturalnej komunikacji między człowiekiem a sztuczną inteligencją.
Jednak czy Sesame rzeczywiście „zdetronizuje” ChatGPT? To zależy. jeżeli OpenAI wprowadzi podobne ulepszenia do swojego modelu, różnice mogą się zatrzeć. Na ten moment jednak Sesame AI jest najbardziej naturalnie brzmiącym asystentem głosowym, jaki kiedykolwiek powstał. Warto jednak szczerze zaznaczyć, iż w tej chwili trwa oblężenie strony Sesame i model ma spore opóźnienia w konwersacji oraz iż jest to tylko demo.
Jeśli chcesz przetestować, jak może brzmieć przyszłość interakcji z AI, warto wypróbować Sesame AI tutaj. Czy stanie się nowym standardem? Czas pokaże!