Deepseek: Witamy w Sputnik Moment Sputnik sztucznej inteligencji

cyberfeed.pl 2 tygodni temu

Po wprowadzeniu najnowszego modelu dużego języka (LLM) z Deepseek, ChatgptNowy rywal Artificial Intelligence (AI) znalazł się na szczycie Apple App Store do pobierania iPhone’a.

Deepseek R1 LLM jest open source i wykorzystuje rozumowanie w połączeniu z tym, co firma nazywa „danymi na zimno start”, co oznacza, iż zamiast trrawerować w Internecie i serwisach społecznościowych w celu gromadzenia ogromnych ilości danych uczenia maszynowego, zamiast tego opiera się na wzmocnionym uczeniu się poprawić dokładność.

Na jego Strona githubtwórcy Deepseek opisują R1 jako naukę wzmacniającą na dużą skalę w modelu podstawowym. „Bezpośrednio stosujemy uczenie się wzmocnienia do modelu podstawowego, nie opierając się na nadzorowanym dostrajaniu jako wstępnym etapie”, mówi. „To podejście pozwala modelowi zbadać łańcuch myślenia w celu rozwiązywania złożonych problemów”.

Szacuje się, iż 2,1 miliona wyszukiwań Deepseek odnotowano w weekend, a co najmniej 1,6 miliona z nich w samym niedzielę 26 stycznia. To 12,3% 13 milionów wyszukiwań Chatgpt w tym samym czasie.

Oprócz przyjęcia innego podejścia do Chatgpt, zainteresowanie Deepseek jest również napędzane przez konkurencyjne ceny i fakt, iż kod jest open source.

Podczas OpenaiTwórca Chatgpt, pobiera 2,50 USD za milion tokenów wejściowych za model GPT-4O, Deepseek IS wyceniony na 0,14 USD za milion Tokeny wejściowe w sytuacjach, w których silnik AI może czerpać z wcześniej buforowanych informacji. Nieprzestrzegane dane wejściowe kosztują 0,55 USD za milion tokenów.

Zakres Zainteresowanie AI z chińskiej firmy spowodowało zamieszanie w wycenie zapasów technologicznych w USA. Reuters poinformował, iż Nvidia odnotowało spadek ceny akcji o 17%, co skutecznie wyczyściło 593 mld USD od wyceny rynkowej.

Polecenie budzenia

W przemówieniu w poniedziałek prezydent USA Donald Trump opisał Deepseek jako pobudkę dla amerykańskiego sektora technologicznego.

Wśród licznych podmiotów Trump mówił w swoim przemówieniu do członków Partii Republikańskiej Kongresu, były nakazy wykonawcze cofające przepisy AI przedstawione przez byłego prezydenta Joe Bidena. „Nie chcemy, aby jakikolwiek przyszły prezydent kiedykolwiek sabotował naszą gospodarkę z przepisami poza kontrolą”-powiedział. „W zeszłym tygodniu podpisałem zamówienie cofającego destrukcyjne przepisy Joe Bidena sztucznej inteligencji, aby firmy AI po raz kolejny mogły skoncentrować się na byciu najlepszym, a nie tylko bycia najbardziej obudzonym”.

Następnie odniósł się do Deepseek, gdy kontynuował mówienie o tym, dlaczego deregulacja jest ważna dla AI w USA. „Dzisiaj i w ciągu ostatnich kilku dni czytałem o Chinach i [one Chinese company] W szczególności wymyślanie szybszej metody AI i znacznie tańszej metody. Mamy nadzieję, iż wydanie Deepseek AI z chińskiej firmy powinno być pobudkowym wezwaniem dla naszych branż, które musimy być skoncentrowane na laserowym konkursie o wygraną. ”

Deweloperzy Deepseek byli w stanie połączyć najnowocześniejsze algorytmy, aby zmniejszyć wymagania energetyczne szkolenia i wdrażania AI. W swoim przemówieniu Trump opisał, co Deepseek osiągnął jako „dobre”, ponieważ firmy mające na celu opracowanie aplikacji AI, które korzystają z Deepseek, nie muszą wydawać tyle pieniędzy w porównaniu z rywalizującymi LLM. „Uważam to za pozytywny, jako atut” – dodał.

Komentując, co rozwój Deepseek miał na rynkach finansowych, Charu Chanana, główny strateg inwestycyjny na platformie inwestycyjnej Saxo, zwrócił uwagę, iż Deepsseek zajęło tylko dwa miesiące i zbudować mniej niż 6 mln USD, przy użyciu układów o zmniejszonej zdolności z NVIDIA nazywanej H800s. Jest to znaczące, biorąc pod uwagę, iż administracja Biden zakazała eksportu wysokiej klasy procesorów graficznych NVIDIA (GPU) do Chin w 2023 r.

„Amerykańskie firmy technologiczne handlują w wycenach premium, a główni gracze AI, takimi jak Nvidia, Microsoft i Alphabet, dowodzą P/E [price to earnings] mnożą znacznie powyżej średnich historycznych – powiedziała. „Przy tych akcjach wycenionych na doskonałość, choćby niewielkie zakłócenia, takie jak Deepseek udowadniające, iż zaawansowane AI można zbudować bez żetonów najwyższego poziomu, mogą mocno ważyć ceny akcji. W szczególności w przypadku NVIDIA jego rola jako kluczowego dostawcy układów AI sprawia, iż jest podatny na podatność, jeżeli popyt na wysokiej klasy produkty zanika. ”

Pomysł Niższe i bardziej energooszczędne AI Wydaje się, iż z Deepseek ma natychmiastowy wpływ zarówno na amerykański gigantów technologicznych, jak i na sektor energetyczny, który zasadził rozwój zużycia energii z AI.

„Przełomowy przełom Deepseek sygnalizuje zmianę wydajności w sztucznej inteligencji, która na nowo zdefiniuje zarówno rynki energii, jak i AI”, powiedział Nigel Green, dyrektor generalny Global Financial Advisory Giant Devere Group. „Możliwości dla inwestorów chętnych do działania są ogromne.

„To kwestionuje założenie, iż wzrost AI jest powiązany ze stale rosnącym zużyciem energii. Podczas gdy rynek reaguje na krótkoterminową niepewność, modele AI oparte na wydajności rozszerzy przyjęcie na nowe rynki i branże. Oznacza to bardziej powszechne wykorzystanie, głębszą integrację, a ostatecznie trwałe zapotrzebowanie na rozwiązania energetyczne. ”

Prawdopodobnie jest to fakt, iż DeepMind był w stanie osiągnąć wyniki dzięki gorszego sprzętu i zaoferować swoją LLM po wysoce konkurencyjnej cenie, która ma zmienić podejście każdej organizacji na sztuczną inteligencję: niekoniecznie wymaga rzucania ogromnych ilości kosztownych procesorów graficznych w Sprzęt i konieczność odzyskania tych kosztów, obciążając użytkowników końcowych premii.

„Opracowując najnowocześniejsze generatywne modele AI bez polegania na najnowszym, najdroższym sprzęcie, Deepseek wykazał, iż zwinność i strategia mogą wyprzedzić surową moc obliczeniową”, powiedział Kjell Carlsson, szef strategii AI w Domino Data Lab. „Ich osiągnięcia podkreślają również podatność obecnych obecnych w przestrzeni generatywnej AI-udowadniając, iż innowacje open source przez cały czas są potężnym korektorem, umożliwiając pretendentom dopasowanie, a choćby przekraczanie uznanych graczy w rewolucję”.

Oznacza to, iż Deepseek oznacza chińską konkurencję z istniejącymi modelami AI Doliny Krzemowej. Michael Guan, CEO Final Round AI, powiedział, iż model cen jest opłacalny, w przeciwieństwie do modeli, które oferuje wiele innych organizacji AI. „Jego kod jest również open source” – dodał. „Jest to bardzo niekonwencjonalne, ponieważ firmy mają tendencję do utrzymywania kodu za najnowszymi modelami, ściśle strzeżoną tajemnicą”.

Source link

Idź do oryginalnego materiału