Microsoft ogłosił MAI-Image-1. Pierwszy, autorski model AI do generowania obrazów. Narzędzie, zaprojektowane z naciskiem na fotorealizm, zadebiutowało w pierwszej dziesiątce publicznego rankingu LMArena, plasując się obok istniejących już na rynku rozwiązań.
Microsoft zaprezentował MAI-Image-1, model zamiany tekstu na obraz, który został w całości opracowany przez wewnętrzny zespół Microsoft AI. Według deklaracji firmy, podczas prac nad narzędziem priorytetem było osiągnięcie wysokiego fotorealizmu i zrozumienia przez model złożonych poleceń tekstowych. W procesie trenowania brali udział specjaliści z branż kreatywnych, aby zapewnić, iż generowane obrazy będą bardziej zróżnicowane i lepiej oddadzą naturalne oświetlenie czy krajobrazy. Krok ten jest postrzegany jako dążenie firmy do posiadania w portfolio własnych, zaawansowanych modeli AI, niezależnych od technologii partnerów, takich jak OpenAI.
Wstępne wyniki modelu można ocenić na podstawie jego debiutu w rankingu LMArena, gdzie użytkownicy anonimowo porównują jakość obrazów z różnych generatorów. MAI-Image-1 zajął tam miejsce w pierwszej dziesiątce, wyprzedzając takie modele jak DALL-E czy Stable Diffusion, jednak wciąż plasując się za najnowszymi propozycjami od Google, w tym Imagen 4.0 Ultra. Według Microsoftu, model ma łączyć wysoką jakość generowanych obrazów z dużą szybkością działania, co ma być jego przewagą nad niektórymi konkurencyjnymi rozwiązaniami.

Na chwilę obecną MAI-Image-1 nie pozostało zintegrowany z produktami Microsoftu, takimi jak Copilot czy generator obrazów w wyszukiwarce Bing, ale firma zapowiada, iż nastąpi to wkrótce. Użytkownicy mogą testować jego możliwości na platformie LMArena. Microsoft nie podał jeszcze informacji na temat modelu cenowego dla swojego narzędzia. Dla kontekstu, obecne na rynku rozwiązania, takie jak DALL-E 3, oferują płatności za wygenerowany obraz (ok. $0,04-$0,08 przez API), a Midjourney działa w modelu subskrypcyjnym (od ok. $10 miesięcznie).








