Microsoft ogłosił Phi-4-reasoning. Model ma zapewniać wysoką wydajność w złożonych zadaniach

chip.pl 1 tydzień temu
Zdjęcie: Phi-4


Phi-4-reasoning to 14-B-parametrowy model “małego rozumowania”. Microsoft wytrenował go poprzez nadzorowane dostrajanie Phi-4 na wyselekcjonowanym zestawie nauczalnych monitów generowanych dzięki o3-mini. Microsoft wprowadził również Phi-4-reasoning-plus, 14-B-parametrowy wariant Phi-4-reasoning, który zapewnia jeszcze lepszą wydajność poprzez generowanie dłuższych śladów rozumowania. Według Microsoftu, te nowe modele Phi-4-reasoning przewyższają kilka większych modeli open-weight, takich jak DeepSeek-R1-Distill-Llama-70B, a choćby […]
Idź do oryginalnego materiału