Duże modele języka (takie jak ChatGPT) na dobre wkroczyły do naszego codziennego życia. Jednakże ich złożoność i koszt stanowi barierę dla ich szerokiego wdrożenia w serwisach internetowych. Jak zatem kręcić modele równie dobre jak SOTA, nie wydając na to miliona monet? Opowiemy Wam o tym na przykładzie trzech modeli wdrożonych na platformie Allegro: tłumaczenie maszynowe, wykrywanie intencji wiadomości i ekstrakcja atrybutów z opisów.
O prelegentach:
Aleksandra Osowska-Kurczab
Pracuje jako Senior Research Engineer w Allegro. Wraz z zespołem, na codzień rozwija i wdraża wielkoskalowe systemy rekomendacyjne pomagające klientom Allegro przeszukiwać nasz ogromny katalog produktów. Po godzinach kończy doktorat z informatyki na Politechnice Warszawskiej, w którym zajmuje się wsparciem diagnostyki obrazowej nowotworów przy pomocy uczenia głębokiego.
Jacek Szczerbiński
Z wykształcenia jest fizykiem, zaś z pasji inżynierem uczenia maszynowego. Obroniwszy doktorat na Wydziale Chemii ETH Zurich, został inżynierem badań w Allegro. w tej chwili buduje katalog produktów oraz pracuje nad odpornością klasyfikatorów tekstu na błędnie oznaczone dane treningowe.
Obserwuj społeczność Allegro Tech online:
➡ odwiedź Allegro Tech Blog: https://blog.allegro.tech/
➡ posłuchaj Allegro Tech Podcast: https://podcast.allegro.tech/
➡ dołącz do Allegro Tech na platformie Meetup: https://www.meetup.com/pl-PL/allegrotech/
➡ obserwuj nas na Facebooku: https://www.facebook.com/allegro.tech
➡ sprawdź nas na: https://github.com/Allegro