Czy LLMy zatrzymały postęp w computer vision – Marianna Parzych – deepsense.ai

nieliniowy.pl 8 miesięcy temu


Rozmawiam z Marianną Parzych z Deepsense.ai
Poruszamy takie tematy jak :

– reakcje ludzi na grafiki generowane przez AI
– mody na LLM i powrotu wizji komputerowej do łask
– nowości w wizji komputerowej
– różnice między teorią a praktyką w wykorzystaniu modeli CV
– nowa wersja modelu Yolo
– ograniczenia vs. możliwości generatywnego AI
– halucynacje modeli graficznych
– wiarygodność tworzonych obrazów
– upscalery (zwiększanie rozdzielczości)
– zmiany w percepcji AI przez społeczeństwo
– absurdalnego tempa w poprawianiu jakości grafik AI
– częściowego znieczulenia publiczności na grafiki AI
– różnice między prezentacjami a rzeczywistym użyciem AI
– jakość i percepcja grafik generowanych przez AI
– przyszłość generatywnego AI i jego wpływ na różne sektory
– aktualne trendy i potrzeby rynku w kontekście modeli AI


Jak znaleźć Mariannę:
https://www.linkedin.com/in/marianna-parzych-dsp/

Modele, o których rozmawiamy:
SAM: https://segment-anything.com
DINOv2: https://dinov2.metademolab.com
LLaVa: https://llava-vl.github.io

YOLO-NAS: https://github.com/Deci-AI/super-gradients/blob/master/YOLONAS.md

Gaussian Splatting:
https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
LLM-aided visual reasoning: ViperGPT: https://viper.cs.columbia.edu

Idź do oryginalnego materiału