Problem kontroli treści internetowych – czy to na potrzeby kontroli rodzicielskiej czy też zapobiegania cyberslackingowi w korporacji – jest „starszy niż internet”. Udział mediów społecznościowych (Facebook, Twitter, Instagram, etc.) w tradycyjnych ruchu internetowym jest znaczący, a jednocześnie może zawierać treści o dowolnej tematyce. W ramach wystąpienia opowiemy o tym jak udało nam się rozwiązać problemy związane z kategoryzacją stron internetowych w czasie rzeczywistym i wdrożyć dla NASK rozwiązanie chroniące polskich uczniów. Odpowiemy na pytania: Jak radzić sobie z parsowaniem stron? Jakie zmienne brać do modelowania? Które algorytmy wykorzystać i jak się do tego mają LLMy? Jak skategoryzować cały internet?
Dowiedz się więcej na: @