Think Tank ds. zrównoważonego rozwoju IT: W jaki sposób technologie sztucznej inteligencji w chmurze mogą pomóc przedsiębiorstwom stać się ekologicznymi

cyberfeed.pl 2 miesięcy temu


Rząd Wielkiej Brytanii stara się proaktywnie podchodzić do kwestii zmiany klimatu, zobowiązując się do ambitnych celów, takich jak redukcja emisji gazów cieplarnianych o co najmniej 68% do 2030 r. w porównaniu z poziomami z 1990 r. i osiągnięcie zerowej emisji netto do 2050 r.

W celu wsparcia tych celów na pierwszy plan wysuną się obowiązki, ponieważ organizacje będą rozwijać i wykorzystywać usługi sztucznej inteligencji (AI) we współpracy z dostawcy chmuryktóra w tej chwili obsługuje większość rozwiązań technologii AI.

Chociaż sztuczna inteligencja w chmurze może przyspieszyć dostarczanie Sztuczna inteligencja możliwości, wymagania, zwłaszcza ze strony generatywnej AI (GenAI), mogą pochłaniać ogromne ilości energii i innych zasobów. Tak więc, oprócz oceny dostawców chmury pod kątem ich możliwości AI, ich zrównoważony rozwój Przy dokonywaniu wyboru priorytetem jest postawa.

Podstawą jest kooperacja wyłącznie z dostawcami usług w chmurze, którzy udowodnili zaangażowanie w zrównoważony rozwój – ale to dopiero początek. Podczas wdrażania aplikacji GenAI istnieje szereg najlepszych praktyk w zakresie zrównoważonego rozwoju i optymalizacji, które mogą złagodzić wiele wpływ na środowisko korzystania z platform AI w chmurze.

Zwiększanie wykorzystania energii odnawialnej

Jeśli to możliwe, korzystaj wyłącznie z usług GenAI opartych na chmurze, które są zasilane energią odnawialną. Zrównoważeni dostawcy chmury udostępniają statystyki dotyczące energii odnawialnej dla wszystkich regionu chmury i konkretnych centrów danych w chmurze. Uważaj jednak na greenwashing, który zaciemnia źródła energii zasilającej centra danych w chmurze.

Niektórzy dostawcy usług w chmurze osiągają swoje cele „100% energii odnawialnej” poprzez wykorzystanie certyfikatów energii odnawialnej. Używaj tych centrów danych w chmurze wyłącznie jako opcji zapasowej, a nie jako podstawowego rozwiązania dostępu do energii odnawialnej.

Zminimalizuj zużycie energii

Rozmieszczenie obciążeń uwzględniające zużycie energii i harmonogramowanie zadań może zapewnić, iż obciążenia AI w chmurze będą działać w centrach danych, które najprawdopodobniej będą działać w sposób zrównoważony. Wybierz również centra danych w chmurze, które wykorzystują energię w sposób efektywny.

Sprawdź ocenę efektywności wykorzystania energii (PUE) dla usług w chmurze ogólnie i centrów danych w chmurze w szczególności. Oceny PUE powinny być jak najbliższe 1,0. Większość centrów danych w chmurze ma oceny PUE między 1,1 a 1,5.

Odpowiedni rozmiar do wykorzystania zasobów w chmurze

Lepsza optymalizacja chmury poprzez monitorowanie i raportowanie korzystania z usług; kontrolowanie nieautoryzowanego lub niezamierzonego użycia; adekwatne skalowanie zasobów chmury; skalowanie w górę i w dół zasobów w razie potrzeby. Korzystanie z technik GenAI, takich jak dostęp oparty na API do dużych modeli językowych (LLM), jest również skutecznym środkiem optymalizacji.

Należy jednak pamiętać, iż zwiększona dostępność i przystępny koszt AI, a konkretnie GenAI, mogą prowadzić do nadużywania. Optymalizacja zasobów w chmurze musi obejmować zasady zarządzania, aby zarządzać ostrożnym i odpowiedzialnym korzystaniem z technologii GenAI.

Wdróż sprzęt zoptymalizowany pod kątem sztucznej inteligencji

Dostawcy usług w chmurze coraz częściej używają specjalistycznego sprzętu do obciążeń AI, który jest często zoptymalizowany pod kątem zużycia energii również dla AI. Należą do nich systemy DGX firmy NVIDIA, procesory Trainium i Inferentia firmy Amazon Web Services (AWS), jednostki przetwarzania Tensor firmy Google oraz niedawno ogłoszone chipsety Microsoft Azure Maia.

Wiodący dostawcy usług w chmurze oferują ten specjalistyczny sprzęt w postaci wyznaczonych typów instancji AI, które po wybraniu mogą zapewnić wiele korzyści, w tym lepszą cenę i wydajność oraz niższe zużycie energii.

Zarządzaj odpowiednio przechowywaniem danych

Przechowywanie danych jest niedrogie i łatwe w użyciu, co doprowadziło do szerokiego rozprzestrzeniania i replikacji danych. Podczas gdy usuwanie niepotrzebnych danych będzie miało pewne korzyści dla zrównoważonego rozwoju, aktywne używanie i zarządzanie danymi może zużywać niepotrzebną energię.

Zrównoważona strategia obejmuje eliminację danych, które nie mają żadnej wartości dla organizacji i wybór najefektywniejszych typów technologii przechowywania dla różnych form danych. Obejmuje ona również korzystanie z pamięci masowej offline, gdy jest to możliwe; wdrażanie zasad zarządzania danymi; przechowywanie danych blisko aplikacji i procesów uzyskujących do nich dostęp; i minimalizowanie replikacji danych.

Zminimalizuj ruch danych

Zwiększone wykorzystanie sieci poprzez przenoszenie dużych zestawów danych między centrami danych może zwiększyć zużycie energii. Najlepszym podejściem do zminimalizowania tego jest zestawienie danych wspierających AI z procesami i aplikacjami modelowania AI.

Możliwości sieciowe cross-cloud, w tym korzystanie z usług sieciowych dostawcy chmury, mogą zminimalizować ruch danych. Kiedy dane muszą być transportowane przez sieci, najbardziej zrównoważonym podejściem jest upewnienie się, iż wysyłane są tylko niezbędne dane.

Ustanów zrównoważoną architekturę aplikacji

Aplikacje będą coraz częściej zawierać możliwości GenAI, ale nie bez potencjalnego ryzyka wprowadzenia nieefektywności. Podczas projektowania aplikacji należy pamiętać, iż działania wnioskowania AI będą zużywać więcej energii niż szkolenie modelu AI.

Aby zoptymalizować wnioskowanie AI, należy stosować mniejsze modele wnioskowania w celu ograniczenia wykorzystania pamięci, korzystać ze sprzętu i akceleratorów zoptymalizowanych pod kątem wnioskowania oraz stosować rozproszone punkty dostępu w celu umieszczenia modeli AI bliżej punktu użytkowania aplikacji.

Przyjmij IT poza godzinami pracy

Procesy GenAI są energochłonne, więc oprócz czystych źródeł energii należy wziąć pod uwagę ogólną dostępność energii. Niektóre regiony geograficzne są już ograniczone energetycznie, a dodanie dodatkowych, energochłonnych operacji może przeciążyć te systemy.

Centra danych w chmurze mogą mieć większy dostęp do tańszej, zielonej energii poza godzinami szczytu. Zastosuj strategie rozmieszczania obciążeń AI, aby skorzystać z dostępności energii w różnych lokalizacjach.

Strojenie modeli AI

Dostawcy usług w chmurze inwestują w tej chwili miliardy w podstawowe modele LLM (Large Language Models), aby wspierać rozwiązania GenAI ogólnego przeznaczenia. Podczas gdy niektóre LLM mogą wymagać zbudowania od podstaw, najpierw staraj się używać tych podstawowych LLM.

Stosowanie technik, takich jak dostrajanie, może pomóc osiągnąć większą dokładność przy użyciu istniejących LLM. Inne techniki, takie jak szybka inżynieriamoże również prowadzić do lepszego wykorzystania zasobów przy jednoczesnym ograniczeniu zużycia energii.



Source link

Idź do oryginalnego materiału