W polskiej administracji wciąż brakuje procedur zarządzania jakością danych, które umożliwiłyby ich sprawne przetwarzanie oraz analizowanie. Dlaczego tak się dzieje? Barierą nie jest ani prawo, ani technologia – uważa dr inż. Kajetan Wojsyk, wykładowca, ekspert i praktyk w zakresie informatyzacji administracji publicznej, były pełnomocnik Ministra Zdrowia ds. otwartości danych publicznych. Rejestr Aptek, Rejestr Farmaceutów (i wiele innych) są pełne błędów, braków i niezgodności ze stanem faktycznym. Jaka jest tego przyczyna i jak sobie z tym poradzić?
– Ludzie często nie rozumieją i nie wiedzą, iż dobrze zastosowana informatyka polepsza jakość ich życia, zwiększa bezpieczeństwo. Trzeba im jednak pokazać, iż faktycznie tak jest – mówi Kajetan Wojsyk.
Brak kultury danych w Polsce
Zdaniem Kajetana Wojsyka efektywna digitalizacja może znacząco poprawić zarządzanie państwem. w tej chwili jednak w naszym kraju przez cały czas brakuje odpowiedniej kultury danych. Co to znaczy?
– Dobra jakość danych w rejestrach może pomóc lepiej zorganizować przepływ pieniędzy, przepływ materiałów, ludności – no i samych danych. Rządzący oraz ich doradcy powinni korzystać z danych z urzędu statystycznego jako źródła wiedzy o zachodzących zjawiskach, a przede wszystkim korzystać z danych opatrzonych przez GUS kodami. Można dzięki temu efektywniej zarządzać państwem i zwiększać jego bezpieczeństwo. Gdyby była na przykład potrzeba ratownictwa na większą skalę (a czasy mamy niespokojne), to mamy dzisiaj narzędzia gromadzenia, raportowania i analizy danych znacznie lepsze niż w czasie II wojny światowej. Ale nie umiemy z nich korzystać. Korzystamy z nich źle – ciągle “elektronizujemy papier”, odwzorowujemy dokumenty papierowe, zaśmiecamy systemy informacyjne – mówi Kajetan Wojsyk.
Problem ten, zdaniem eksperta, wynika z braku efektywnych procedur i tego, iż nie są wdrażane technologie, które pozwoliłyby na precyzyjne i bezbłędne zbieranie informacji oraz automatyczną kontrolę zmian wartości danych. To zaś ma bezpośredni wpływ na ograniczone możliwości ich efektywnego przetwarzania. Banki czy choćby galerie handlowe poradziły sobie z kontrolą danych, administracji publicznej wychodzi to o wiele gorzej.
– Nie ma prawnych barier przed wprowadzaniem nowych rozwiązań. Problemem jest to, iż nie domykamy cyklu Deminga, czyli zasady: po pierwsze zaprojektuj, po drugie wykonaj, po trzecie sprawdź, po czwarte popraw. Zatrzymujemy się na punkcie drugim. Brakuje kompetentnej kontroli technicznej naszych rozwiązań oraz narzędzi do automatycznej kontroli jakości danych – mówi Kajetan Wojsyk.
Dodatkowo, w polskiej administracji dostrzega on niedobór kompetencji cyfrowych wśród osób podejmujących decyzje, a także wśród szeregowych pracowników. To utrudnia odpowiednie zbieranie i wykorzystanie danych.
– Decydentom brakuje wiedzy i kompetencji technologicznych. Zastosowanie każdej technologii musi być celowe. Ale jeżeli nie rozumiemy tego celu lub nie wiemy jaka droga ma do niego prowadzić, to nie jesteśmy w stanie ocenić, co w takim procesie jest potrzebne, a co nie. Nie jesteśmy też w stanie sprawdzić, czy dane rozwiązanie dobrze ten cel realizuje – stwierdza.
O potrzebie kultury danych w twojej firmie piszę w artykule Czy Twoja firma potrzebuje data scientista? najważniejsze aspekty decyzji
Bez poprawnych rejestrów nie ma sprawnej administracji
Statystyka publiczna jest, przynajmniej w teorii, kluczowa dla zarządzania państwem. To na podstawie danych zbieranych przez instytucje publiczne, takie jak Główny Urząd Statystyczny (ale nie tylko, także przez administratorów rejestrów centralnych), powinny powstawać analizy, które z kolei administracja może przekładać na programy i polityki. Bez danych nie jest możliwe monitorowanie i ewaluacja skuteczności tych rozwiązań, a także – rozpoznawanie i reagowanie na zmieniające się potrzeby społeczno-gospodarcze.
Dobre dane sprzyjają przejrzystości i odpowiedzialności zarządzających. Pomagają gwałtownie identyfikować i reagować na kryzysy, takie jak pandemie czy katastrofy naturalne, umożliwiając efektywne zarządzanie ryzykiem i kryzysowe planowanie. Rzetelność i wiarygodność statystyk publicznych jest bezpośrednio zależna od jakości zawartych w nich danych.
Czy dane, którymi dysponuje polska administracja, są dobrej czy złej jakości? Kajetan Wojsyk przedstawił swoją diagnozę na przykładzie relatywnie prostych zbiorów dostępnych dla wszystkich – Centralnego Rejestru Farmaceutów i Rejestru Aptek.
– Rejestry powinny działać tak, by korzystający z nich miał pewność, iż kiedy tam sięga, znajduje prawdziwe informacje – mówi dr Wojsyk.
Swoje tezy o deficytach w polskiej administracji doktor Wojsyk popiera danymi. Prezentuje je w trakcie rozmowy dzięki napisanego przez siebie programu umożliwiającego analizowanie danych rejestrowych.
Na dzień naszego spotkania, tj. 21 marca 2024 r., w Rejestrze Aptek jedynie 52,38% podmiotów ma prawidłowo wprowadzony adres umożliwiający automatyczne znalezienie współrzędnych pozwalających na zlokalizowanie aptek na mapie. Pozostałych nie da się maszynowo zlokalizować na podstawie danych dostępnych w słownikach z uwagi na zafałszowane, w różny sposób zniekształcone dane.
Jak widać, ta sama nazwa ulicy jest wpisana na kilka różnych sposobów. Dla człowieka nie jest to wielki problem, ponieważ człowiek skojarzy, iż mimo różnych nazw (i kodów pocztowych, z których dwa pierwsze też są błędne) chodzi o tę samą ulicę. Jednak nie zawsze tak będzie.
Jeśli dane ma analizować komputer, to takie rozbieżności są często przeszkodą trudną do przeskoczenia. Na przykład w Warszawie istnieją dwie, odległe od siebie ulice o nazwie “ul. Wilanowska”, a także jeszcze inna “al. Aleja Wilanowska”. W przypadku wzywania pogotowia ratunkowego może się zdarzyć, iż ekipa ratunkowa pojedzie w miejsce inne niż miejsce wezwania.
Podobne błędy można znaleźć w Centralnym Rejestrze Farmaceutów. Na poniższym zrzucie ekranu widać nie tylko niejednolite używanie rozmiaru liter („ANNA” i „Anna” mogą być z punktu widzenia kodu dwoma różnymi słowami). W pierwszym wierszu w polu „Imię” wpisane jest… „Anna Łódź”. Można podejrzewać, iż przy wprowadzaniu danych “z palca” komuś pomyliły się rubryki lub w czasie importu danych zabrakło adekwatnego separatora we adekwatnym miejscu.
Warto zwrócić uwagę na czwartą kolumnę tej tabeli, gdzie wykazane są specjalizacje farmaceuty. Jedna z osób ma wpisaną dwukrotnie „Farmację apteczną”, co również jest niepoprawne.
Błędy w rejestrach to choroba. Zapobiegać czy leczyć?
Z czego wynikają takie nieprawidłowości? Dr Wojsyk wyjaśnia, iż problem tkwi w procedurze agregowania danych. Odbywa się ono poprzez zbieranie deklaracji składanych przez osoby, których dane dotyczą. Następnie odpowiednie organizacje (np. Izby Aptekarskie) wprowadzają je do systemu, ale – jak widać na przykładach – nie zawsze dbając o ich poprawność. Nie wynika to z niedbalstwa czy niestaranności, ale z braku odpowiednich zabezpieczeń i narzędzi kontroli jakości danych.
Następnie dane te są przekazywane do Centrum e-Zdrowia, które je przechowuje i udostępnia. Nie dokonuje jednak ich walidacji, ponieważ nie ma do tego odpowiedniego umocowania. Skutkuje to tym, iż błędy ludzkie, takie jak literówki czy wpisanie siedziby w błędną kolumnę, zostają zapisane w rejestrach publicznych i po prostu tkwią tam na stałe z uwagi na domniemywany prawny klincz.
– Prawo pozwala na wszelkie usprawnienia, wystarczy je adekwatnie interpretować. Jego rozwój idzie w stronę obniżania kosztów i przyspieszania procesów. Mamy dzisiaj technologie, mamy słowniki, rejestry, kody. o ile stworzymy odpowiedni ciąg technologiczny, systemy informatyczne mogą skutecznie kontrolować jakość danych i zabezpieczać przed błędami – mówi dr Wojsyk.
Gdyby np. w przypadku Rejestru Farmaceutów zbierane dane podlegały audytowi i sprawdzaniu, możliwe byłoby delegowanie przez organy rejestrowe zadań związanych z uzupełnianiem i korygowaniem błędów do Centrum e-Zdrowia. Wymaga to jedynie porozumień i wdrażania procedur, które umożliwią kontrolę jakości danych.
– Potrzebna jest kompetentna i automatyczna kontrola jakości danych z poziomu organów rejestrowych umożliwiająca wskazanie błędów oraz poprawę tych danych u źródła – tłumaczy ekspert.
Naprawa musi odbywać się u źródła
Farmaceuci, którzy błędnie zadeklarowali dane, nie zdają sobie sprawy z własnych omyłek, więc nie mają ani wiedzy, ani narzędzi, by te dane poprawiać. Informatyzacja procesów zarządzania danymi pozwala te dane wyłapywać, a także może służyć jako środek prewencyjny przed wprowadzaniem błędnych danych już na etapie ich tworzenia.
Gromadzenie danych musi być celowe, a nie podyktowane jedynie zwyczajem ich zbierania czy przypuszczeniami o ich przydatności.
– Nie chodzi o to, żeby zbierać jak najwięcej danych. Chodzi o to, żeby to, co jest gromadzone, zawierało jak najwięcej informacji służących konkretnemu celowi – mówi dr Wojsyk.
Równie ważne jest zapewnienie ciągłej kontroli nad poprawnością i kompletnością zbieranych informacji. Nie chodzi tu tylko o automatyzację zbierania danych, ale również o zapewnienie mechanizmów, które na bieżąco będą weryfikować ich jakość. To tak zwane walidatory umożliwiające sprawdzenie kompletności danych, ich poprawności formalnej i merytorycznej, a także standaryzację formatów danych.
– w tej chwili systemy informatyczne pozwalają na wprowadzanie błędnych danych w rejestrach. Powinniśmy zacząć tworzyć te systemy w taki sposób, by wnioskodawcy nie mogli w ogóle tych błędów popełniać – postuluje Wojsyk.
Istotnym elementem jest również używanie określonych, standardowych kodów i identyfikatorów. Te już istnieją od wielu lat, ponieważ wymagają tego regulacje dotyczące interoperacyjności i standardów rejestrów publicznych.
Zbieranie tylko niezbędnych danych, ale wysyconych użytecznością, tworzy systemy, które są tańsze w utrzymaniu i dające konkretne korzyści. Stosowanie istniejących już kodów umożliwia interoperacyjność systemów administracji publicznej, co rodzi potencjał na ich wszechstronne i skuteczne przetwarzanie.
Dobra infrastruktura IT pomoże
Efektywna informatyzacja ma za zadanie ułatwiać pracę ludzi, co wymaga jednak odpowiednio zaprojektowanego systemu zarządzania danymi. Z poziomu budowy systemu informatycznego można ustrzec się przed wieloma błędami, które wynikają z ludzkich niedopatrzeń.
W przypadku wszelkich rejestrów zawierających dane adresowe lub inne dane kodowane, zamiast manualnego wpisywania danych na temat miejscowości, można byłoby zastosować rozwijane listy. To sprawiłoby, iż niemożliwe byłoby wpisanie w kolumnę “Miejscowość” imienia lub wprowadzenia nazwy miejscowości z błędem. W celu ujednolicenia zapisu można byłoby ustalić system zapisu imion i nazwisk, np. na wyłącznie te zapisane wielką literą. Rozwiązanie takie wymaga jedynie zastosowania automatycznej korekty.
Te rozwiązania nie są ani skomplikowane, ani bardzo odkrywcze. Wiele z nich z powodzeniem funkcjonuje w innych systemach, jednak brakuje świadomości, iż można je wykorzystywać.
W przypadku adresów nie trzeba wymyślać koła na nowo. Polska administracja dysponuje systemem adresu uniwersalnego. Do jego opracowania przyczynił się właśnie dr Wojsyk. Tak jak PESEL dla osób fizycznych i jak REGON dla osób prawnych, tak adres uniwersalny jest zakodowanym dla potrzeb maszynowego przetwarzania danych identyfikatorem punktów adresowych. Opis można znaleźć na stronie Centrum e-Zdrowia.
Zbiór wszystkich punktów adresowych w Polsce jest codziennie aktualizowany i dostępny publicznie. Nie ma teoretycznie żadnych przeszkód technicznych ani prawnych, by do wprowadzania danych przez farmaceutów wykorzystywać walidator oparty na adresie uniwersalnym. Wykorzystanie tego kodu umożliwiłoby nie tylko zapewnienie spójności i poprawności danych, ale także wykrywanie wszelkich innych zmian w rejestrze.
Dzięki zachowaniu tego standardu interoperacyjności możliwa byłaby też analiza z wykorzystaniem innych zbiorów danych, które także opisują lokalizacje dzięki adresu uniwersalnego.
Rejestr Farmaceutów i Rejestr Aptek to wierzchołek góry lodowej
Rozwój i wdrażanie rozwiązań informatycznych, choć to działania technologicznie zaawansowane, to tylko połowa sukcesu w cyfryzacji. Istotną rolę odgrywa świadomość i zaangażowanie zarówno decydentów, jak i użytkowników końcowych. A to wymaga kompetencji cyfrowych, których w Polsce brakuje. Brak tych umiejętności nie tylko utrudnia efektywne wykorzystanie dostępnych technologii, ale także powoduje opór przed ich wdrażaniem i adaptacją.
O braku kompetencji cyfrowych w polskim społeczeństwie piszę w artykule Kto bada e-zdrowie? Co wiemy o skutkach cyfryzacji w opiece zdrowotnej?
Dr inż. Kajetan Wojsyk – wykładowca, ekspert i praktyk w zakresie informatyzacji administracji publicznej, były pełnomocnik Ministra Zdrowia ds. otwartości danych publicznych. W 1994 r. zaczął pracę w samorządzie Częstochowy, gdzie kierował zespołem odpowiedzialnym za cyfryzację Urzędu Miasta. Za działalność na rzecz budowy sieci informatycznych i rozwiązań dla administracji publicznej otrzymał Srebrny Krzyż Zasługi.
Od 2010 r. pracował w Centrum Systemów Informacyjnych Ochrony Zdrowia (obecnie Centrum e-Zdrowia), czyli państwowej instytucji odpowiedzialnej za informatyzację usług opieki zdrowotnej, gdzie sprawował funkcje m.in. zastępcy dyrektora oraz eksperta ds. jakości danych. Do 2021 r. był pełnomocnikiem Ministra Zdrowia ds. otwartości danych publicznych.
Źródło zdjęcia głównego: archiwum prywatne, Kajetan Wojsyk