Google prezentuje InkSight AI do odczytu manualnego pisma

sztucznainteligencjablog.pl 2 tygodni temu

Google Research pokazało nową metodę, dzięki której AI odczytuje pismo manualne, co może całkowicie odmienić sposób, w jaki przekształcamy nasze bazgroły na cyfrowe teksty. InkSight — bo o tym systemie mowa — zmienia zdjęcia manualnie napisanych słów na tekst cyfrowy, wykorzystując AI. Co ciekawe, nie wymaga to żadnych dodatkowych urządzeń pośredniczących.

Po lewej: pismo odręczne offline. Po prawej: pismo odręczne w formie cyfrowej. W każdym słowie kolory znaków zmieniają się z czerwonego na fioletowy, zgodnie z sekwencją tęczy, ROYGBIV. W każdym pociągnięciu pędzla odcień przechodzi od ciemniejszego do jaśniejszego.

AI zamiast tradycyjnego OCR

Typowe narzędzia OCR (Optical Character Recognition) mogą czasem zawodzić, szczególnie w nieidealnych warunkach. InkSight wprowadza nową jakość do tego procesu. Jak to działa? Zamiast tradycyjnej optycznej analizy, AI naśladuje ludzki sposób czytania, ucząc się wyglądu i znaczenia całych słów. To wymagało treningu AI, aby mogła nie tylko rozpoznawać, ale i naśladować ludzki charakter pisma.

Korzystając z metody łączącej umiejętności czytania i pisania, InkSight nie potrzebuje ogromnej ilości przerwanych próbek rękopisów, które często trudno zdobyć. Jednak skuteczność tego systemu robi wrażenie — aż 87% tekstów tworzonych przez InkSight jest czytelnych dla ludzkiego oka!

Przewagi InkSight w praktyce

Czym InkSight przewyższa OCR? choćby gdy zdjęcia są zrobione w słabym świetle, z częściowo zasłoniętym tekstem lub na skomplikowanych tłach, InkSight radzi sobie znacznie lepiej. Ludzie często nie są w stanie odróżnić rezultatów działania systemu od prawdziwego pisma.

Jeśli masz skłonność do chaotycznego pisania, tak jak ja, InkSight może okazać się zbawienny. Przykładowo, zapiski w notesie można łatwo sfotografować i natychmiast uczynić z nich cyfrowe, przeszukiwalne notatki. To także możliwość zabezpieczenia tekstów rękopiśmiennych sprzed wieków, które dzięki temu narzędziu mogłyby być przekształcone na cyfrowe informacje. Co bardziej ekscytujące, InkSight pomaga w zachowaniu wiedzy w językach, które nie mają jeszcze dużej obecności w świecie cyfrowym.

Alternatywne innowacje na rynku

InkSight nie jest jedynym narzędziem rozwijanym w tym kierunku. Na przykład, Amazon wprowadza Kindle Scribe, który rozwija możliwości przekształcania notatek na czytelne teksty. Goodnotes, aplikacja do cyfrowych notatek, również idzie z duchem czasu, oferując funkcje edytowania odręcznego pisma z wykorzystaniem technologii Goodnotes Smart Ink. Dzięki temu możesz modyfikować, kopiować i układać notatki niczym teksty drukowane.

Idź do oryginalnego materiału