Ocena stopnia powiązania kategorii to standardowa ludzka umiejętność, która ma fundamentalne znaczenie dla zdolności poznawczych. Jako, że głębokie sieci maja docelowo dorównać ludzkim zdolnościom, tradycyjne wskaźniki (np. dokładność) nie powinny być traktowane jako wystarczające kryterium, zapewniając ograniczony obraz skuteczności. Wskazując, jak często model przewiduje prawidłową etykietę, nie ujawniając postrzegania podobieństwa między kategoriami. Podobnie do ludzi, sieci mylą się zazwyczaj między kategoriami postrzeganymi jako podobne [1], więc analiza tych podobieństw może ujawnić, między jakimi klasami model będzie się mylił (lepiej gdy pomyłki odbywają się w obrębie podobnych niż niezwiązanych kategorii [3]). Stąd krytyczne jest badanie sieci z perspektywy postrzegania podobieństwa i jego zbieżności z ludzkim osądem. Temat ten jest w małym stopniu zbadany w literaturze (np. [1]). Celem projektu jest opracowanie metod oceny jakości wizyjnych sieci głębokich pod kątem zbieżności postrzeganego podobieństwa między klasami z relacjami semantycznymi podczas procesu trenowania. Metoda umożliwi testowanie modeli wykraczając ponad prostą dokładność, skutkując bardziej przewidywanymi decyzjami nawet w przypadku pomyłek oraz potencjalnie przyniesie dalsze korzyści (np. możliwość oceny efektywności wykorz. Zasobów – poprzez odwzorowanie struktury świata tak dokładnie, jak to możliwe m. in. Przez podobieństwa [2]). Opracowane metody wywrą pozytywny wpływ na interpretowalność testowania oraz zwiększenie zaufanie społeczeństwa do sztucznej inteligencji. Realizacja projektu obejmuje:
- przegląd dostępnych metod umożliwiających mierzenie podobieństwa miedzy kategoriami (1) postrzeganego przez sieci oraz (2) referencyjnego (np. relacje semantyczne w WordNet),
- opracowanie metod (1) ekstrakcji wzorców klas z wnętrza sieci wizyjnych, (2) wyznaczania macierzy podobieństwa,
- implementacja mechanizmów inspekcji zbieżności percepcji podobieństwa podczas trenowania,
- weryfikacja z wykorzystaniem sieci konwolucyjnych i transformersów wizyjnych.
W przeciwieństwie do innych prac badających postrzeganie przez sieci podobieństwa (np. [1]), w projekcie planowane jest wykorzystanie parametrów sieci do opisu znanych kategorii (tak jak metryka oceny ataków adwersarza w [3]), a nie macierzy pomyłek tworzonych na zbiorach danych dużej skali. Takie podejście umożliwia ocenę modeli bez wykorzystania zbiorów testowych, co umożliwia wykorzystanie metody już podczas procesu trenowania.
Przypisy:
[1] Bilal, Alsallakh, et al. „Do convolutional neural networks learn class hierarchy?.” IEEE transactions on visualization and computer graphics 24.1 (2017): 152-162
[2] Rosch, Eleanor, and Barbara B. Lloyd. “Cognition and categorization.” (1978)
[3] Katarzyna Filus, Joanna Domanska “NetSat: Network Saturation Adverarial Attack”. 2023 IEEE International Conference on Big Data (BigData).