Aktualności

Wyróżnienie w konkursie Time-Quality Document Image Binarization na konferencji ICDAR 2021 20.09.2021 09:40

 

W dniach 5-10 września 2021 r. w Lozannie odbyła się 16. edycja wiodącej międzynarodowej konferencji z zakresu analizy i rozpoznawania dokumentów ICDAR (International Conference on Document Analysis and Recognition), podczas której zorganizowany został konkurs na najwydajniejszy algorytm binaryzacji obrazów przedstawiających częściowo zniszczone dokumenty historyczne. Celem konkursu ICDAR 2021 Competition on Time-Quality Document Image Binarization było wyróżnienie najlepszych metod binaryzacji łączących ze sobą szybkość działania oraz jakość uzyskiwanych wyników. Ze względu na zbliżoną dokładność uzyskiwaną przez wiele algorytmów o różnej złożoności obliczeniowej, w tym roku organizatorzy konkursu położyli szczególny nacisk na czas przetwarzania obrazu.

Wśród zgłoszonych przez 7 zespołów z całego świata 12 nowych metod, porównywanych z 49 wcześniej opublikowanymi, znalazły się trzy algorytmy opracowane w Katedrze Przetwarzania Sygnałów i Inżynierii Multimedialnej przez doktoranta Wydziału Elektrycznego mgr. inż. Huberta Michalaka, przygotowującego rozprawę doktorską z zakresu przetwarzania wstępnego obrazów na potrzeby automatycznego rozpoznawania znaków, której promotorem jest dr hab. inż. Krzysztof Okarma, prof. ZUT.

Jak wynika z opublikowanych w materiałach konferencyjnych podsumowania wyników, dwa spośród trzech zaproponowanych algorytmów znalazły się wśród najlepszych dla aż trzech z pięciu baz testowych. Ponadto jedna ze zgłoszonych do konkursu metod okazała się zdecydowanie najszybsza, osiągając średni czas przetwarzania znacznie krótszy od konkurencyjnych metod zapewniających zbliżoną dokładność binaryzacji ("Michalak21_1 was the fastest of the ranked new algorithms competing this year"). Metoda ta wykorzystuje wstępne przeskalowanie obrazu w celu oszacowania ogólnego rozkładu jasności, umożliwiając w kolejnych krokach estymację oraz odfiltrowanie tła obrazu i zwiększenie kontrastu, co prowadzi do znaczącej poprawy wyników binaryzacji w porównaniu z klasycznymi metodami.