Projekt 2 - Klasifikace notových symbolů konvolučními neuronovými sítěmi (vedoucí O. Boštík)

Přiřazeno: Tilgner & Rejchlík

Zadání

Cílem projektu je v prvé části vytvořit napojení na anotovaný dataset MUSCIMA++[1], [2] a [3] tak, aby bylo možné využít data z tohoto datasetu v prostředí MATLAB pro další experimenty.

Hlavním cílem práce bude na základě literatury [4] a [5] provést klasifikaci hudebních symbolů z datasetu MUSCIMA++ a vyhodnotit úspěšnost klasifikace. Pro klasifikaci je nutné použít konvoluční neuronové sítě a další deep-learning techniky.

Hodnocení projektu bude na základě dosažených výsledků, aktivity v semestru a ústní obhajoby v závěru semestru.

Dílčími cíli projektu je: Software: Vstupy: Výstupy:

Obrazy

Obr 1: Ukázka vstupního datasetu MUSCIMA++ [2] a programu pro anotaci MUSICMarker [3]

Klíčová slova

Handwritten Music Recognition, Optical Music Recognition, Convolutional Neural Network, MUSCIMA++

Odkazy

[1] MUSCIMA++ official project page
[2] HAJIČ, Jan a Pavel PECINA. The MUSCIMA++ Dataset for Handwritten Optical Music Recognition. In: 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) [online]. 2017, s. 39–46. ISSN 2379-2140. Dostupné z: doi:10.1109/ICDAR.2017.16.
[3] HAJIČ, Jan a Pavel PECINA. Groundtruthing (Not Only) Music Notation with MUSICMarker: A Practical Overview. In: 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) [online]. 2017, s. 47–48. ISSN 2379-2140. Dostupné z: doi:10.1109/ICDAR.2017.271
[4] PACHA, A, K CHOI, B COUASNON, Y RICQUEBOURG, R ZANIBBI a H EIDENBERGER. Handwritten Music Object Detection: Open Issues and Baseline Results. In: 2018 13th IAPR International Workshop on Document Analysis Systems (DAS) [online]. 2018, s. 163–168. Dostupné z: doi:10.1109/DAS.2018.51
[5] CALVO-ZARAGOZA, Jorge, A GALLEGO a A PERTUSA. Recognition of Handwritten Music Symbols with Convolutional Neural Codes. In: 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR) [online]. 2017, s. 691–696. ISSN 2379-2140. Dostupné z: doi:10.1109/ICDAR.2017.118