Projekt 2 - Predikce hodnocení filmů (vedoucí O. Boštík)

Zadání

Cílem projektu je navrhnout vhodný model pro predikci hodnocení nových filmů na veřejných internetových databázích. Pro účely naučení klasifikátorů musí být pořízena galerie metadat filmů (povinně název filmu, rok a hodnocení) a vhodných příznaků o dostatečném rozsahu (zvolit vhodné ukazatele, jako například herce, režiséra apod). Galerie musí být dostatečně obsáhlá a musí být jednoduché jí doplnit o další filmy. Pro účely získání metadat musí být vytvořen program pro automatickou extrakci zvolených příznaků. Galerie nesmí obsahovat nejnovější filmy (uvedení v kinech v listopadu a prosinci 2017).

Ve druhé fázi je nutné vybrat 3 metody pro predikci hodnocení. Vybrané metody implementujte a otestujte. Následně naučte klasifikátory na dodaná data. Získaná data zhodnoťte například metodou cross-validate. Vytvořte program, který po zadání URL filmu v rámci použité databáze automaticky stáhne potřebná data, provede predikci a výsledky zobrazí uživateli. Pokud tento film byl již k použit k naučení, uživatel bude na tuto skutečnost upozorněn. Pokud film již má hodnocení, program porovná výsledky predikce se skutečností (predikce však nesmí brát skutečné hodnocení v potaz).

Hodnocení bude na základě dokumentace, funkčnosti programu, dodané galerii a praktickém predikci hodnocení nových filmů.

Software:
  • Libovolný, doporučené je však prostředí Matlab
Vstupy: Výstupy:
  • Databáze metadat filmů
  • Aplikace a naučený model
  • Dokumetace

Klíčová slova

-