Projekt 5 - Predikce hodnot datového setu aplikací RapidMiner (vedoucí K. Horák)

Zadání

Pomocí nástroje RapidMiner Studio v jeho neplacené verzi analyzujte předložená trénovací data, proveďte návrh modelu a použijte jej pro predikci na testovacích datech. Pro finální navržený model najděte v prostředí Matlab (Machine Learning Toolbox) nejvhodnější implementaci a model ověřte na stejných datech skriptem. Zadání bodově:

  • na základě trénovacích dat vytvořte model (p5-trainSTU-2016.csv)
  • navržený model použijte na klasifikaci testovacích dat (p5-testSTU-2016.csv)
  • pro vámi navržený model v aplikaci RapidMiner najděte vhodnou implementaci v prostředí Matlab
  • proveďte simulaci modelu v Matlabu na stejných testovacích datech
  • elektronicky odevzdejte v txt souboru predikce získané na testovacích datech (sloupec čísel)
  • zpracujte kompletní dokumentaci postupu a prováděných experimentů včetně grafů, tabulek apod. (rozsah 5-10 stran)

Pro seznámení se s prostředím RapidMiner využijte tutoriály na webových stránkách [1] a s Machine Learning Toolboxem Matlabu zdroj [2].

Pro přiblížení postupu při zpracování projektu v RapidMineru můžete použít starší materiály Dr. Honzíka: první experiment, křížová validace a tipy v RapidMineru.

Klíčová slova

Analýza dat, RapidMiner, Matlab, modelování, predikce.

Odkazy

[1] RapidMiner: RapidMiner HomePage
[2] Matlab: Machine Learning with MATLAB