Osnova MSTU

  1.  Strojové učení - základní přehled a terminologie. (Horák)

    • Aplikace strojového učení.
    • Základní přehled a terminologie.
  2.  Základy statistiky používané ve strojovém učení. (Horák)

    • Základní a výběrový soubor, normální a binomické rozložení, centrální limitní věta.
    • Podmíněná pravděpodobnost, sdružená pravděpodobnost, Bayesův vzorec.
    • Kovariance, korelace, regrese a testy.
  3.  Teorie informace - stručný úvod. (Horák)

    • Entropie, sdružená entropie, podmíněná entropie.
    • Množství informace, vzájemná informace, informační zisk.
  4.  Rozhodovací stromy. (Horák)

    • Terminologie rozhodovacích stromů, uzly, větve, hloubka, list, atribut.
    • Entropie uzlu, přeučený strom, prořezávání stromu.
    • Algoritmy automatického generování rozhodovacích stromů (ID3, C4.5 a CART).
    • Podmíněná entropie a informační zisk při tvorbě stromu.
  5.  Učení založené na instancích. (Klusáček)

    • Metriky, význam normalizace
    • k-NN model - vlastnosti, výhody, nevýhody
    • Prokletí dimenzionality (Curse of dimensionality) - Co to je a jak s ním bojovat
  6.  Chybové funkce. (Horák)

    • metoda nejmenších čtverců, absolutní a polynomická chyba
    • Huberova robustní chyba
    • minimalizace odchylky vs. maximalizace věrohodnosti
    čtyřpolní tabulka, nákladová matice
  7.  Odhad přesnosti modelu. (Horák)

    • Skutečná a trénovací chyba
    • Bootstrap a 0,632 bootstrap
    • Křížová validace
    • Kapacita funkce
  8.  Předzpracování dat. (Klusáček)

    • Účel předzpracování
    • Základní postupy: Filtrování dat, váhování dat, normalizace, selekce, transformace, generování
    • Selekce - Cíle, kriteriální funkce
    • Selekce - rozdělení (Podminěný/Nepodmíněný filter, Wrapper), rozdíly, vlastnosti
  9.  Bayesovské učení. (Horák)

    • Bayesův teorém, vzorec
    • Brutální Bayesovský klasifikátor
    • Maximální aposteriorní pravděpodobnost
    • Optimální Bayesovský klasifikátor
    • Naivní Bayesovký klasifikátor
  10.  Evoluční algoritmy. (Klusáček)

    • Základní pojmy
    • Definice genetického algoritmu (kódování, operátory, fitness funkce)
    • Definice genetických operátorů
    • Permutační úlohy
    • Genetické programování
  11.  Lineární modely, diskriminační analýza a podpůrné vektory. (Horák)

    • Regresní lineární model
    • Lineární model - klasifikace binární a vícerozměrná
    • Maskování třídy
    • Diskriminační analýza, LDA, QDA
    • Podpůrné vektory, jádrové funkce
  12.  Meta-učení. (Horák)

  13.  Shluková analýza. (Horák)

    • hierarchická a nehierarchická shluková analýza
    • normalizace veličin a metriky
    • dendrogram, aglomerativní metoda, nejbližší soused, k-means
    • Calinského a Harabaszova metoda optimálního počtu shluků