Strojové učení - úvod do regrese
Co bych měla po této hodině znát?
- Úlohy, které řešíme pomocí strojového učení, nemívají jedno řešení.
 
- Vzorky na, kterých model (říkali jsme mu černá krabička) učíme, samy o sobě nestačí k tomu, abychom mohli říci, zda model dobře funguje. Cílem není jen správná odezva na daných vzorech, ale také generalizace, t. j. schopnost správně predikovat odezvu v bodech, které jsme zatím neviděli. Kvalitu generalizace odhadneme pomocí vzorů, které při učení nebyly použity, říkáme jim testovací množina. Vzory, které při učení používáme, označujeme jako trénovací. 
 
- Testovací množina by měla být dostatečně reprezentativní. Nemáme-li jiné vodítko, vybereme testovací množinu náhodným výběrem z dat.   
 
- K posouzení kvality řešení nám slouží metriky, seznámili jsme se základními metrikami pro regresi
 
- Jsou-li v datech hodnoty, které evidentně nesouvisí s predikovanou odezvou (např. id, čísla řádek, apod.), nebudeme je zahrnovat mezi vstupní proměnné (příznaky). 
 
- Nepoužíváme kanón na vrabce. Máme-li přímý algoritmus na řešení problému, nebudeme používat strojové učení. 
 
- Pod pojmem hyper-parametry se skrývají parametry modelů, které můžeme sami nastavit. 
 
 
 
 
 
         
        
        
        
            
                Toto je stránka lekce z kurzu, který probíhá nebo proběhl naživo s instruktorem.