Nauč se Python > Kurzy > Datový kurz PyLadies > Strojové učení - úvod, regrese (virtuální) > Regrese - Co bych měla po této lekci znát ..

Strojové učení - úvod do regrese

Co bych měla po této hodině znát?

  • Úlohy, které řešíme pomocí strojového učení, nemívají jedno řešení.
  • Vzorky na, kterých model (říkali jsme mu černá krabička) učíme, samy o sobě nestačí k tomu, abychom mohli říci, zda model dobře funguje. Cílem není jen správná odezva na daných vzorech, ale také generalizace, t. j. schopnost správně predikovat odezvu v bodech, které jsme zatím neviděli. Kvalitu generalizace odhadneme pomocí vzorů, které při učení nebyly použity, říkáme jim testovací množina. Vzory, které při učení používáme, označujeme jako trénovací.
  • Testovací množina by měla být dostatečně reprezentativní. Nemáme-li jiné vodítko, vybereme testovací množinu náhodným výběrem z dat.
  • K posouzení kvality řešení nám slouží metriky, seznámili jsme se základními metrikami pro regresi
  • Jsou-li v datech hodnoty, které evidentně nesouvisí s predikovanou odezvou (např. id, čísla řádek, apod.), nebudeme je zahrnovat mezi vstupní proměnné (příznaky).
  • Nepoužíváme kanón na vrabce. Máme-li přímý algoritmus na řešení problému, nebudeme používat strojové učení.
  • Pod pojmem hyper-parametry se skrývají parametry modelů, které můžeme sami nastavit.

Toto je stránka lekce z kurzu, který probíhá nebo proběhl naživo s instruktorem.