Umelá inteligencia 1 Strojové učenie Doc. Ing. Kristína Machová, PhD.
Strojové učenie Osnova: Definícia strojového učenia Reprezentácia vstupov a výstupov Delenie kognitívnych algoritmov Prehľadávanie priestoru pojmov a príznakov Rozhodovacie stromy Prahové pojmy Učenie odmenou a trestom Zhlukovanie
Strojové učenie Definícia Počítačový program je schopný učiť sa zo skúsenosti S vo vzťahu k niektorej triede úloh T a miere výkonnosti V, ak sa jeho výkon zvýšil pri úlohách z T meraný V vďaka skúsenosti S.
Strojové učenie Definícia Výsledok učenia môže mať rôznu reprezentáciu. Skúsenosť S je reprezentovaná trénovacími dátami, ktoré sú uložené v trénovacej množine. Klasifikačné pravidlá Rozhodovacie stromy Rozhodovacie zoznamy Etalóny Prahové pojmy Pravdepodob. pojmy Zhluky Algoritmus strojového učenia Trénovacia množina
Strojové učenie Reprezentácia vstupov Trénovacia množina - vstup algoritmu SU Atribúty: binárne, nominálne, numerické, ordinálne... Posledný atribút: zaradenie do triedy Podnik Podiel na trhu v % Investície do reklamy Úroveň riadenia Dobrá tradícia Prosperuje 1 30 vysoké dobrá áno + 2 28 priemerné zlá 3 17 nie 4 10 5 8 nízke - 6 7
Strojové učenie Reprezentácia výstupov Učenie logickej reprezentácie s učiteľom: logické konjunkcie produkčné pravidlá rozhodovacie stromy a zoznamy Učenie s prvkami kvantitatívneho usudzovania: prahové pojmy etalóny pravdepodobnostné pojmy Učenie bez učiteľa: zhluky učenie odmenou a trestom Klasifikačná úloha sekvenčná úloha
Strojové učenie Delenie kognitívnych algoritmov deduktívne induktívne kontrolované (ex. spätná väzba) nekontrolované (neex. spätná väzba) inkrementálne on-line úloha neinkrementálne off-line úloha BIAS (preferencie systému) reprezentačný (limituje popis pojmu) prehľadávací (limituje spôsob prehľadávania)
Strojové učenie Prehľadávanie priestoru pojmov VSS (Version Space Search) prehľadávajú usporiadaný priestor pojmov (všeobecnosť) používajú operátory zovšeobecnenia (špecifikácie)
Strojové učenie Prehľadávanie priestoru pojmov VSS (Version Space Search) Výsledkom prehľadávania je definícia pojmu Definícia pojmu má formu logickej konjunkcie obj(X,cervena,lopta) IF FARBA=cervena & TVAR=lopta THEN Pojem obj(mala,X,lopta) IF VELKOST=mala & TVAR=lopta THEN Pojem
Strojové učenie Prehľadávanie priestoru príznakov IF H > 5 THEN “+” pričom 0<H<10 a 0<G<10 IF G < 5 THEN “+” IF H > 5 & H < 9 & G > 2 & G < 5 THEN “+” Definíciu pojmu – triedy Vo forme konjunkcie hľadáme v priestore príznakov.
Strojové učenie Trojrozmerný priestor príznakov Bičíky = {jeden, dva} Farba = {tmavá, svetlá} Jadrá = {jeden, dva}.
Strojové učenie Úplné prehľadávanie priestoru Úplné prehľadávanie pomocou EGS (Exhaustive General-to-Specific)
Strojové učenie Úplné prehľadávanie priestoru Nevýhody: reprezentačný bias prehľadávací bias heuristika (BS, Score)
Strojové učenie Obojsmerné prehľadávanie Hľadanie od najvšeobecnejšej aj od najšpecifickejšej úrovne zároveň. V priestore pojmov prehľadávame strom pojmov zhora aj zdola zároveň. V príznakovom priestore najvšeobecnejší pojem zužujeme špecifický pojem rozširujeme.
Strojové učenie Heuristické prehľadávanie priestoru Heuristické prehľadávanie pomocou HGS (Heuristic G-to-S) H s2 s5 s1 s3 s4 s23 s52 s21 s22 s54 s51 s55 s53 BS=2 (Beam Size)
Strojové učenie Heuristické prehľadávanie priestoru Algoritmus HGS používa Score funkciu, napríklad v tvare: Kde: P je množina pozitívnych príkladov N je množina negatívnych príkladov Pc sú pokryté pozitívne príklady Nnc sú nepokryté negatívne príklady Je možné používať aj štatistické a informačné miery, Ale aj tak jednoduchú mieru ako:
Strojové učenie Rozhodovacie stromy Rekurzívne delenie priestoru príkladov na podpriestory (princíp rozdeľuj a panuj) UP: v podpriestoroch sú iba príklady jednej triedy Výber testovacieho atribútu – minimalizácia entrópie (používa heuristiku, keby nepoužíval?) ID3, ID5R (Iterative Dichotomizer 5 Recursive) C4.5 – Quinlan
Strojové učenie Rozhodovacie stromy
Strojové učenie Prahové pojmy TABUĽKA KRITÉRIÍ m_of_n pojem Ak je splnených aspoň m podmienok z n, potom je príklad klasifikovaný do danej triedy – ide príklad daného pojmu. (etalón je m_of_m pojem)
Strojové učenie Učenie odmenou a trestom Riešenie úlohy sekvenčného typu učením bez učiteľa. Je daný počiatočný a koncový stav a hľadá sa postupnosť stavov vedúca od jedného k druhému. Dopredným zreťazeným prehľadávaním a postupným šírením odmien spätne pozdĺž cesty. Používa sa riadenie ohodnocovacou funkciou „reward“. Tabuľkový prístup: každý pár stav - akcia má svoju bunku v tabuľke, ktorá obsahuje hodnotu odmeny. Q – learning: pri každom prechode stavom sa hodnota jeho odmeny zvýši o ΔQ(s,a). Bucket brigade: Q(s,a) sa zníži o frakciu f zakaždým keď sa aplikuje akcia a v stave s. O tú istú hodnotu sa zvýši odmena predchádzajúceho páru (s,a).
Strojové učenie Zhlukovanie Učenie bez učiteľa; v trénovacej množine nemáme informáciu o triede. Vytvárame zoskupenia – zhluky objektov na základe ich príbuznosti, podobnosti. CLUSTER/2 formuje K zhlukov okolo K jadier
Strojové učenie Zhlukovanie COBWEB Inkrementálny, hierarchický Určuje počet zhlukov Určuje hĺbku hierarchie Počíta užitočnosť zhluku
Strojové učenie Literatúra Machová Kristína: Strojové učenie. Princípy a algoritmy. ELFA s.r.o., 2002, Košice, 117s., ISBN 80 89066 51 8.