0. Sieci neuronowe jako Black Box- są świetnym modelem uczenia maszynowego ale nie mają odpowiedniej reprezentacji wiedzy, gdyż są nieczytelne dla człowieka 1. są modele uczenia maszynowego które reprezentuję wiedzę w sposób przejrzysty dla człowieka;; są to m.in.: - reguły decyzyjne (np kod programowania z funkcją IF) - drzewa decyzyjne 2. Metoda ID3 (czyli jak generować automatycznie drzewa decyzyjne): - wybieramy atrybut - tworzymy rozgałęzienie dla poszczególnego atrybutu - powtarzamy 1 i 2 aż zostaną tylko elementy jednej kategorii //intuicyjnie atrybut jest tym lepszy im lepiej 'rozdziela kategorie' //przy podziale kolejny atrybut należy wybrać tak by dla danej miary występował on najczęściej //najczęściej stosowanym w praktyce algorytmem do budowy drzew jest algorytm C4.5, zawiera on ulepszenia m.in: - zapobiega przetrenowaniu przez upraszczanie drzewa 3. Złożoność modelu: //Im bardziej złożony model tym lepiej odwzorowane niuanse ale też większe ryzyko przetrenowania (czyli dostosowanie się modelu na sztywno bez uogólniania wiedzy na nieznane przypadki) MODEL POWINIEN BYĆ JAK NAJPROSTSZY: *za krótki powoduję długi i kosztowny obliczeniowo proces uczenia *za długi powoduję przetrenowanie (i brak możliwości uogólniania na nieznane przypadki) 4.Jeśli jest z amało danych uczących tostosuję się metody: *walidacji krzyżowej (najbardziej popularna) -pozwala użyć całego zbioru treningowego i jednocześnie nie oceniać tylko na podstawie zbioru treningowego -dzielimy zbiór treningowy na cześć treningową i ewaluacyjną *leave-one-out *bootstrap