1. | Definition von KDD und Data Mining (Nomenklatur, KDD versus OLAP, KDD als Prozess: Patterns, Daten, interestingness, Wissen als Pattern, Data Mining als ein Schritt im KDD-Prozess, die 9 Schritte im KDD Prozess, Data Mining: Klassifikation, Regression, Clustering, etc, Modell-Repraesentation, Modell Evaluation, Such-Methoden) |
2. | 2. KDD und ILP (nichtmonotones ILP: Clausel Discovery, charakterisierende Induktion, CLAUDIEN, River Water Quality: GOLEM vs CLAUDIEN vs CN2) |
3. | 3. Data Cleaning (Informative Daten, Minimax-Alg, OMC, kumulativer Inf.-Gewinn, # der inform. Beispiele als Funktion der DB-Groesse, Online vs Batch-Alg, Validierungs Error, Existenz des Optimal Cleaning Points, theoretische Voraussagbarkeit) |
4. | 4. Assoziations-Regeln (Def. von Assoziations-Regeln: Transaktionen, Konfidenz, Support, grosse Itemsets Optimalitaet des Ansatzes, Alg. fuer gr. Itemsets, apriori-gen, subset, Hash-Baeume, Generieren der Assoz.-Regeln: ap-genrules, Algorithmen im Vergleich) |
5. | 5. KDD und Deduktive Datenbanken (Meta-Queries, Knowledge Miner, LDL++ (API, EFI, EDI), Bayesian Cluster, Prob. Rule Constructor, Beispiele, Anwendung auf CYC) |
6. | 6. Beispiel: SkyCat und KEFIR (Aufgaben von SkyCat, Kernidee, Lern-Methoden: GID3* und O-BTREE, Rule Condition Pruning, Statistical Filtering, Greedy Minimal Covering, Normalisieren der Attribute, Invarianz, Star-Selection Subproblem (Kalibrierung), digitalisierte Photoplatte vs. CCD Bilder, Beispiel) |