2. Teil der Vorlesung "Knowledge Discovery"

1.	Definition von KDD und Data Mining (Nomenklatur, KDD versus OLAP, KDD als Prozess: Patterns, Daten, interestingness, Wissen als Pattern, Data Mining als ein Schritt im KDD-Prozess, die 9 Schritte im KDD Prozess, Data Mining: Klassifikation, Regression, Clustering, etc, Modell-Repraesentation, Modell Evaluation, Such-Methoden)
2.	2. KDD und ILP (nichtmonotones ILP: Clausel Discovery, charakterisierende Induktion, CLAUDIEN, River Water Quality: GOLEM vs CLAUDIEN vs CN2)
3.	3. Data Cleaning (Informative Daten, Minimax-Alg, OMC, kumulativer Inf.-Gewinn, # der inform. Beispiele als Funktion der DB-Groesse, Online vs Batch-Alg, Validierungs Error, Existenz des Optimal Cleaning Points, theoretische Voraussagbarkeit)
4.	4. Assoziations-Regeln (Def. von Assoziations-Regeln: Transaktionen, Konfidenz, Support, grosse Itemsets Optimalitaet des Ansatzes, Alg. fuer gr. Itemsets, apriori-gen, subset, Hash-Baeume, Generieren der Assoz.-Regeln: ap-genrules, Algorithmen im Vergleich)
5.	5. KDD und Deduktive Datenbanken (Meta-Queries, Knowledge Miner, LDL++ (API, EFI, EDI), Bayesian Cluster, Prob. Rule Constructor, Beispiele, Anwendung auf CYC)
6.	6. Beispiel: SkyCat und KEFIR (Aufgaben von SkyCat, Kernidee, Lern-Methoden: GID3* und O-BTREE, Rule Condition Pruning, Statistical Filtering, Greedy Minimal Covering, Normalisieren der Attribute, Invarianz, Star-Selection Subproblem (Kalibrierung), digitalisierte Photoplatte vs. CCD Bilder, Beispiel)

Last modified: Wed Mar 25 13:44:52 MET 1998