2. Teil der Vorlesung "Knowledge Discovery"

basierend auf dem Buch Advances in Knowledge Discovery
1. Definition von KDD und Data Mining
(Nomenklatur, KDD versus OLAP, KDD als Prozess: Patterns, Daten,
interestingness, Wissen als Pattern, Data Mining als ein Schritt
im KDD-Prozess, die 9 Schritte im KDD Prozess,
Data Mining: Klassifikation, Regression, Clustering, etc,
Modell-Repraesentation, Modell Evaluation, Such-Methoden)
2. 2. KDD und ILP
(nichtmonotones ILP: Clausel Discovery, charakterisierende Induktion,
CLAUDIEN, River Water Quality: GOLEM vs CLAUDIEN vs CN2)
3. 3. Data Cleaning
(Informative Daten, Minimax-Alg, OMC, kumulativer Inf.-Gewinn,
# der inform. Beispiele als Funktion der DB-Groesse, Online vs Batch-Alg,
Validierungs Error, Existenz des Optimal Cleaning Points,
theoretische Voraussagbarkeit)
4. 4. Assoziations-Regeln
(Def. von Assoziations-Regeln: Transaktionen, Konfidenz, Support,
grosse Itemsets Optimalitaet des Ansatzes, Alg. fuer gr. Itemsets,
apriori-gen, subset, Hash-Baeume, Generieren der Assoz.-Regeln:
ap-genrules, Algorithmen im Vergleich)
5. 5. KDD und Deduktive Datenbanken
(Meta-Queries, Knowledge Miner, LDL++ (API, EFI, EDI), Bayesian Cluster,
Prob. Rule Constructor, Beispiele, Anwendung auf CYC)
6. 6. Beispiel: SkyCat und KEFIR
(Aufgaben von SkyCat, Kernidee, Lern-Methoden: GID3* und O-BTREE,
Rule Condition Pruning, Statistical Filtering, Greedy Minimal Covering,
Normalisieren der Attribute, Invarianz, Star-Selection Subproblem
(Kalibrierung), digitalisierte Photoplatte vs. CCD Bilder, Beispiel)

Juergen Dix
Last modified: Wed Mar 25 13:44:52 MET 1998