« Juni 2013 | Main | August 2013 »

Masterprojekt: Data Mining Cup 2013 "Kauft sie oder kauft sie nicht?"

Montag, Juli 15, 2013

Data Mining Cup 2013 - "Kauft sie oder kauft sie nicht?"

Vier Studenten des Masterprojektes Data Mining nahmen am diesjährigen Data Mining Cup teil und erreichten den Platz 22 von 66 eingereichten Lösungen.

Folgendes Szenario sollte modelliert werden: Ein Webshop beobachtet seine Besucher (überwiegend Frauen), während sie sich auf der Webseite bewegen. Es soll die Frage beantwortet werden, ob der Besucher seinen Warenkorb letztendlich bestellt oder nicht. Die Trainingsdaten umfassen 50.000 Sessions mit Kundendaten (Alter, Adresscode, Zahlungsanzahl, Acountlebensdauer, Datum der letzten Bestellung, Score, ...) und Sessiondaten (Dauer der Session, Preisverlauf angesehener Artikel, Preise in den Warenkorb gelegter Artikel, Zustandsverlauf im Bestellprozess, ...). Die Klasse ist dann "Session endet mit Bestellung" oder "Session endet ohne Bestellung". Hintergrund der Aufgabe ist das gewünschte automatische Anbieten von Rabatten oder Upselling-Möglichkeiten während einer Session.

Das Team legte im Data Mining-Prozess besonderen Wert auf die zuverlässige Schätzung des zu erwartenden Generalisierungsfehlers, dessen Größenordnung durch die endgültigen Fehlerwerte bestätigt wurde. Es gelang dem Team 93.8% der unbekannten Kundensessions richtig zu klassifizieren (zum Vergleich erreichte das Gewinnerteam der Uni Dortmund eine Erfolgsrate von 97.2%). Eine Übersicht aller teilnehmenden Teams im nebenstehenden Poster.

Es ist also mit Data Mining möglich, das Nutzerverhalten in diesem Szenario sicher vorherzusagen, wahrscheinlich sogar, bevor dem Nutzer selbst seine Entscheidung bewusst wird.

Categories: Maschinelles Lernen

Masterarbeit von Johannes Scheer

Montag, Juli 01, 2013

Automatisierte Merkmalsextraktion und Klassifizierung von Vogelstimmen mittels genetischer Programmierung

Ziel der Arbeit ist die Evaluation einer Methode zur automatischen Merkmalsextraktion mit Genetischem Programmieren. auf diesem Wege sollen Merkmale definiert werden, die sich zur Klassifikation von Vogelstimmen eignen. So erzeugte Merkmale können zum Einen genutzt werden, um von Ornithologen erstellte Langzeitaufnahmen zu bearbeiten oder für Hobby-Ornithologen, um mit einer Smartphone-Applikation Vögel aufzunehmen und zuzuordnen.

In der Arbeit soll aufbauend auf Arbeiten an der Universität Dortmund von Ingo Mierswa und Katharina Morik die prinzipielle Eignung des Ansatzes untersucht und anhand einer praktischen Umsetzung bewertet werden. Schwerpunkt sei hierbei die erfolgreiche und weiterverwendbare Umsetzung des Evolutionszyklus im GP-Framework ECJ.

Kolloqium: 28.06.2013

Betreuer: Dipl.-Inform. Ingo Boersch, Prof. Dr.-Ing. Michael Syrjakow

Download: A1-Poster

Categories: Abschlussarbeiten, Maschinelles Lernen