Anwendungsbeispiel zur Klassifikation von Wertereihen bei industriellen
Daten
Widerstandspunktschweißen ist das im Stahl-Karosseriebau am häufigsten
verwendete Fügeverfahren. Dabei spielt der richtige Zeitpunkt des
Elektrodenwechsels eine kritische Rolle. Um haltbare Schweißpunkte zu
garantieren, werden die Elektroden anhand pessimistischer, empirisch
bestimmter Heuristiken in der Praxis sehr früh gewechselt. Insbesondere
beim Schweißen hochfester beschichteter Bleche mit hohen Strömen
erreichen die Heuristiken ihre Grenzen. Könnte die Standzeit der
Elektroden anhand eines Prognosemodells optimiert werden, sind jährliche
volkswirtschaftliche Einsparungen an den Elektroden-Rohstoffen
(überwiegend Kupfer) in Millionenhöhe zu erwarten.
Die Arbeitsgruppe Thermisches Fügen der TU Dresden untersucht die
Verschleißmechanismen der Elektrodenkappen mit dem Ziel neue
zerstörungsfreie Prüfverfahren für das Widerstandspunktschweißen zu
entwickeln. In Kooperation mit dem Masterprojekt Data Mining der FH
Brandenburg erfolgt eine Untersuchung, mit welcher Güte sich der für die
Stabilität eines Schweißpunktes relevante Punktdurchmesser aus
Verlaufsgrößen des Schweißvorganges bestimmen lässt. Die besondere
Schwierigkeit der Data Mining-Aufgabe besteht in der Definition
geeigneter Merkmale aus Wertereihen und der Schätzung der Modellgüte bei
dem vorliegenden geringen Umfang der klassifizierten Stichprobe. Der
Prozess selbst ist nach Ansicht der Technologen schwierig zu
modellieren, da beim Schweißen hochfester Stähle mit hohen Stromstärken
Spritzer flüssigen Materials auftreten können.
Daten
Die Rohdaten wurden im Schweißlabor der TU Dresden experimentell erhoben
und liegen pro Schweißvorgang in Form multivariater Zeitreihen als
TDMS-File vor. Hierzu wurden mit sechs Elektroden je 2000 Schweißpunkte
geschweißt und dabei 10 Prozessgrößen (sog. Kanäle), wie bspw. Spannung,
im Kilohertz-Bereich aufgezeichnet. An 400 Schweißpunkten dieser
Stichprobe wurde die Zielgröße Punktdurchmesser manuell bestimmt. Die
Daten sind nicht öffentlich.
Data Cleaning und Explorative Analyse
Die Daten enthielten fehlende Werte, Triggerfehler, Ausreißer,
Fehlmessungen sowie Störungen durch nicht erfasste Einflussgrößen, wie
parallele Nutzung von Kühlkreisläufen durch andere Projekte. Die
explorative Analyse half Datenfehler aufzudecken und zeigte deutlich die
Prozessphasen des Schweißprozesses, führte jedoch zu keinen
offensichtlichen Merkmalen.
Modellierung
Zur Merkmalsdefinition wurden die Prozessgrößenmit einer parameterfreien
Methode [Wit83] kanalweise segmentiert und segmentweise deskriptive
statistische Merkmale berechnet. Zusätzlich wurden neue Kanäle durch
Verknüpfung bestehender Kanäle erzeugt [AH12]. Aus der damit definierten
Menge von mehr als 1000 Merkmalen wurde anhand von klassenbasierten
Filtermethoden eine geeignete Untermenge relevanter Merkmalen bestimmt.
Bei der Evaluation linearer Modelle [Fah09] und Modellbäumen erwiesen
sich Modellbäume [Qui92] als bessere und zudem transparente
Wissensrepräsentation [MM12].
Als Erfolg wurde eine Prognose des Punktdurchmessers in einem
10%-Intervall um den echten Wert definiert (Erfolgsrate) und zur
Modellauswahl der mittlere quadratische Fehler verwendet. Die Datenmenge
wurde im Holdout-Verfahren disjunkt in 90% Trainings- und 10% Testdaten
geteilt. Die Modellauswahl erfolgte auf den Trainingsdaten mit 10-facher
Kreuzvalidierung. Die Analyseskripte und Zwischendatenmengen wurden
versioniert, somit sind alle Ergebnisse mit den Originaldaten
reproduzierbar.
Erste Ergebnisse
Der gewählte Ansatz konnte den echten Punktdurchmesser in 75% der
Testfälle im 10%-Intervall korrekt vorhersagen. Dies ist unter
Berücksichtigung der technologischen Schwierigkeiten ein gutes Ergebnis.
Das finale Modell ist menschenlesbar und seine Plausibilität kann mit
den Prozessexperten diskutiert werden. Die Datenverarbeitungswerkzeuge
wurden entwickelt und können für ähnliche Analysen verwendet und
erweitert werden. Ein nächstes Projekt wird das Analyse-Verfahren auf
einen technologisch einfacheren Schweißprozess anwenden und um
strukturbasierte Merkmale erweitern.
[AH12] Benjamin Arndt and Benjamin Hoffmann. Segmentierung und
Merkmalsdefinition mehrkanaliger Messdaten zur Prognose bei einem
punktförmigen Fügeverfahren. In 14.
Nachwuchswissenschaftlerkonferenz, Brandenburg, 18.04.2013.
[Fah09] Fahrmeir, L., Künstler, R., Pigeot, I. and Tutz, G. (2009, 5.,
verb. Aufl.). Statistik - Der Weg zur Datenanalyse. Springer Verlag, 2009
[MM12] Curtis Mosters and Josef Mögelin. Merkmalsselektion und
transparente Modellierung zur Prognose einer Zielgröße bei einem
punktförmigen Fügeverfahren. In 14.
Nachwuchswissenschaftlerkonferenz, Brandenburg, 18.04.2013.
[Qui92] Ross J. Quinlan. Learning with Continuous Classes. In: 5th
Australian Joint Conference on Artificial Intelligence, pages 343–348.
Singapore, 1992.
[Wit83] Andrew P. Witkin. Scale-space filtering. In Proceedings of the
Eighth international joint conference on Artificial intelligence -
Volume 2, IJCAI’83, pages 1019–1022, San Francisco, CA, USA, 1983.
Morgan Kaufmann Publishers Inc.
Abb 1: Das vorsichtige Öffnen eines Schweißpunktes ist aufwändig, aber
zur korrekten Vermessung des Punktdurchmessers notwendig
Categories: Maschinelles Lernen