1 Hybride Intelligenz im öffentlichen Personennahverkehr (ÖPNV)
2 Anwendungsidee und Umsetzung
2.1 Anwendungsidee und Ausgangsdaten
2.2 Feature Engineering
2.3 Algorithmenauswahl
Algorithmus | Datenreduktion erforderlich? | Accuracy | F1 Score | Precision | Recall | Matthews | ROC-AUC |
---|---|---|---|---|---|---|---|
Decision Tree | Ja | 0,98 | 0,07 | 0,01 | 0,73 | 0,07 | 0,83 |
K Nearest Neighbour | Ja | 0,99 | 0,01 | 0,01 | 0,34 | 0,04 | 0,76 |
Gaussian NB | Ja | 0,98 | 0,01 | 0,00 | 0,07 | 0,05 | 0,82 |
Random Forest | Ja | 0,98 | 0,03 | 0,01 | 0,73 | 0,09 | 0,85 |
SVM | Ja | 0,99 | 0,04 | 0,02 | 0,33 | 0,08 | Nicht anwendbar |
Tabnet | Ja | 0,99 | 0,04 | 0,01 | 0,34 | 0,06 | 0,73 |
LightGBM | Nein | 0,99 | 0,07 | 0,03 | 0,48 | 0,10 | 0,90 |
2.4 Erklärbare KI mit SHAP
2.5 Ergebnisse anhand ausgewählter Metriken
-
Die richtig vorhergesagten Normalfahrten, d. h. die Fahrten ohne Kurzwende, die die entwickelte KI ebenfalls nicht als Kurzwende eingestuft hat (oben links in der Matrix),
-
die korrekt vorhergesagten Kurzwenden (unten rechts),
-
die tatsächlichen Kurzwenden, die die KI nicht identifiziert hat (unten links)
-
die falsch vorhergesagten Kurzwenden bei Fahrten, bei denen in Wirklichkeit keine Kurzwende durchgeführt wurde (oben rechts).
Phase aus CRISP-DM | Fragestellung | Entscheidung | Begründung/Erläuterung |
---|---|---|---|
Business Understanding | Für welche dispositive Maßnahme soll der erste Protoyp des Assistenzsystems Vorschläge generieren? | Kurzwenden | Vglw. einfacher Anwendungsfall, beste Datenlage, einfache und nützliche praktische Anwendung |
Data Understanding | Welche zusätzlichen Informationen sind für die Entscheidungsfindung relevant und können aus den vorhandenen Daten extrahiert werden? | Entfernung zu Start- und Zielbahnhöfen | Berechnung aus aktueller Haltestelle und Gesamtzahl der Haltestellen auf der Linie |
Data Preparation | Wie soll mit unausgeglichenen Trainingsdaten umgegangen werden? | Undersampling | Reduzierung der Normalfahrten, Reduktion der Datenmenge für manche KI-Algorithmen notwendig |
Anwendung robuster KI-Algorithmen | keine Manipulation der Verteilung der Trainingsdaten notwendig | ||
Modelling | Welcher KI-Algorithmus eignet sich am besten für die Entwicklung des Assistenzsystems? | LightGBM | Keine Datenreduktion notwendig, kürzeste Trainingsdauer, vglw. gute Klassifikationsergebnisse |
Evaluation | Welche Metriken sollen als primäre Bewertungskriterien zur Beurteilung der trainierten KI-Modelle betrachtet werden? | Konfusionsmatrix | Gute Verständlichkeit für Laien, Optimierung des KI-Modells anhand falsch-positiver und falsch-negativer Klassifizierungen |