Statistische Gütemaße

Ist die Entscheidungsgrenze wirklich gut gewählt?

Zur Beantwortung dieser Frage und zur Validierung des Kreditvergabesystems werden wir den Gesamtprofit sowie verschiedene statische Gütemaße nutzen.

Die Entscheidungsgrenze nutzen wir zur Vorhersage. Hat eine Person einen Kreditscore größer oder gleich unserer Entscheidungsgrenze, so sagen wir voraus, dass diese Person den Kredit zurückzahlen wird. Bei einem Kreditscore kleiner als unsere Entscheidungsgrenze sagen wir voraus, dass diese Person den Kredit nicht zurückzahlen wird. Die Entscheidungsgrenze wurde zunächst fest auf 70 gesetzt. Für alle Personen mit einem Score größer oder gleich 70 gehen wir davon aus, dass sie den Kredit zurückzahlen werden (Vorhersage: zahlt zurück). Für alle Personen mit einem Score unter 70 gehen wir davon aus, dass sie den Kredit nicht zurückzahlen werden (Vorhersage: zahlt nicht zurück). Diese Vorhersagen können wir nun mit den vorliegenden Daten vergleichen.

Erinnerung: Wir arbeiten mit Daten von Personen, bei denen bekannt ist, ob sie ihren Kredit in der Vergangenheit zurückgezahlt haben (Daten: zahlt zurück oder Daten: zahlt nicht zurück) und nutzen dies zum Abgleich mit unserer Vorhersage.

Die Konfusionsmatrix

Die Anzahl der richtigen und falschen Vorhersagen für beide Personengruppen (“zahlt zurück” und “zahlt nicht zurück”) sind in der folgenden Tabelle dargestellt. Diese Tabelle wird auch als Konfusionsmatrix bezeichnet.

Wie viele Personen erhalten bei einer Entscheidungsgrenze von 70 insgesamt einen Kredit?

Wie viele Personen erhalten bei einer Entscheidungsgrenze von 70 einen Kredit, obwohl sie nicht zahlungsfähig sind?

Bewertung des Entscheidungsmodells

Es gibt verschiedene Gütemaße, die wir zur Bewertung unseres Modells verwenden können:

Berechne die Werte der vier Gütemaße. Nutze dazu die Werte in der Konfusionsmatrix. Trage deine Ergebnisse in der folgenden Tabelle ein. Runde stets auf ganzzahlige Werte!

Wieviel Prozent der Personen, die zahlungsfähig sind, erhalten auch tatsächlich einen Kredit?

Wieviel Prozent der Personen im Datensatz erhalten einen Kredit?