Die Daten verstehen

Für Banken ist es relevant, möglichst genau vorherzusagen, ob ein neuer Kunde einen Kredit mit hoher Wahrscheinlichkeit zurückzahlt oder nicht. Im Finanzwesen wird dazu oft mit mathematischen Modellen gearbeitet, die jeder Person einen Kreditscore (z. B. der Schufa-Score) zuordnen. Wir gehen davon aus, dass zur Berechnung des Kreditscores verlässliche Daten verarbeitet wurden und nehmen den Kreditscore als ein sinnvolles Maß für die Kreditwürdigkeit einer Person an.

In diesem Lernmodul verwenden wir fiktive Daten von zahlreichen Kreditanwärter*innen, die aber genau so in der Vergangenheit hätten zustande kommen können. Für diese Personen wurde der Kreditscore zwischen 0 (Kredit wird eher nicht zurückgezahlt) und 100 (Kredit wird sehr wahrscheinlich zurückgezahlt) berechnet. Außerdem ist bekannt, ob jede dieser Personen ihren Kredit in der Vergangenheit tatsächlich zurückgezahlt hat oder nicht.

Bevor wir mit einem größeren Datensatz arbeiten, wirst du zunächst die Struktur der Daten erkunden und wie sie mit Hilfe von Punktdiagrammen visualisiert werden können. In den Diagrammen repräsentiert jeder Punkt eine Person.

Datensatz 1

Hier siehst du eine Tabelle mit fiktiven, aber realistischen Daten.

Welches der folgenden Punktdiagramme A, B oder C repräsentiert die Daten aus der Tabelle? Du kannst die Tabelle nach Namen, Kreditscore oder Zahlungsfähigkeit sortieren, indem du auf den Titel der jeweiligen Spalte klickst. Scrolle durch die Tabelle, um alle Einträge zu sehen. Notiere deine Antwort.

Option A

Option B

Option C

Datensatz 2

Hier siehst du eine weitere Tabelle.

Welches Punktdiagramm repräsentiert die Daten in der Tabelle? Notiere deine Antwort.

Option A

Option B

Option C

Datensatz 3

Hier siehst du eine weitere Tabelle.

Welches Punktdiagramm repräsentiert die Daten in der Tabelle? Notiere deine Antwort.

Option A

Option B

Option C

Überprüfe nun deine Antworten