WEBVTT
00:00:00.000 --> 00:00:18.871
36C3 Vorspannmusik
00:00:18.871 --> 00:00:22.752
Herald 1: Ok. Spaß beiseite! Der nun
folgende Zug is schon ganz schön lange
00:00:22.752 --> 00:00:27.420
unterwegs. Beim 33C3, da fuhr er mit Xerox
ab.
00:00:27.420 --> 00:00:33.250
Herald 2: Beim 33C3 hat er dann SPIEGEL
einmal gedataminet und hat geguckt. Was ist denn
00:00:33.250 --> 00:00:37.620
dort? SpiegelOnline! Und hat uns wirklich
eine total perfekte Datenanalyse zu dem
00:00:37.620 --> 00:00:41.629
Thema gemacht?
Herald 1: Und beim 36C3 geht's mit dieser
00:00:41.629 --> 00:00:45.590
Zugfahrt weiter. Bitte begrüßt mit 'nem
ries'n Applaus David Kriesel.
00:00:45.590 --> 00:00:49.699
Applaus
Herald 2: Applaus! Applaus! Applaus!
00:00:49.699 --> 00:00:53.120
Applaus
Herald 1: Viel Spaß!
00:00:53.120 --> 00:00:57.229
Applaus
00:00:57.229 --> 00:01:02.940
David Kriesel: Also ich glaub: So geil bin
ich noch nie niemals eingeleitet worden.
00:01:02.940 --> 00:01:06.850
Lachen
D: Hm! Herzlich willkommen euch allen
00:01:06.850 --> 00:01:12.610
hier! Auch Herzlich willkommen an die
Leute im Stream - an die Aluhüte im
00:01:12.610 --> 00:01:18.060
Besonderen. Die Aluhüte glühen aber leider
noch nicht. Vielleicht kriegen wir das im
00:01:18.060 --> 00:01:22.330
Verlaufe dieses Vortrages noch hin. Mein
Name ist David Kriesel. Ich bin
00:01:22.330 --> 00:01:26.600
Informatiker aus der Nähe von Bonn. Im
richtigen Leben ist es mein Beruf
00:01:26.600 --> 00:01:33.149
interessante Sachen in größeren
Datenmengen zu finden. Neudeutsch heißt
00:01:33.149 --> 00:01:37.670
das Data Scientist. Und zusätzlich zum
Beruf habe ich verschiedene Projekte und
00:01:37.670 --> 00:01:43.039
manchmal nehme ich mir eines davon raus
und halte hier einen Vortrag. Ich bin
00:01:43.039 --> 00:01:47.509
Rheinländer und bei uns sagt man Ab
zweimal ist es Tradition und beim dritten
00:01:47.509 --> 00:01:51.670
Mal ist es Brauchtum. Ich bin jetzt das
dritte Mal hier. Das ist schon voll
00:01:51.670 --> 00:01:57.789
Brauchtum und ich freue mich, dass es so
oft geklappt hat. Unsere Geschichte heute
00:01:57.789 --> 00:02:06.340
beginnt im Jahr 2018. Am Ende des Jahres
2018 hat nämlich die Bahn gesagt, rund 75
00:02:06.340 --> 00:02:11.990
Prozent ihrer Fernzüge seien pünktlich
gewesen. Dafür muss man erst mal wissen:
00:02:11.990 --> 00:02:17.490
Was ist denn pünktlich? Die Bahn errechnet
das folgendermaßen: Die sagen: Wenn ein
00:02:17.490 --> 00:02:24.120
Zug bei einem Stopp weniger als sechs
Minuten zu spät ankommt, dann ist er
00:02:24.120 --> 00:02:27.670
pünktlich. Das ist wirklich die
Definition, und wir übernehmen das
00:02:27.670 --> 00:02:33.370
einfach. Da müssen wir dann nicht handeln.
Und dann errechnen Sie den Prozentsatz
00:02:33.370 --> 00:02:39.290
aller Stopps, bei denen das der Fall ist.
Und das wären bei knapp 75 Prozent in 2018
00:02:39.290 --> 00:02:43.690
so der Fall gewesen. Und das hat mich in
meiner persönlichen Erfahrung irgendwie
00:02:43.690 --> 00:02:53.079
gestört. In den letzten Jahren bin ich
quer durch Deutschland gereist, davon
00:02:53.079 --> 00:02:57.849
relativ häufig mit der Bahn. Und dann habe
ich meine Mailbox geguckt, und für mehr
00:02:57.849 --> 00:03:03.470
als die Hälfte meiner Fahrten habe ich
diese E-Mail von verspätungsalarm@bahn.de.
00:03:03.470 --> 00:03:09.720
Und da dachte ich Ich bin wohl dieser eine
Typ - ja - der aufpassen muss, nicht vom
00:03:09.720 --> 00:03:16.750
Blitz getroffen zu werden, während er den
Sechser im Lotto abholt. Ja? Ich wollte
00:03:16.750 --> 00:03:20.610
das dann genauer wissen. Also habe ich mal
in die Statistiken geguckt, die auf der
00:03:20.610 --> 00:03:25.319
Webseite der Bahn sind. Dann habe ich
gesehen: Das sind kaum welche. Die Bahn
00:03:25.319 --> 00:03:31.333
bietet auf ihrer Webseite nur die Prozent
der pünktlichen Stopps pro Monat an. Fürs
00:03:31.333 --> 00:03:36.719
Gesamtnetz, bundesweit nochmal getrennt im
Nah und Fernverkehr und das ist
00:03:36.719 --> 00:03:39.439
zusammengefasst. Damit kann man nichts
anfangen. Man kann dann nicht nach
00:03:39.439 --> 00:03:43.189
bestimmten Verbindungen filtern. Man kann
aber nicht gucken, bei welchen Bahnhöfen
00:03:43.189 --> 00:03:46.719
die Performance besonders schlecht ist
oder gut ist und alles, was interessant
00:03:46.719 --> 00:03:50.790
ist oder was ich interessant fand, das
geht nicht. Also habe ich am 8. Januar
00:03:50.790 --> 00:03:54.400
begonnen, die Deutsche Bahn zu
vorratsdatenspeichern.
00:03:54.400 --> 00:04:08.799
Lachen & Applaus
In diesem Datensatz gucken wir heute rein
00:04:08.799 --> 00:04:11.640
und wir werten das auch nicht nur aus,
sondern ich werde auch ein bisschen Zeit
00:04:11.640 --> 00:04:15.010
darauf verwenden, euch grob zu erklären,
wie man so ein Datenprojekt angeht und
00:04:15.010 --> 00:04:18.841
worauf man achten muss und wie man vor
allem merkt, ob man Vertrauen in die Daten
00:04:18.841 --> 00:04:23.770
haben kann. Das muss ja nicht sein, dass
alles stimmt, was man so herunterlädt, und
00:04:23.770 --> 00:04:27.370
über den ganzen Vortrag hinweg geb ich
euch immer so ein paar... - Wie nenne ich
00:04:27.370 --> 00:04:32.221
das? - Praxistipps, die ihr mit nach Hause
nehmen und an die ihr denken könnt, wenn
00:04:32.221 --> 00:04:37.080
ihr eine Bahnfahrt bucht. Disclaimer
Vorweg: Ich habe mit der Bahn nicht über
00:04:37.080 --> 00:04:40.680
die Auswertungen gesprochen. Behaltet im
Hinterkopf: Am Ende ist das ein kleines
00:04:40.680 --> 00:04:44.690
Hauptprojekt, und es kann durchaus sein,
dass ich Fehler gemacht habe. Aber da wir
00:04:44.690 --> 00:04:47.841
auch noch über die Vertrauenswürdigkeit
der Daten reden, könnt ihr selbst
00:04:47.841 --> 00:04:51.920
entscheiden, ob ihr meinen Daten vertraut
oder nicht. Wir kucken uns jetzt endlich
00:04:51.920 --> 00:04:57.030
mal an, wie die Daten aussehen. Hier sehen
wir eine fiktive Fahrt eines ICE. Ich gebe
00:04:57.030 --> 00:05:03.600
euch mal kurz fünf Sekunden für den ersten
Überblick und danach erkläre ich die. Drei
00:05:03.600 --> 00:05:11.380
Sekunden reichen auch. So! Der ICE fährt
in München los und jede weitere Zeile ist
00:05:11.380 --> 00:05:17.370
ein Stopp und irgendwann ist er am Ziel
angekommen. Hier: Bergen auf Rügen. Eine
00:05:17.370 --> 00:05:21.920
Fahrt ist die Sequenz aller Stopps, die
der Zug von Anfang bis Ende macht. Danach
00:05:21.920 --> 00:05:25.870
ist das eine neue Fahrt. Hier sind die
Verspätungen pro Stopp. Der Zug ist mit
00:05:25.870 --> 00:05:30.120
sechs Minuten Verspätung abgefahren und
nach der Messmethode der Bahn wäre der
00:05:30.120 --> 00:05:34.340
gerade als verspätet zu werten - an diesem
Stopp. Und dann schwanken die
00:05:34.340 --> 00:05:39.639
Verspätungen. In Erfurt sind wir auch mal
sechs Minuten zu früh dran gewesen. Die
00:05:39.639 --> 00:05:44.050
Verspätung ist negativ. Das passiert. In
der Regel heißt das übrigens, dass der Zug
00:05:44.050 --> 00:05:48.039
dann einfach länger bleibt und nicht zu
früh wieder abfährt. Am Berliner
00:05:48.039 --> 00:05:53.979
Flughafen; der Stopp fällt aus. In 20
Jahren werde ich diese Witze immer noch
00:05:53.979 --> 00:06:01.580
machen können.
Lachen & Applaus
00:06:01.580 --> 00:06:07.510
Und diese Stopps aller Fahrten sind die
Grundlage unserer Daten, meine Tabelle hat
00:06:07.510 --> 00:06:13.009
25 Millionen Zeilen. Das sind 25 Millionen
Stopps von irgendwelchen Zügen. Das sind
00:06:13.009 --> 00:06:17.830
alle Stopps im Fernverkehr vom 8. Januar
bis jetzt. Und auch der Nahverkehr, aber
00:06:17.830 --> 00:06:21.819
der nur an den Fernbahnhöfen. Komme ich gleich
noch zu. Und die Tabelle hat auch
00:06:21.819 --> 00:06:26.690
verschiedenste Spalten - die, die ich hier
vorführe und noch einige mehr. Wir können
00:06:26.690 --> 00:06:30.009
in einzelne Orte reingucken, in einzelne
Fahrten reingucken, in Zeiträume
00:06:30.009 --> 00:06:33.250
reingucken. Wir können auch kompliziertere
Auswertungen fahren. Machen wir auch heute
00:06:33.250 --> 00:06:37.039
noch. Zum Anfang, machen wir mal ein paar
ganz einfache Sachen mit den Daten. Das
00:06:37.039 --> 00:06:40.690
ist nicht, um euch zu langweilen, aber wir
müssen ja erst mal reinkommen, den
00:06:40.690 --> 00:06:44.450
Datensatz kennenlernen und so weiter. Wir
sortieren jetzt die ganze Tabelle von
00:06:44.450 --> 00:06:48.190
Stopps, 25 Millionen Stück, mal nach
Bahnhöfen und dann ermitteln wir die
00:06:48.190 --> 00:06:55.099
Anzahl der Stopps für jeden Bahnhof über
das ganze Jahr hinweg. Jeder Bubble hier
00:06:55.099 --> 00:06:59.790
ist ein Bahnhof mit Fernverkehr und davon
haben wir um die 350 Stück. Das sind die
00:06:59.790 --> 00:07:03.889
wichtigen. Und die Größe der Bubble gibt
die Anzahl der erfassten Halte für den
00:07:03.889 --> 00:07:07.770
Bahnhof wieder, und zwar für alles, was da
fährt: Fern- und Nahverkehr. Und der
00:07:07.770 --> 00:07:13.000
Größte, was das angeht, ist Köln
Hauptbahnhof mit im Moment 380 000 Stopps
00:07:13.000 --> 00:07:18.070
in der Datenbank. Ich habe die Top 6 mal
in der Karte beschriftet. Warum genau die
00:07:18.070 --> 00:07:22.569
Top 6? Weil der sechste Bahnhof genau
Hamburg Dammtor ist und das wollte ich
00:07:22.569 --> 00:07:26.721
euch nicht vorenthalten. Das war unser
letzter Congress-Bahnhof. Der Bahnhof
00:07:26.721 --> 00:07:30.849
Leipzig Messe ist übrigens deutlich,
deutlich kleiner. Inklusive Nahverkehr
00:07:30.849 --> 00:07:34.479
haben wir hier so 60.000 Stopps im Jahr
und überhaupt nur ein paar hundert
00:07:34.479 --> 00:07:38.180
Fernverkehr. Wo wir schon dabei sind,
machen wir jetzt was aus Kundensicht
00:07:38.180 --> 00:07:44.699
Interessantes und färben mal die Bahnhöfe
ein. Und zwar nach der Pünktlichkeit, nach
00:07:44.699 --> 00:07:49.530
dem Prozentsatz der Pünktlichkeit, der
dortigen Stopps im Fernverkehr. Das ist
00:07:49.530 --> 00:07:56.400
die Pünktlichkeit. Knallrot ist 60
Prozent, knallblau ist 90 Prozent und
00:07:56.400 --> 00:08:00.751
dazwischen farblos. Das ist ungefähr der
Durchschnitt bei 75. Als erstes sieht man
00:08:00.751 --> 00:08:11.119
In Ostdeutschland ist quasi alles blau.
Applaus
00:08:11.119 --> 00:08:15.599
Ich bin sicher, das sind diese blühenden
Landschaften, von denen Altkanzler Kohl
00:08:15.599 --> 00:08:21.740
immer sprach. In Nordrhein-Westfalen ist
so ziemlich alles rot. Köln hat nur so 66
00:08:21.740 --> 00:08:27.150
Prozent Pünktlichkeit. Bonn ist wirklich
eines der Schlusslichter mit 59 Prozent.
00:08:27.150 --> 00:08:30.039
Das sind die beiden Bahnhöfe, über die ich oft
fahre.
00:08:30.039 --> 00:08:33.810
Lachen
Generell. Der ganze dicht besiedelte Raum
00:08:33.810 --> 00:08:37.530
in Nordrhein-Westfalen ist ziemlich
schlimm dran. Und ich habe euch ja gesagt,
00:08:37.530 --> 00:08:41.070
dass ich das ganze Projekt überhaupt erst
gestartet habe, weil ich dachte, die
00:08:41.070 --> 00:08:44.960
Statistik der Bahn wäre falsch, weil meine
Züge so häufig unpünktlich sind. Die
00:08:44.960 --> 00:08:52.190
simple Wahrheit ist, ich wohne nur
schlecht. Hamburg, oben, ist auch schlimm.
00:08:52.190 --> 00:08:58.130
Das finde ich auch gerecht. Warum soll ich
der Einzige sein? Irgendwo bei 60 Prozent,
00:08:58.130 --> 00:09:01.170
je nachdem, welchen Bahnhof man erwischt.
Das sieht da jetzt röter aus, als es ist,
00:09:01.170 --> 00:09:04.920
weil die Dinger transparent sind. Und was
die Pünktlichkeit angeht, haben wir uns
00:09:04.920 --> 00:09:09.950
mit Leipzig Messe definitiv verbessert.
Wir sind hier so bei 80 Prozent oder etwas
00:09:09.950 --> 00:09:14.570
mehr. Ganz wichtig: Ich zeige ab jetzt
jetzt überall, wo es nicht anders dran
00:09:14.570 --> 00:09:18.140
steht, nur noch den Fernverkehr an.
Überhaupt wird der ganze Vortrag primär
00:09:18.140 --> 00:09:24.880
über den Fernverkehr gehen, weil über das
wird meistens berichtet in den Medien und
00:09:24.880 --> 00:09:27.450
auch darüber gemeckert. Und der
Fernverkehr ist das, worüber alle reden.
00:09:27.450 --> 00:09:31.420
Aber wenn ich sage, dass ich hier primär
über den Fernverkehr heute rede, dann muss
00:09:31.420 --> 00:09:37.000
ich auch fair sein und das Folgende sagen:
Der Nahverkehr, den wir jetzt auslassen,
00:09:37.000 --> 00:09:40.860
erreicht fast flächendeckend
Pünktlichkeitswerte von besser als 90
00:09:40.860 --> 00:09:44.423
Prozent. Behaltet das bitte über den Rest
des Vortrages im Hinterkopf. Die Bahn hat
00:09:44.423 --> 00:09:48.650
auch gute Seiten und bringt gerade im
Nahverkehr eine ziemliche Menge Leute
00:09:48.650 --> 00:09:53.000
jeden Tag zu ihrem Job. Da geht sicher
auch mal was schief, aber deutlich weniger
00:09:53.000 --> 00:09:55.820
als im Fernverkehr.
Applaus
00:09:55.820 --> 00:10:02.970
Ich hoffe, die Leute von der Bahn hören zu
und hören das jetzt gerade. Wir ändern
00:10:02.970 --> 00:10:06.310
jetz nochmal die Ansicht, die
Pünktlichkeit pro Bahnhof waren ja
00:10:06.310 --> 00:10:10.320
interessant für den Kunden. Aber wenn man
ein bisschen analytisch was machen will
00:10:10.320 --> 00:10:14.510
und bei der Bahn arbeitet, dann ist da das
Interessante. Welche Bahnhöfe richtig viel
00:10:14.510 --> 00:10:20.060
Verspätung generieren, also dem Netz
hinzufügen, und das ist die Ansicht. Ganz
00:10:20.060 --> 00:10:24.529
schlimm sind große Bahnhöfe mit vielen
Stopps, die gleichzeitig jedem Zug, der da
00:10:24.529 --> 00:10:28.829
anhält noch so ein bisschen Verspätung mit
auf den Weg geben. Die fünf schlimmsten
00:10:28.829 --> 00:10:36.630
sind Hamburg, Köln, Frankfurt Flughafen,
Mannheim. Die sind alle mit mehr als
00:10:36.630 --> 00:10:42.491
50.000 hinzugefügten Verspätungsminuten im
Messzeitraum. Spitzenreiter ist Frankfurt
00:10:42.491 --> 00:10:47.090
Hauptbahnhof mit 93.000 generierten
Verspätungsminuten. Ich höre, wir haben
00:10:47.090 --> 00:10:50.250
eine Frankfurtfraktion, wie seid ihr
hergekommen? Lachen
00:10:50.250 --> 00:10:52.550
Publikumseinrufe: Zu spät! Auto!
00:10:52.550 --> 00:10:56.570
D: Die sind heute erst angekommen. Ich hoffe
00:10:56.570 --> 00:11:03.120
ihr habt euch nicht gehetzt! Zweiter Tag
abends. Es gibt aber auch Bahnhöfe
00:11:03.120 --> 00:11:07.399
funktionieren so gut, dass sie insgesamt
Verspätungen aus dem Netz rausnehmen. Die
00:11:07.399 --> 00:11:11.450
Top drei sind Bremen, Berlin Hauptbahnhof
und Berlin Spandau.
00:11:11.450 --> 00:11:18.970
Applaus
Das hat mich sehr kalt erwischt. das mir
00:11:18.970 --> 00:11:25.480
völlig unverhofft ein Nachweis dieser
Größenordnung gelungen ist: Es gibt
00:11:25.480 --> 00:11:30.420
tatsächlich etwas an Berlin, das
funktioniert. Lachen
00:11:30.420 --> 00:11:36.900
Wir machen weiter - sonst artet das aus. Hier seht ihr im
00:11:36.900 --> 00:11:39.839
Vergleich, wie viele Fahrten es im
Nahverkehr, Fernverkehr und von
00:11:39.839 --> 00:11:43.670
Drittanbietern gibt. Wir ihr seht, ist das
weitaus meiste der Nahverkehr - hier
00:11:43.670 --> 00:11:47.940
orange. Hier sind mehr als fünf Millionen
Fahrten im Datensatz. Dagegen gibt es nur
00:11:47.940 --> 00:11:51.760
circa eine Viertelmillion Fahrten im
Fernverkehr - der ist hier blau - und es
00:11:51.760 --> 00:11:56.320
gibt noch ziemlich viele Fahrten von
Drittanbietern. Wir dröseln das mal in
00:11:56.320 --> 00:11:59.660
einzelne Zugfahrten auf, einfach, damit
wir sehen, was es gibt, bevor wir richtig
00:11:59.660 --> 00:12:04.110
einsteigen. Wir sehen jetzt, dass sich der
Nahverkehr aufspaltet, in die drei
00:12:04.110 --> 00:12:10.180
dicksten Bubble: Regionalbahnen
Regionalexpress, S-Bahn. Und der
00:12:10.180 --> 00:12:16.061
Fernverkehr in ICE, Intercity, das ist IC
und Eurocity, EC. Die Abkürzungen verwende
00:12:16.061 --> 00:12:20.190
ich auch im Folgenden. Diese
vergleichsweise kleinen blauen Punkte, das
00:12:20.190 --> 00:12:23.589
sind die eigentlich interessanten Zugarten
für heute. Das sind nämlich die Züge, die
00:12:23.589 --> 00:12:27.709
quer durch Deutschland fahren. Da kann man
richtig was sehen. Jetzt gehen wir einen
00:12:27.709 --> 00:12:32.350
Schritt weiter. Wir nehmen diese für uns
relevanten Zugarten her - also ICE,
00:12:32.350 --> 00:12:37.550
Intercity, Eurocity - und dann schauen wir
einfach mal, welche Zugart generell am
00:12:37.550 --> 00:12:43.780
spätesten dran ist, damit man gleich weiß,
wo man ausweichen muss. Ich wiederhole
00:12:43.780 --> 00:12:46.730
nochmals, wie die Bahn das misst.
Prozentzahl der Stopps, die maximal sechs
00:12:46.730 --> 00:12:51.940
Minuten zu spät sind, sind pünktlich. Im
Fernverkehr am pünktlichsten sind die
00:12:51.940 --> 00:12:57.880
Intercity, mit gut 76 Prozent. Dicht
danach folgen die ICE. Deutlich dahinter
00:12:57.880 --> 00:13:02.336
die Eurocity. Davon sind nicht mal 70
Prozent nach der Bahn-Definition
00:13:02.336 --> 00:13:06.120
pünktlich. Da muss ich sagen, das kann ich
in der Tat aus persönlicher Erfahrung
00:13:06.120 --> 00:13:10.379
bestätigen. Nach meinem Eindruck ist die
Qualität von den Teilen einfach schlechter
00:13:10.379 --> 00:13:14.560
- in jeder Hinsicht. Die Züge sehen, auch
wenn ich damit fahre, immer relativ alt
00:13:14.560 --> 00:13:19.180
aus. Aber man muss auch fair sein. Die
fahren internationaler als der Rest der
00:13:19.180 --> 00:13:22.801
Züge und wenn die direkt von außen
Verspätungen mitbringen, kann die Bahn da
00:13:22.801 --> 00:13:26.360
nichts für und solche Fälle gibt es. Und
es fehlt noch eine Größe, die wir messen
00:13:26.360 --> 00:13:30.540
können und die wir messen werden. Und über
die schweigt sich die Bahn auf ihren
00:13:30.540 --> 00:13:34.730
Webseiten aus. Und wenn man sich so
konsequent ausschweigt, hat das natürlich
00:13:34.730 --> 00:13:40.950
zur Folge, dass man sich für eine Analyse
bewirbt. Das ist der Prozentsatz der
00:13:40.950 --> 00:13:46.889
Ausfälle. Hier ist er. Und das war für
mich überraschend. ICEs sind ja das
00:13:46.889 --> 00:13:50.800
Flaggschiff der Bahn und anscheinend
fallen die mit weitem Abstand am
00:13:50.800 --> 00:13:58.240
häufigsten aus. Eurocity gut zwei Prozent,
Intercity gut drei Prozent und ICE über
00:13:58.240 --> 00:14:03.649
fünf Prozent. Also wenn ihr einen ICE
bucht, dann taucht er in einem von 20 Mal
00:14:03.649 --> 00:14:09.860
einfach nicht auf. Das fand ich ganz schön
stramm. Mich hat das überrascht. Mein
00:14:09.860 --> 00:14:16.110
Praxistipp an euch lautet also: Vorsicht
mit den ICEs! Ich weise fairerweise
00:14:16.110 --> 00:14:20.050
nochmals darauf hin, dass das eine
Auswertung von außen ist. Es besteht die
00:14:20.050 --> 00:14:24.260
Möglichkeit, dass das nicht stimmt oder da
ewig viele Extrafahrten dann für die
00:14:24.260 --> 00:14:28.519
Ausfälle gefahren werden, die gar nicht im
Plan standen, aber alle diese Stopps
00:14:28.519 --> 00:14:31.529
standen in deren Daten explizit als
ausgefallen drin. Die Daten sehen
00:14:31.529 --> 00:14:34.829
insgesamt realistisch aus, und im SPIEGEL
hatten Sie auch neulich eine Auswertung,
00:14:34.829 --> 00:14:38.529
wo Sie auf ähnliche Werte kamen. Also
schlage ich vor, wir betrachten das mal
00:14:38.529 --> 00:14:45.201
als gegeben, bis die Bahn widerspricht.
Übrigens einer der fettesten, nicht
00:14:45.201 --> 00:14:49.750
ausgefallenen Verspätungen in meinem
Datensatz, war der ICE 576 von Stuttgart
00:14:49.750 --> 00:14:57.320
nach Hamburg, und zwar am 17. Oktober
2019. Der hatte 456 Minuten Verspätung.
00:14:57.320 --> 00:15:03.771
Das sind mehr als siebeneinhalb Stunden
und der war nicht ausgefallen. Und um
00:15:03.771 --> 00:15:08.550
unseren Überblick zu vollenden, gucken wir
uns jetzt das Ganze noch einmal über die
00:15:08.550 --> 00:15:12.889
Zeit an. Hier sehen wir die Fahrten über
die Zeit, die ich für den Fernverkehr in
00:15:12.889 --> 00:15:17.380
der Datenbank habe. Die können wir uns mal
angucken, wie das funktioniert. Wir sehen,
00:15:17.380 --> 00:15:21.050
dass wir so um die 800 Fahrten am Tag
haben im Fernverkehr. Die niedersten
00:15:21.050 --> 00:15:25.251
Zacken sind immer Samstage, die hohen
Zacken immer Freitage, das ist der
00:15:25.251 --> 00:15:28.410
Berufsverkehr. Hier sind Ostern und
Pfingsten. Weihnachten habe ich nicht mehr
00:15:28.410 --> 00:15:33.100
hingekriegt. Und was sieht man noch? Man
sieht zum Beispiel, dass ich zwischendurch
00:15:33.100 --> 00:15:39.040
Mist gebaut habe und ein paar Tage Daten
verloren habe. Wer meinen letzten Vortrag
00:15:39.040 --> 00:15:43.480
hier gesehen hat, dem wird das bekannt
vorkommen. Ich mache das jeden Vortrag.
00:15:43.480 --> 00:15:47.481
Aber ich war besser. Diesmal war ich so
klug - ja - und dann hab ich mir ein
00:15:47.481 --> 00:15:52.320
vernünftiges Download Monitoring gebaut.
Und dann dachte ich, ich wäre cool. Und
00:15:52.320 --> 00:15:56.339
dann habe ich es irgendwie geschafft, den
Debian Server, auf dem das Ganze läuft,
00:15:56.339 --> 00:15:59.959
komplett zu crashen - also der hat gar
nicht mehr geantwortet. Ich musste die
00:15:59.959 --> 00:16:05.160
Kiste hart booten, und ich war da gerade
in Urlaub und habe das nicht gemerkt. Also
00:16:05.160 --> 00:16:09.570
diesmal Technischer Tipp für euch. Baut
nicht nur ein Download Monitoring, sondern
00:16:09.570 --> 00:16:13.347
lasst das auch noch auf einem anderen
Server laufen als den Download selbst.
00:16:13.347 --> 00:16:22.839
Applaus
Und weil wir heute ja auf Bahnbewerbungen
00:16:22.839 --> 00:16:27.170
hin die Ausfälle besonders genau machen
wollen: Hier sind die Ausfälle über die
00:16:27.170 --> 00:16:32.370
Zeit, das sind die Prozent der Stops pro
Tag, die einfach ausgefallen sind und man
00:16:32.370 --> 00:16:38.740
sieht sofort zwei fette Spikes. Hier ist
der Orkan Eberhard. Dieser Orkan ist am
00:16:38.740 --> 00:16:43.110
10. März über uns hereingebrochen, und am
Nachmittag war der der Meinung, es würde
00:16:43.110 --> 00:16:48.290
jetzt mal reichen mit Bahnverkehr. Und den
gucken wir uns auch noch genauer an, und
00:16:48.290 --> 00:16:51.850
hier ist der heißeste Tag des Jahres mit
der Hitzewelle dieses Jahr. Und generell
00:16:51.850 --> 00:16:55.899
sieht man, wenn ihr hier so ein bisschen
genauer guckt, dass es im Hochsommer eine
00:16:55.899 --> 00:16:59.300
stark erhöhte Ausfallrate gibt. Wie kommt
das?
00:16:59.300 --> 00:17:04.430
Publikumseinruf: Klimaanlage
D: Klimaanlage höre ich da. Die Ausfälle
00:17:04.430 --> 00:17:09.579
nach Zeit zerlegen wir jetzt nochmal in
die relevanten Zugarten - bevor der alles
00:17:09.579 --> 00:17:15.610
vorwegnehmt nimmt - und das machen wir jetzt
nicht mehr auf der Basis von Tagen,
00:17:15.610 --> 00:17:18.701
sondern von Wochen, das ist einfach etwas
glatter. Und die gelbliche Linie sind die
00:17:18.701 --> 00:17:24.470
ICEs und da sieht man erst mal, was für
ein fettes Problem die mit den ICEs im
00:17:24.470 --> 00:17:28.850
Sommer haben. Und ihr seht wie die
Ausfälle der ICEs im Sommer im Vergleich
00:17:28.850 --> 00:17:34.510
zu den anderen Zugarten richtig stark nach
oben ausbrechen. Das sind so um die 8
00:17:34.510 --> 00:17:39.681
Prozent Ausfallquote - fast an jedem
zwölften Stop taucht so ein ICE in der
00:17:39.681 --> 00:17:46.100
warmen Zeit dann einfach nicht auf. Und in
der Woche vom 22. Juli sind in der ganzen
00:17:46.100 --> 00:17:52.390
Woche sind mehr als 10 Prozent aller ICE
Stopps ausgefallen. Also ich weiß nicht,
00:17:52.390 --> 00:17:56.200
wie euch das geht, aber das geht bei mir
über die Fehlertoleranz. Also wenn das
00:17:56.200 --> 00:18:00.640
jeden Sommer so ist, wäre mein nächster
Praxis Tipp für euch: Vorsicht mit ICEs im
00:18:00.640 --> 00:18:08.750
Sommer. Und jetzt, wo es kälter wird,
fängt das auch wieder so an, aber wenn man
00:18:08.750 --> 00:18:11.710
das so anguckt - wir müssen noch ein
bisschen abwarten. Es ist noch nicht raus,
00:18:11.710 --> 00:18:15.820
ob das wirklich so wird. In zwei, drei
Monaten wissen wir mehr, wenn es richtig
00:18:15.820 --> 00:18:21.500
kalt war. Wir machen jetzt noch zwei
kleine Sachen und danach reden wir mal
00:18:21.500 --> 00:18:25.090
darüber, wie man so ein Projekt überhaupt
aufbaut und was die Grundregeln sind. Hier
00:18:25.090 --> 00:18:30.740
ist etwas Offensichtliches. Ich habe hier
die Stops mal aller Fahrten sortiert nach
00:18:30.740 --> 00:18:35.840
der Zeit, die die Zugfahrt bereits vor
diesem Stop gedauert hat. Von links nach
00:18:35.840 --> 00:18:39.000
rechts steigt die bereits gefahrene
Laufzeit vor dem Stopp an, hier von null
00:18:39.000 --> 00:18:44.260
bis 500 Minuten. Und was sieht man? Früher
in der Fahrt ist der Prozentsatz der
00:18:44.260 --> 00:18:48.420
pünktlichen Züge höher. Später in der
Fahrt sinkt die prozentuale Pünktlichkeit
00:18:48.420 --> 00:18:54.040
krass ab. Bei 500 Minuten sind unter 60
Prozent pünktlich. Das habt ihr euch
00:18:54.040 --> 00:18:57.010
wahrscheinlich jetzt alle schon selbst
gedacht. Warum sage ich das also? Weil ich
00:18:57.010 --> 00:18:59.880
die Bahn ein bisschen in Schutz nehmen
möchte. Man sieht nämlich häufiger in den
00:18:59.880 --> 00:19:04.110
Medien irgendwelche Untersuchungen von
Fahrten zwischen weit entfernteren
00:19:04.110 --> 00:19:08.130
Metropolen und da werden dann unglaublich
schlechte Pünktlichkeiten gemessen. Und
00:19:08.130 --> 00:19:11.700
wenn ihr sowas seht, lasst mich euch
sagen, die machen die Bahn schlimmer, als
00:19:11.700 --> 00:19:15.260
sie ist, weil sie durch weiter entfernen
eben nur den Datenteil mit der hohen
00:19:15.260 --> 00:19:19.630
Verspätung auswählen. Und ganz ehrlich -
die häufigen Probleme mit den japanischen
00:19:19.630 --> 00:19:25.270
Hochgeschwindigkeitszügen sind aus meiner
Sicht auch einfach Stuss. Die verbinden in
00:19:25.270 --> 00:19:28.700
Japan nur die absolut riesigen Metropolen.
Die haben ein komplettes Schienennetz für
00:19:28.700 --> 00:19:32.540
sich alleine. Der Fernverkehr der Bahn
muss sich das Netz mit Güter- und
00:19:32.540 --> 00:19:37.061
Nahverkehr teilen und bindet auch noch die
Mittelzentren mit an. Das ist nicht
00:19:37.061 --> 00:19:41.800
vergleichbar. So fair müssen wir schon
sein. Trotzdem hier wieder mein Praxistipp
00:19:41.800 --> 00:19:45.331
für euch: Vorsicht mit Zügen, die bereits
lange unterwegs sind. Ihr könnt ja, wenn
00:19:45.331 --> 00:19:49.080
ihr bucht sehen, was das für eine Zug
Linie ist und woher die kommt, könnt ihr
00:19:49.080 --> 00:19:54.630
also mit einbeziehen. Als nächstes habe
ich mich gefragt Ab welcher Verspätung
00:19:54.630 --> 00:20:00.580
wird es nicht mehr besser? Und dafür habe
ich für alle Stops aller Fahrten geguckt.
00:20:00.580 --> 00:20:04.800
Wie sehr ist der gerade schon verspätet,
und das hier ist von links nach rechts
00:20:04.800 --> 00:20:11.570
aufgetragen. Links stehen die wenig
verspäteten Stops, rechts die, die mit
00:20:11.570 --> 00:20:17.100
mehr Verspätung. Und dann habe ich geguckt
Wieviel Prozent bauen auf dem Rest ihrer
00:20:17.100 --> 00:20:21.970
Fahrt fünf Prozent der Verspätung ab und
existieren noch also sind nicht
00:20:21.970 --> 00:20:26.870
ausgefallen. Ja? Hört sich jetzt
kompliziert an, aber kurz: wieviel Prozent
00:20:26.870 --> 00:20:33.620
werden nochmal spürbar besser oder war es
das jetzt? Und was man sieht ist, dass bei
00:20:33.620 --> 00:20:37.440
Verspätungen unter 40 Minuten noch mehr
als die Hälfte der Züge am Ende der Fahrt
00:20:37.440 --> 00:20:42.690
besser dastehen als jetzt gerade und ab 40
Minuten Verspätung - da ist eine gut
00:20:42.690 --> 00:20:46.520
sichtbare Stufe in den Daten, die einzige
- da scheint die Bahn die Dinger irgendwie
00:20:46.520 --> 00:20:53.080
aufzugeben. Ab da wird es in der Mehrzahl
der Fälle bis zum Fahrtende nicht mehr
00:20:53.080 --> 00:20:56.880
besser. Woran das liegen könnte, darauf
kommen wir gleich auch noch. Praxistipp für
00:20:56.880 --> 00:21:05.810
euch: Ab einer Verspätung von 40 Minuten
erwägt ein anderes Transportmittel! So,
00:21:05.810 --> 00:21:09.600
das war ein Höllenritt. Jetzt haben wir
schon diverse Praxistipps abgestaubt. Ich
00:21:09.600 --> 00:21:12.560
schlage vor, wir machen jetzt einen
Einschub, und ich versuche, euch ein paar
00:21:12.560 --> 00:21:15.910
Anhaltspunkte zu geben, was ihr beachten
sollte, wenn ihr Datenprojekte selber
00:21:15.910 --> 00:21:19.700
hochzieht. Und ich werde das kurz halten,
so dass wir wieder in die Daten eintauchen
00:21:19.700 --> 00:21:25.960
können bald. Punkt 1: organisiert den
Download gut. Die Bahn hat einige
00:21:25.960 --> 00:21:29.650
öffentliche Schnittstellen. Es gab hier
auch schon einen schönen Vortrag zu
00:21:29.650 --> 00:21:33.600
ebendiesen Schnittstellen. Ich bin froh,
dass jemand ermessen kann, wieviel
00:21:33.600 --> 00:21:40.260
Schmerzen ich gehabt habe. Über zwei davon
kann man Fahrpläne und Veränderungen
00:21:40.260 --> 00:21:44.190
abrufen. Wenn ihr in eurem Smartphone mit
der Bahn App oder Öffi Bahnverbindung
00:21:44.190 --> 00:21:49.650
nachguckt, dann macht euer Handy genau
das. In den Fahrplänen steht, wann welcher
00:21:49.650 --> 00:21:54.820
Zug ankommen soll und in den Änderungen
steht, was sich dem gegenüber verändert.
00:21:54.820 --> 00:22:00.210
Ausfälle, Verspätungen und so weiter. Das
ist ein bisschen anstrengend, denn leider
00:22:00.210 --> 00:22:04.490
müsst ihr beides in getrennten Abfragen
abrufen. Und wenn ihr die Schnittstellen
00:22:04.490 --> 00:22:09.180
abruft, erhaltet ihr nur zeitlich begrenzt
Daten - paar Stündchen vor und zurück.
00:22:09.180 --> 00:22:14.900
Leider müsst ihr beides für jeden Bahnhof
einzeln abrufen. Das bedeutet, wir können
00:22:14.900 --> 00:22:18.060
uns nicht am Schluss einfach ein Jahr
Daten ziehen, sondern wir müssen wirklich
00:22:18.060 --> 00:22:21.520
über das ganze Jahr hinweg mit ein
bisschen Infrastruktur sehr häufig Daten
00:22:21.520 --> 00:22:27.240
abrufen, die sich überlappen. Solche
Szenarios findet man relativ häufig. Das
00:22:27.240 --> 00:22:29.130
funktioniert dann so, dass man die
Downloads einfach erst einmal weg
00:22:29.130 --> 00:22:34.500
speichert und konkrete Werte auslesen und
Duplikate raus sortieren - das passiert
00:22:34.500 --> 00:22:38.280
dann einfach alles später. Und jetzt
machen wir mal eine Nebenrechnung auf. Wir
00:22:38.280 --> 00:22:42.740
haben sechseinhalbtausend Bahnhöfe in
Deutschland. Für jeden müssen wir einzeln
00:22:42.740 --> 00:22:47.680
beides abrufen, also mal zwei. Und jetzt
sagen wir mal, wir machen das alle zehn
00:22:47.680 --> 00:22:55.480
Minuten für Fahrplan und Änderungen. Das
macht dann 6600 mal 2 mal 144. Das sind
00:22:55.480 --> 00:23:00.970
knapp zwei Millionen Abrufe am Tag. So ein
Abruf hat im Durchschnitt 22 KB bei den
00:23:00.970 --> 00:23:05.520
Veränderungsdaten, ein bisschen weniger
bei den Plandaten und wir würden dann so
00:23:05.520 --> 00:23:12.211
bei 40 Gigabyte XML landen, am Tag. Für
das ganze Jahr - ja das parst sich dann
00:23:12.211 --> 00:23:22.360
auch nicht mehr von alleine. Für das ganze
Jahr wären das dann 14 TB in 700 Millionen
00:23:22.360 --> 00:23:29.200
Requests. Diesen Moment kriegen die Admins
der Bahn vermutlich einen Herzanfall. Wenn
00:23:29.200 --> 00:23:33.650
sie damit fertig sind, dann werden sie in
ihre Logs schauen welche Abrufe von mir
00:23:33.650 --> 00:23:38.340
sind, und dann werden Sie Ihren Anwalt
anrufen, um mir eine riesige Rechnung zu
00:23:38.340 --> 00:23:42.700
schicken. Aber die enttäuschen wir jetzt.
Natürlich habe ich das nicht so gemacht.
00:23:42.700 --> 00:23:46.960
Erstmal hätte ich das speichern und
verarbeiten müssen, das viel zu aufwendig.
00:23:46.960 --> 00:23:50.310
Und zweitens ist eine Sache ganz wichtig,
wenn ihr so etwas macht. Ihr müsst den
00:23:50.310 --> 00:23:55.300
Traffic minimieren, und zwar aus zwei
Gründen. Das sind die Punkte 2 und 3.
00:23:55.300 --> 00:24:01.110
Punkt 2: Handelt verantwortungsvoll. Das
bedeutet, dass Ihr bitte nicht so viel
00:24:01.110 --> 00:24:05.700
Traffic erzeugt, dass ihr die
Infrastruktur des Ziels abwürgt oder
00:24:05.700 --> 00:24:09.340
irgendwie unnötige Kosten verursacht. Das
ist jetzt realistischer, als es sich
00:24:09.340 --> 00:24:13.720
anhört,vielleicht nicht bei der Bahn, aber
beispielsweise bei den Justizportalen in
00:24:13.720 --> 00:24:18.401
Deutschland müsst ihr aufpassen. Die sind
erstaunlich schwach auf der Brust...
00:24:18.401 --> 00:24:26.980
Hab ich gehört. Gelächter und Applaus
00:24:26.980 --> 00:24:35.260
Meine Lösung dafür: Ich rufe
maximal stündlich ab und auch nur die ca.
00:24:35.260 --> 00:24:39.550
350 Fernbahnhöfe, das sind dann statt der
zwei Millionen sofort nur noch 16 000
00:24:39.550 --> 00:24:43.180
Requests am Tag. In der Regel ist das
nochmal deutlich geringer, weil man das
00:24:43.180 --> 00:24:49.060
adaptiv machen kann. Und in diesem Moment
kriegen die Admins zwar keinen Herzanfall
00:24:49.060 --> 00:24:52.740
mehr, aber die sind trotzdem enttäuscht,
weil sich dafür keine Rechnung mehr lohnt.
00:24:52.740 --> 00:25:01.930
Punkt 3: Fliegt unter dem Radar. Sowas soll
ja eine Weihnachtsüberraschung bleiben. Da
00:25:01.930 --> 00:25:05.830
wäre es natürlich schlecht gewesen, wenn
die Millionen Abrufe vom Server D. Kriesel
00:25:05.830 --> 00:25:09.340
kommend irgendwie in ihren Logs stehen
haben. Das fällt nämlich irgendwann auf.
00:25:09.340 --> 00:25:13.220
Und die Lösung hierfür ist Ihr schickt
die Abfragen über Tausende
00:25:13.220 --> 00:25:16.670
Zwischenstationen in der ganzen Welt. In
der Fachsprache heißen die "anonyme
00:25:16.670 --> 00:25:24.630
Proxys". Mit anderen Worten: Wenn ich
Massen von Daten runterlade, dann sieht
00:25:24.630 --> 00:25:28.980
das für das Ziel aus wie so ein
Grundrauschen von winzigen Abfragen, die
00:25:28.980 --> 00:25:32.150
von der ganzen Welt kommen. Viele von
euch werden das auch so machen. Niemand
00:25:32.150 --> 00:25:35.220
sieht mich, aber in Wirklichkeit laufen
die Daten dann einfach im Hintergrund auf
00:25:35.220 --> 00:25:41.500
meinem Server wieder zusammen - sofern ich
sie nicht crashe. An dieser Stelle
00:25:41.500 --> 00:25:45.360
hören, die Admins der Bahn vermutlich auf
meine Abfrage in ihren Logs zu suchen.
00:25:45.360 --> 00:25:50.240
Und ich freue mich, dass sie jetzt wieder
voll beim Vortrag dabei sind. Damit ich
00:25:50.240 --> 00:25:53.070
euch nicht abschrecke, so einen Aufwand
müsst ihr nicht bei jedem Datenprojekt
00:25:53.070 --> 00:25:56.740
treiben. Das war vielleicht ein bisschen
Overkill, weil ich das mal ausprobieren
00:25:56.740 --> 00:26:02.920
wollte mit den Proxys. Punkt 4: Es kann
passieren, dass ihr nicht sicher seid,
00:26:02.920 --> 00:26:08.330
was ihr rechtlich dürft ohne dranzukommen.
Die meisten unter uns sind keine Juristen,
00:26:08.330 --> 00:26:11.080
und manche AGB sind auch einfach mies
formuliert. Und wenn ihr nicht sicher
00:26:11.080 --> 00:26:15.830
seid, was ihr dürft, dann fragt einen
Anwalt, der für euch die AGB liest. Es
00:26:15.830 --> 00:26:19.820
gibt im Internet Portale, wo ihr für
schmales Geld Anwälten Fragen stellen
00:26:19.820 --> 00:26:24.010
könnt, und danach kriegt ihr eine
rechtsverbindliche Antwort. Wenn das
00:26:24.010 --> 00:26:30.230
nicht stimmt, haftet der. Bei mir kam dann
leider raus, dass ich bei der Bahn lieber
00:26:30.230 --> 00:26:33.730
eine schriftliche Genehmigung erfragen
sollte. Und das war so ein Moment, wo ich
00:26:33.730 --> 00:26:37.370
kurz dachte, dass das Projekt vielleicht
auf der Kippe steht. Und das wäre schade
00:26:37.370 --> 00:26:40.470
gewesen, weil ich mir vorab schon ein
bisschen Arbeit gemacht hatte. Also lest
00:26:40.470 --> 00:26:46.980
zuerst die AGB. Und Punkt 5: Habt trotz
Hindernissen den Mut, es einfach zu tun.
00:26:46.980 --> 00:26:52.150
Ich hab dann gepokert und wirklich bei
der Bahn nachgefragt, ob ich automatisiert
00:26:52.150 --> 00:26:56.663
Daten runterladen und darüber zum Beispiel
einen kleinen Communityvortrag halten darf.
00:26:56.663 --> 00:26:57.510
Lachen
00:26:57.510 --> 00:27:08.350
Applaus
Und sie haben es mir genehmigt. Ohne
00:27:08.350 --> 00:27:12.860
weitere Auflagen. Ohne Auflagen und ob sie
wirklich so offen sind oder einfach
00:27:12.860 --> 00:27:17.770
vergessen haben zu googlen, weiß ich
nicht. Aber ganz ehrlich: Das könnte
00:27:17.770 --> 00:27:20.050
jetzt mal einen Applaus für die Bahn wert
sein. Das ist sportlich.
00:27:20.050 --> 00:27:31.119
Applaus
Nicht schlecht. Ich hoffe, die hören zu.
00:27:31.119 --> 00:27:36.430
Und Punkt 6: Seid fair bei der Auswertung,
wenn ihr Daten für ein Jahr habt, zum
00:27:36.430 --> 00:27:38.990
Beispiel, dann sucht ihr nicht die 4
Monate heraus, wo die Bahn besonders
00:27:38.990 --> 00:27:43.930
unpünktlich war, damit ihr fiesere Dinge
behaupten könnt. Gängiges Mittel. Und das
00:27:43.930 --> 00:27:49.280
Wichtigste zuletzt - Punkt 7: Guckt, ob
ihr euren eigenen Daten vertrauen könnt.
00:27:49.280 --> 00:27:51.920
Und das ist gar nicht so einfach. Und ich
führe das jetzt mal vor. Und dann könnt
00:27:51.920 --> 00:27:54.731
ihr entscheiden, ob wir meinen Daten
vertraut. Und außerdem ist das jetzt
00:27:54.731 --> 00:27:58.620
unsere Ausrede, dass wir diesen Einschub
verlassen und endlich wieder in die Daten
00:27:58.620 --> 00:28:02.860
reingucken. Am besten schafft Ihr
Vertrauen in einen Datensatz, indem ihr
00:28:02.860 --> 00:28:07.590
eine Analyse komplett nachbaut, die
Quelle des Datensatzes, also hier die
00:28:07.590 --> 00:28:13.060
Bahn, schon mal gemacht hat. Die Bahn gibt
auf ihrer Webseite ja pro Monat die
00:28:13.060 --> 00:28:17.870
Prozentzahl der pünktlichen Stopps an. Und
in Ihren Dokumenten steht auch, wie sie
00:28:17.870 --> 00:28:22.120
das exakt ausrechnen. Und die hab ich
einfach genau so nachgebaut und siehe
00:28:22.120 --> 00:28:27.711
da: Das sieht wirklich fast genauso aus.
Die zwei größten Abweichungen sind die
00:28:27.711 --> 00:28:33.400
folgenden: Im Januar messe ich die Bahn
einen halben Prozentpunkt schlechter, als
00:28:33.400 --> 00:28:37.050
sie ist. Das liegt vermutlich daran, dass
ich erst am 8. Januar angefangen habe,
00:28:37.050 --> 00:28:42.720
Daten aufzunehmen. Und im September 0,8
Prozentpunkte. Das ist da, wo mir ein paar
00:28:42.720 --> 00:28:47.200
Tage fehlen. Ansonsten scheint bei mir
die Bahn sogar generell minimal besser
00:28:47.200 --> 00:28:51.860
wegzukommen. Exakt die gleichen Werte
werdet ihr nie kriegen. Die meisten
00:28:51.860 --> 00:28:55.850
Abweichungen sind hier um 0,1
Prozentpunkte, aber für eine Messung von
00:28:55.850 --> 00:29:01.150
außen ist das verdammt akkurat. Wenn eure
Werte mit denen des Ziels so
00:29:01.150 --> 00:29:05.080
übereinstimmen, dann seid ihr auf einem
guten Weg. Das heißt externe
00:29:05.080 --> 00:29:08.410
Verifikation, weil wir etwas Externes zum
Vergleichen hatten. Jetzt kommt die
00:29:08.410 --> 00:29:12.570
interne, das bedeutet, ihr guckt in den
Datensatz rein, ob da alles realistisch
00:29:12.570 --> 00:29:18.020
aussieht - zum Beispiel anhand der
Tageszeiten. Jeder Punkt hier ist wieder
00:29:18.020 --> 00:29:22.770
ein Fernverkehrsbahnhof. Das ist der
Tagesbeginn um 0 Uhr vom 9. März diesen
00:29:22.770 --> 00:29:26.860
Jahres. Ich gehe jetzt die Zeit Stunde
für Stunde durch, und dann sehen wir, wie
00:29:26.860 --> 00:29:31.080
so ein Tag für die Bahn aussieht. Die
Bahnhofspunkte schwellen an, wenn in der
00:29:31.080 --> 00:29:34.950
Stunde mehr Stopps stattgefunden haben.
Und die Farbe markiert die Ausfälle: Blau
00:29:34.950 --> 00:29:38.640
ist wenig, Rot ist viel, dunkelrot
entspricht 50 Prozent oder mehr
00:29:38.640 --> 00:29:45.660
Ausfällen. Und es ist jetzt null Uhr, und
man sieht, dass noch einige wenige Züge
00:29:45.660 --> 00:29:52.200
des Vortages sozusagen unterwegs sind. Die
Lumpensammler sozusagen. Und das wird
00:29:52.200 --> 00:29:56.730
jetzt immer weniger werden, und die
Nachtruhe kehrt ein. Die Zeit vergeht.
00:29:56.730 --> 00:30:04.150
Nachtruhe. Und hier erwacht ein neuer Tag.
Jetzt ist so langsam Vollbetrieb, es ist
00:30:04.150 --> 00:30:10.141
8 Uhr. Wir sehen hier ein paar punktuelle
Ereignisse, die für Ausfälle sorgen. Das
00:30:10.141 --> 00:30:15.980
sind die roten Flecken, da ist Unwetter
oder so passiert. Keine Notizen. Es ist
00:30:15.980 --> 00:30:27.330
Mittag. Jetzt wird es wieder weniger. Der
Tag geht seinem Ende entgegen. Die letzte
00:30:27.330 --> 00:30:31.210
Stunde des Tages. Ein neuer Tag beginnt:
Das ist der zehnte März. Wir sehen wieder
00:30:31.210 --> 00:30:37.570
die letzten Züge bevor die Nachtruhe
beginnt. Alles schläft. Der Tag wird
00:30:37.570 --> 00:30:42.720
älter, es ist 6 Uhr. Man sieht schon ein
bisschen Traffic. Es ist 9 Uhr, wir sind
00:30:42.720 --> 00:30:47.630
wieder im Vollbetrieb. Es ist Mittag am
10. März, und wir erinnern uns: An dem
00:30:47.630 --> 00:31:01.040
Tag war ja was. Und hier zeigt der Orkan
Eberhard erste Auswirkungen. Hier hat er
00:31:01.040 --> 00:31:04.610
dann in fast ganz Deutschland den
Fernverkehr flachgelegt. Ich musste die
00:31:04.610 --> 00:31:11.130
Farbskala erweitern, weil man 50 Prozent
Ausfälle normal nicht hat. Wir lassen
00:31:11.130 --> 00:31:15.920
diesen sehr schlechten Tag für die Bahn
nun ausklingen. Und hier ist wieder
00:31:15.920 --> 00:31:20.390
Mitternacht, die Grenze zum Folgetag. Eine
Störung in der Größenordnung zieht
00:31:20.390 --> 00:31:24.240
natürlich noch einige Tage messbarer
Verspätungen und Ausfälle nach sich. Wenn
00:31:24.240 --> 00:31:27.900
man das aufblühte, sieht man das mehrere
Tage runtergehen. Die spielen wir jetzt
00:31:27.900 --> 00:31:32.270
aber nicht alle durch. Aber wir sehen:
Nicht immer Ist die Bahn schuld. Wenn ihr
00:31:32.270 --> 00:31:38.130
die Daten so auf Plausibilität checkt, da
nutzt unbedingt gute Visualisierungen,
00:31:38.130 --> 00:31:42.470
die am besten gleich mehrere Dimensionen
abdecken. Hier hatten wir Ausfälle und
00:31:42.470 --> 00:31:47.050
Ort, das sind zwei Dimensionen und die
Anzahl der Stopps und die Zeit nach
00:31:47.050 --> 00:31:52.090
Stunden. Der beste Apparat zu
Mustererkennung, den wir zurzeit haben,
00:31:52.090 --> 00:31:56.340
das ist nun mal das Gehirn. Und da gibt's
nur eine Breitbandleitung hin, und das
00:31:56.340 --> 00:32:02.370
sind die Augen. Wir werden jetzt noch ein
paar größere Auswertungen machen, und als
00:32:02.370 --> 00:32:07.370
erstes bitte ich euch dafür, in Gedanken
die Seiten zu wechseln. Stellt euch vor,
00:32:07.370 --> 00:32:13.510
ihr gebt keine Analysen raus, sondern ihr
lest welche. Und wenn ihr Analysen lest,
00:32:13.510 --> 00:32:18.230
die andere euch geben, dann ist es immer
sehr wichtig zu riechen, worüber die
00:32:18.230 --> 00:32:23.470
anderen mit euch nicht reden möchten. Und
bei Firmen findet man das heraus, indem
00:32:23.470 --> 00:32:29.580
man deren Kennzahlen genau anguckt. Die
Bahn hat zum Beispiel gesagt, sie wollte
00:32:29.580 --> 00:32:33.530
dieses Jahr 76,5% pünktliche Stopps
haben. Daran wollen sie sich messen.
00:32:33.530 --> 00:32:39.740
Dieser Bericht ist aus dem Januar 2019,
und Anfang Dezember 2019 haben sie das
00:32:39.740 --> 00:32:46.390
Ziel dann kassiert. Es werden nur unter
75% pünktlicher Stopps im Fernverkehr. In
00:32:46.390 --> 00:32:50.940
meinen Daten sind es im Moment noch
knapp über 75%. Aber trotzdem:
00:32:50.940 --> 00:32:56.000
eigentliches Ziel wird verfehlt. Aber was
insgesamt auffällt, ist, dass sich die
00:32:56.000 --> 00:33:01.650
Bahn zu Ausfällen - ich sagte das schon -
ganz komisch ausschweigt. Und jetzt bitte
00:33:01.650 --> 00:33:05.840
ich mal um Handzeichnungen von Euch.
Stellt euch vor, ihr steht am Bahnsteig,
00:33:05.840 --> 00:33:11.860
und der Zug fällt einfach aus. Ihr steht
da mit leerem Blick und der kommt einfach
00:33:11.860 --> 00:33:15.860
nicht. Und ihr dürft jetzt entscheiden:
Ist der pünktlich oder unpünktlich? Wer
00:33:15.860 --> 00:33:22.240
von euch würde sagen, der ist eher
pünktlich? Ich sehe zwei Hände... drei im
00:33:22.240 --> 00:33:29.370
Saal von 5000 Mann... Okay, ist messbar.
Und wer würde sagen, der Zug ist eher
00:33:29.370 --> 00:33:39.000
unpünktlich? Uiuiui, das sind so ziemlich
alle. Und so sehe ich das eigentlich auch.
00:33:39.000 --> 00:33:42.170
Und jetzt schauen wir mal in die
Unterlagen der Bahn dazu. Ihr müsst das
00:33:42.170 --> 00:33:46.020
nicht lesen, ich lese euch das vor.
"Komplettausfälle oder Teilausfälle
00:33:46.020 --> 00:33:49.210
werden - wie übrigens bei den anderen
europäischen Bahnen auch - nicht in
00:33:49.210 --> 00:33:52.790
Statistiken eingerechnet. Zum einen ist es
schwierig, dafür ein sinnvolles
00:33:52.790 --> 00:33:59.000
mathematisches Modell zu hinterlegen."
What? "Welche Pünktlichkeit ordnet man
00:33:59.000 --> 00:34:02.590
einem Zug zu, wenn er an einer bestimmten
Stelle seiner Fahrt ausfällt?" Wir können
00:34:02.590 --> 00:34:05.981
binär messen, ob drei von acht Stopps
pünktlich oder nicht pünktlich sind, aber
00:34:05.981 --> 00:34:11.210
mit ausgefallen nicht ausgefallen - das
geht nicht. Und "zum anderen liegt die
00:34:11.210 --> 00:34:16.609
sogenannte Erfüllungsquote aller täglich
verkehrenden DB-Personenzüge über 99
00:34:16.609 --> 00:34:22.300
Prozent im Jahresschnitt sowohl für Fern-
als auch für Nahverkehr." Also Punkt 1: Da
00:34:22.300 --> 00:34:26.490
möchte ich als erstes Mal anmerken, dass
ich das in der Sache nicht nachvollziehen
00:34:26.490 --> 00:34:30.210
kann, weil wir schon gesehen hatten, dass
alleine der Fernverkehr eine Ausfallquote
00:34:30.210 --> 00:34:35.070
von mehr als vier Prozent hat und nicht
ein Prozent. Das heißt, wir haben
00:34:35.070 --> 00:34:45.120
insgesamt 103% Fernverkehr. Aber
vielleicht ist die Erfüllungsquote auch
00:34:45.120 --> 00:34:48.170
etwas anderes, was ich hier nicht
verstehe. Keine Ahnung. Aber vor allem:
00:34:48.170 --> 00:34:52.600
So ein ausgefallener Zug ist, der ist
nicht unpünktlich, der fällt einfach
00:34:52.600 --> 00:34:57.371
komplett aus der Wertung. Die Ausfälle
werden statistisch verdeckt, weil man sie
00:34:57.371 --> 00:35:02.780
angeblich nicht statistisch einbauen
kann. Also, liebe Leute, ich mache solche
00:35:02.780 --> 00:35:07.060
Auswertungen ja auch beruflich, und da
habe ich echt schon manche Ausrede zu
00:35:07.060 --> 00:35:11.620
hören gekriegt. Aber das ist schon krass.
Ich nenne sowas den "finalen
00:35:11.620 --> 00:35:15.700
Rettungsstuss".
Lachen
00:35:15.700 --> 00:35:23.960
Applaus
Wenn ihr so etwas erzählt kriegt, dann
00:35:23.960 --> 00:35:29.970
wisst ihr ganz genau: Ihr habt es
gefunden, hier müsst ihr gucken und nicht
00:35:29.970 --> 00:35:35.010
woanders. Also helfen wir jetzt mit, und
wir entwickeln jetzt eine Idee, wie man
00:35:35.010 --> 00:35:39.220
die Ausfälle doch sinnvoll in die
Statistik reinkriegt. Hier sehen wir eine
00:35:39.220 --> 00:35:44.010
Zugfahrt mit vier Stopps. Die beiden
weißen links sind pünktlich, der hellblaue
00:35:44.010 --> 00:35:51.080
ist unpünktlich, > 6 Minuten, und der
rechte in rot ist ganz ausgefallen. Im
00:35:51.080 --> 00:35:55.190
Moment zählt die Bahn einfach alle Stopps,
die nicht ausgefallen sind, und misst
00:35:55.190 --> 00:35:58.900
davon den Prozentsatz der Pünktlichkeit.
Das wären hier zwei von drei - 66
00:35:58.900 --> 00:36:03.660
Prozent. Und ich schlage stattdessen vor:
Wir zählen alle Stopps, die geplant
00:36:03.660 --> 00:36:08.940
waren, und messen davon den Prozentsatz,
der angekommen ist und pünktlich war. Das
00:36:08.940 --> 00:36:14.370
wären hier 50%. Nehmt das nicht auf die
leichte Schulter - das ist jetzt wirklich
00:36:14.370 --> 00:36:17.559
große Mathematik.
Lachen
00:36:17.559 --> 00:36:26.120
Bahnbrechend sozusagen.
Lachen und Applaus
00:36:26.120 --> 00:36:32.291
Applaus
Und wenn man mit den Ausfällen ehrlich
00:36:32.291 --> 00:36:38.080
umgeht, dann liegt die Bahn nicht bei den
76,5% Pünktlichkeit, das waren die
00:36:38.080 --> 00:36:44.910
angekündigten, und auch nicht bei 75%, das
ist der aktuelle Wert, sondern bei 72,5%.
00:36:44.910 --> 00:36:49.062
Und mit jedem Prozent weniger wird es
sehr viel unwahrscheinlicher, dass Leute
00:36:49.062 --> 00:36:52.560
ihre Anschlüsse kriegen. Also
unterschätzt das nicht, wenn das nochmal
00:36:52.560 --> 00:36:56.890
zwei Prozent weniger sind, als sie
behaupten oder drei. Das ist knackig. Beim
00:36:56.890 --> 00:37:01.910
Fernverkehr liegt bei denen einiges im
Argen. Damit möchte ich zum wichtigen
00:37:01.910 --> 00:37:06.910
Thema kommen: Erfolgskriterien in
Unternehmen. Wenn ihr als Unternehmen eure
00:37:06.910 --> 00:37:11.420
Erfolgskriterien schlecht setzt, dann
schafft ihr Anreize, die das Unternehmen
00:37:11.420 --> 00:37:17.550
in eine unerwartete Richtung lenken. Hier
haben wir ein Paradebeispiel dafür. Wenn
00:37:17.550 --> 00:37:23.250
die Bahn einen unpünktlichen Zug einfach
spontan ausfallen lässt, dann steht die
00:37:23.250 --> 00:37:27.720
nach ihrer eigenen Messmethode danach
besser da und nicht schlechter, weil die
00:37:27.720 --> 00:37:32.100
Ausfälle einfach komplett aus der
Statistik fliegen. Also müssen wir uns die
00:37:32.100 --> 00:37:36.920
Frage stellen: Wo genau lohnt es sich für
die Bahn am meisten, ein paar Ausfälle zu
00:37:36.920 --> 00:37:40.080
erzeugen, um damit die
Pünktlichkeitsstatistik zu pushen?
00:37:40.080 --> 00:37:42.460
Lachen
Applaus
00:37:42.460 --> 00:37:49.700
Ihr klatscht ja schon vorher. So kann ich
nicht arbeiten.
00:37:49.700 --> 00:37:54.430
Lachen
Die Lösung ist am Ende und am Anfang von
00:37:54.430 --> 00:37:59.270
Fahrten. Züge fahren nämlich häufig
dieselbe Strecke hin und her und der hier
00:37:59.270 --> 00:38:04.830
fährt los. Bis hier ist alles gut
gegangen. Hier hat er dann satt Verspätung
00:38:04.830 --> 00:38:09.270
angesammelt. Das passiert. An diesem Punkt
ist zu erwarten, dass die letzten beiden
00:38:09.270 --> 00:38:14.200
Halte auch verspätet sein werden. Und auch
die ersten beiden halte der Rückfahrt
00:38:14.200 --> 00:38:18.000
natürlich, also schlecht für die
Statistik. Also lassen wir sie doch
00:38:18.000 --> 00:38:22.260
einfach ausfallen. Blasen wir ab, der Zug
schmeißt die Fahrgäste raus, dreht an Ort
00:38:22.260 --> 00:38:25.240
und Stelle um und ist wieder pünktlich.
Und wer an den roten Stopps einsteigen
00:38:25.240 --> 00:38:33.488
und aussteigen will, der steht halt mit
leerem Blick am Gleis. Aber die
00:38:33.488 --> 00:38:37.450
Verspätungsstatistik verbessert sich, denn
die Ausfälle fallen ja einfach unter den
00:38:37.450 --> 00:38:43.090
Tisch. Aber wie könnte man so etwas
messen? Ganz einfach.
00:38:43.090 --> 00:38:46.290
Publikumseinruf: Hamburg.
D: Hackburg?
00:38:46.290 --> 00:38:51.810
Publikumseinruf: Hamburg.
D: Oh ja. Also, ganz einfach: Hier ist
00:38:51.810 --> 00:38:57.230
wieder eine Zugfahrt mit all ihren Stopps,
die unterteilen wir jetzt einfach in drei
00:38:57.230 --> 00:39:00.270
Klassen - frühe, mittlere und späte
Stopps. Die frühen und späten Stopps sind
00:39:00.270 --> 00:39:05.870
die ersten und letzten drei, hier grau und
die mittleren sind der Rest. Und für
00:39:05.870 --> 00:39:11.520
diese drei Arten Stopps machen wir
getrennte Auswertung. Wenn Ausfälle
00:39:11.520 --> 00:39:17.720
aufgrund technischen Betriebes entstehen,
würde man ja erwarten, dass es am Start
00:39:17.720 --> 00:39:21.560
an einer Fahrt statistisch weniger
Ausfälle gibt. Und dann werden das so
00:39:21.560 --> 00:39:27.140
über die Zeit mehr. Und beim IC ist das
auch genaus. Die Ausfälle steigen nach
00:39:27.140 --> 00:39:33.910
hinten an. Und beim ICE dagegen, fallen
die ersten und letzten Stopps häufiger
00:39:33.910 --> 00:39:38.490
aus. Das passt alles genau. Die scheinen
die Dinger einfach hart zu wenden. Ich
00:39:38.490 --> 00:39:42.290
habe dieses Verhalten auch von zwei
unabhängigen Quellen bestätigt bekommen,
00:39:42.290 --> 00:39:46.162
und das war vor einiger Zeit schon mal
irgendwo klein in der Presse. Also ich
00:39:46.162 --> 00:39:49.320
verrate hier auch keine
Staatsgeheimnisse. Und je nachdem, wen man
00:39:49.320 --> 00:39:53.600
fragt, heißt dieses Vorgehen entweder
nach unserem Verkehrsminister die Scheuer-
00:39:53.600 --> 00:39:59.261
Wende oder aber nach dem Bahnvorstand,
die Pofalla-Wende. Das müssen wir jetzt
00:39:59.261 --> 00:40:03.640
heute Abend beim Bier entscheiden, was
ihr jetzt besser findet. Jedenfalls ein
00:40:03.640 --> 00:40:08.740
weiterer Praxistipp Vorsicht am Anfang
und am Ende eines ICE-Zuglaufs. Die fallen
00:40:08.740 --> 00:40:14.291
gerne mal aus. Bucht die nach Möglichkeit
nicht. Aus Gründen der Neutralität, muss
00:40:14.291 --> 00:40:18.680
ich dazusagen: Die Bahn hat natürlich ein
Interesse daran, dass das ganze Netz
00:40:18.680 --> 00:40:22.560
ungefähr im Plan ist. Also werden die
sich denken, dass bei so einem Manöver
00:40:22.560 --> 00:40:27.020
nicht so viele Passagiere von den
Ausfällen betroffen sind, dafür aber im
00:40:27.020 --> 00:40:30.410
weiteren Verlauf deutlich mehr Passagiere
einen pünktlichen Zug kriegen ist. Das ist
00:40:30.410 --> 00:40:35.680
eben deren Geschäftsentscheidung. Es liegt
mir fern, da jetzt von der Seitenlinie
00:40:35.680 --> 00:40:40.090
ohne tieferes Wissen altkluge Ratschläge
zu erteilen. Wir sind hier nicht auf
00:40:40.090 --> 00:40:44.810
Twitter. Was ich hier kritisiere...
Lachen
00:40:44.810 --> 00:40:48.840
Applaus
Und was ich hier kritisieren möchte, ist
00:40:48.840 --> 00:40:53.880
aber, dass ausschließlich die positive
Seite des Manövers danach in der Statistik
00:40:53.880 --> 00:40:59.060
auftaucht und die negative einfach
verschwindet. Das stört. Wir wollen gar
00:40:59.060 --> 00:41:02.120
nicht wissen, wie viele Leute im
Verkehrsministerium denen das abgekauft
00:41:02.120 --> 00:41:06.840
haben. Wir hatten jetzt schon ein
bisschen Praxistipps gesehen, die euch zu
00:41:06.840 --> 00:41:09.780
Hause beim Buchen vielleicht ein
bisschen was bringen. Vorsicht mit
00:41:09.780 --> 00:41:15.430
bestimmten Bahnhöfen; Vorsicht mit ICEs
im Allgemeinen; Vorsicht mit ICEs im
00:41:15.430 --> 00:41:19.610
Sommer im Speziellen; Vorsicht, wenn
Züge schon lange unterwegs waren;
00:41:19.610 --> 00:41:23.380
Vorsicht, wenn sie 40 Minuten oder mehr
verspätet sind und jetzt gerade Vorsicht
00:41:23.380 --> 00:41:30.090
mit ICEs am Anfang und am Ende der Fahrt
wegen der Scheuer-Wenden. Ich könnte
00:41:30.090 --> 00:41:32.693
jetzt mit euch noch jede Menge
Standardkram machen, der sich irgendwie
00:41:32.693 --> 00:41:36.370
aus den Daten ergibt: Top Ten Bahnhöfe
oder Zuglinien nach Verspätungen,
00:41:36.370 --> 00:41:41.230
Ausfällen und so weiter. Aber das hilft
doch nur wenigen, ganz ehrlich. Also
00:41:41.230 --> 00:41:45.550
machen wir jetzt noch zwei Sachen: Erstens
machen wir unsere letzte große Sache mit
00:41:45.550 --> 00:41:50.230
den Bahndaten, und ich hoffe, dass ihr
davon zumindest für ein paar Monate ganz
00:41:50.230 --> 00:41:55.260
konkret was habt. Danach würde ich mit
euch gerne kurz über das ausklingende
00:41:55.260 --> 00:42:00.300
Jahrzehnt nachdenken. Zuerst die
Datensache. Wenn ihr ein Bahnticket kauft,
00:42:00.300 --> 00:42:04.800
könnt ihr wählen. Mit Spartickets seid
ihr an exakt die Züge, die ihr gebucht
00:42:04.800 --> 00:42:09.390
habt, gebunden. Oder ihr nehmt ein
Flexticket, das ist deutlich teurer, aber
00:42:09.390 --> 00:42:14.910
dafür habt ihr keine Zugbindung.
Interessant ist nun folgende Regel: auf
00:42:14.910 --> 00:42:19.130
den Spartickets, wenn Sie durch
Verschulden der DB ihren Anschlusszug
00:42:19.130 --> 00:42:22.850
nicht erwischen oder allgemein eine
Verspätung von mehr als 20 Minuten
00:42:22.850 --> 00:42:27.720
erwartet werden muss, wird die Zugbindung
automatisch aufgehoben. Ich verstehe das
00:42:27.720 --> 00:42:33.210
so, dass ihr dann eigentlich ein Flex
Ticket habt plötzlich. Und dann gucken
00:42:33.210 --> 00:42:37.570
wir mal auf den Prozentsatz der Stopps,
die entweder mehr als 20 Minuten zu spät
00:42:37.570 --> 00:42:43.730
waren oder aber ausgefallen sind und
insgesamt sind das immerhin 12,4%. Und
00:42:43.730 --> 00:42:47.800
wenn man jetzt diese Stopps erwischt,
dann verwandeln die einem vielleicht schon
00:42:47.800 --> 00:42:51.730
vor Abfahrt ein preiswertes Sparticket in
ein Flexticket. Und das wäre doch total
00:42:51.730 --> 00:42:56.260
cool, wenn man die vorher wissen könnte.
Lachen
00:42:56.260 --> 00:43:04.361
Applaus
Bin ich so vorhersehbar? Und komplett
00:43:04.361 --> 00:43:08.700
vorhersehen geht natürlich nicht. Aber es
gibt Züge, bei denen sowas häufiger
00:43:08.700 --> 00:43:11.460
auftritt und Bahnhöfe, bei denen sowas
häufiger auftritt und es gibt auch
00:43:11.460 --> 00:43:14.580
Wochentage, bei denen sowas häufiger
auftritt.
00:43:14.580 --> 00:43:23.030
Lachen
Und hier ist ein Beispiel. Lest mal mit.
00:43:23.030 --> 00:43:28.990
Das bedeutet beim Intercity 2221 ist an
allen Halten bei Mainz Hauptbahnhof an
00:43:28.990 --> 00:43:33.690
allen Mittwochen dieses Jahr mit 53%
Wahrscheinlichkeit die Zugbindung
00:43:33.690 --> 00:43:39.230
aufgehoben. Also von allen Stopps, die ich
dazu erfasst habe, waren 53% entweder mehr
00:43:39.230 --> 00:43:44.000
als 20 Minuten zu spät oder sind ganz
ausgefallen. Und am Freitag das Ganze mit
00:43:44.000 --> 00:43:49.580
50 Prozent. Ich muss die Schreibweise so
kurz machen und euch das so beibringen,
00:43:49.580 --> 00:43:54.340
das Lesen, damit ich jetzt gleich
platzsparend arbeiten kann. Euch schwant
00:43:54.340 --> 00:43:58.080
vermutlich schon, was ich jetzt mache.
Also, ich habe für euch mal die
00:43:58.080 --> 00:44:01.860
Kombination aus allen Wochentagen, allen
Bahnhöfen und allen Fernzügen durchsucht
00:44:01.860 --> 00:44:05.880
und habe dann nur die Kombinationen
genommen, wo ich mindestens 10 Datenpunkte
00:44:05.880 --> 00:44:09.960
hatte, damit das einigermaßen fundiert
ist. Und für die habe ich gemessen, bei
00:44:09.960 --> 00:44:13.320
wie viel Prozent die Zugbindung dieses
Zuges an diesem Wochentag, an diesem
00:44:13.320 --> 00:44:16.780
Bahnhof gekillt wurde. Und dann habe ich
gesagt: Ich will nur die ganz Fiesen
00:44:16.780 --> 00:44:21.400
haben, wo das mit mindestens 50 Prozent
der Fälle der Fall war. Herausgekommen
00:44:21.400 --> 00:44:27.200
sind fast 500 Kombinationen aus
Wochentagen, Bahnhöfen und Zügen.
00:44:27.200 --> 00:44:32.660
Hier sind sie.
Applaus
00:44:32.660 --> 00:44:38.670
Also ich würde kein Flexticket für teuer
Geld kaufen, wenn ich an einem dieser
00:44:38.670 --> 00:44:43.370
Bahnhöfe einsteige, aussteigen oder
umsteige an dem Wochentag mit diesem Zug.
00:44:43.370 --> 00:44:46.560
Kauft ein Sparticket. Und für alle, die
das jetzt nicht lesen können, ich stelle
00:44:46.560 --> 00:44:50.630
den Foliensatz wieder irgendwie bei mir
auf die Seite, morgen oder so. Beachtet
00:44:50.630 --> 00:44:55.250
auch, dass die Daten irgendwann ungültig
werden. Ihr behaltet den Zug bitte am
00:44:55.250 --> 00:45:00.350
Fahrtag im Auge. Ich bin nicht schuld,
wenn ihr unverhofft doch pünktlich zum Zug
00:45:00.350 --> 00:45:01.870
eintreten müsst.
Lachen
00:45:01.870 --> 00:45:07.370
Weil die Kiste halt pünktlich ist. Also
bitte, bitte behandelt diese Daten, als
00:45:07.370 --> 00:45:16.370
wären sie mit Xerox-Geräten gescannt.
Lachen und Applaus
00:45:16.370 --> 00:45:21.650
Wenn ihr doch pünktlich da sein müsst,
dann ist das ja auch ein gutes Zeichen,
00:45:21.650 --> 00:45:25.390
weil es nichts anderes bedeutet, als dass
die Bahn was verbessert. Verbesserungen
00:45:25.390 --> 00:45:31.331
passieren nämlich durchaus. Dieses Jahr
wurde zum Beispiel die ICE-Trasse zwischen
00:45:31.331 --> 00:45:34.680
München und Berlin ausgebaut. Da kann man
jetzt unter vier Stunden zwischen beiden
00:45:34.680 --> 00:45:39.150
Städten hin und her fahren, ohne den Zug
zu wechseln. Und wenn das rund läuft, ist
00:45:39.150 --> 00:45:43.651
das echt mal eine Alternative zum Flug. Es
ist also nicht alles schlecht. Ich hoffe
00:45:43.651 --> 00:45:48.840
auch, ich bin bei aller Kritik fair mit
der Bahn umgegangen heute. Ich bin
00:45:48.840 --> 00:45:53.250
jedenfalls, obwohl ich das alles gesehen
habe, mit der Bahn zum Congress gefahren
00:45:53.250 --> 00:45:58.910
und werde das auch auf dem Rückweg machen.
Und für heute möchte ich damit die Bahn-
00:45:58.910 --> 00:46:03.690
Betrachtung abschließen mit den Worten:
Seid nett zur Bahn mit ihren Fehlern. Wir
00:46:03.690 --> 00:46:08.840
haben nur diese eine.
Lachen und vereinzelter Applaus
00:46:08.840 --> 00:46:12.320
Und was bleibt?
Applaus
00:46:12.320 --> 00:46:23.940
Einen habe ich noch. Da kam er [Herald Engel]
schon gelaufen. Das hier ist der letzte
00:46:23.940 --> 00:46:27.390
Vortrag, den ich in diesem Jahrzehnt
halten werde. Ich lasse euch jetzt mal ein
00:46:27.390 --> 00:46:32.700
paar Sekunden in Ruhe und wünsche mir,
dass jeder kurz darüber nachdenkt, was für
00:46:32.700 --> 00:46:37.710
ihn in diesem Jahrzehnt die maßgebliche
gesellschaftliche Entwicklung war.
00:46:37.710 --> 00:46:47.003
Ruhepause zum Nachdenken
00:46:47.003 --> 00:46:51.530
Glaube hat jeder was. Für mich ist es der
00:46:51.530 --> 00:46:57.670
Aufstieg der Empörten und damit meine ich
ausdrücklich jede politische Richtung. Ich
00:46:57.670 --> 00:47:02.250
habe in diesem Jahrzehnt tausend Mal an
jeder Ecke gehört, wie wichtig heutzutage
00:47:02.250 --> 00:47:06.680
technische, naturwissenschaftliche und
analytische Skills seien angeblich, mit
00:47:06.680 --> 00:47:11.760
anderen Worten: Rationalität. Und auf der
anderen Seite aber reicht das heute im
00:47:11.760 --> 00:47:16.090
öffentlichen Diskurs als
Totschlagsargument, wenn jemand empört
00:47:16.090 --> 00:47:20.480
ist. Und ich finde das paradox. Das ist
das Gegenteil von Rationalität. Man kann
00:47:20.480 --> 00:47:25.440
nicht beides gleichzeitig propagieren. Und
ich möchte anregen, dass wir für das jetzt
00:47:25.440 --> 00:47:31.820
kommende Jahrzehnt zu einer Kultur finden,
in der es ungern gesehen wird, einfach nur
00:47:31.820 --> 00:47:36.060
alles Mögliche anzuprangern, und in der es
ganz umgekehrt bewundert wird, wenn man
00:47:36.060 --> 00:47:41.060
sich die Datenlage anguckt und sie sich
gegenseitig präsentiert mit seinem
00:47:41.060 --> 00:47:48.420
Kontrahenten und sich dann zusammensetzt.
Und wer soll das starten, wenn nicht wir
00:47:48.420 --> 00:47:53.570
hier. Verlassen wir uns nicht auf die
Medien, denn die leben vom Aufruhr. Auch
00:47:53.570 --> 00:47:58.400
wenn es positive Gegenbeispiele gibt.
Verlassen wir uns nicht auf irgendwelche
00:47:58.400 --> 00:48:03.450
Stars, die leben von Likes und die kriegt
man am besten durch Zuspitzung. In der
00:48:03.450 --> 00:48:07.641
Regel sind die Teil des Problems.
Verlassen wir uns nicht auf Politiker, die
00:48:07.641 --> 00:48:11.510
achten wegen der Shitstorm-Kultur nur noch
darauf, bis zur nächsten Wahl nicht
00:48:11.510 --> 00:48:15.640
anzuecken. Und zu viele von denen haben
ohnehin niemals außerhalb der Politik
00:48:15.640 --> 00:48:21.780
gearbeitet. Was soll da schon kommen? Und
das ist der Grund, warum ich das hier
00:48:21.780 --> 00:48:26.010
mache. Ich versuche, euch zu inspirieren,
eure eigenen Analysen zu strittigen Themen
00:48:26.010 --> 00:48:31.320
anzustellen. Und in meinen letzten
Vorträgen, meinen beiden hier, habt ihr
00:48:31.320 --> 00:48:34.680
ein paar Instinkte davon bekommen, wie das
geht, und ich hoffe, ich habe euch
00:48:34.680 --> 00:48:37.540
bewiesen, dass das absolut keine
Raketenwissenschaft ist.
00:48:37.540 --> 00:48:41.360
Vereinzelter Applaus
Und ich frage nochmal: Wer soll das
00:48:41.360 --> 00:48:45.280
machen, wenn nicht wir hier? Wenn wir es
gemeinsam schaffen, dass wenigstens
00:48:45.280 --> 00:48:51.590
manche, die heute echt nichts Besseres zu
tun haben, als sich im Internet zu empören
00:48:51.590 --> 00:48:55.220
im nächsten Jahrzehnt zur engagierten
Analyse übergehen und dabei auch
00:48:55.220 --> 00:48:59.530
anerkennen, wenn was herauskommt, dass sie
vorher nicht gedacht hätten, dann haben
00:48:59.530 --> 00:49:02.810
wir gesellschaftlich unglaublich viel
gewonnen. Und heute Abend stehe ich hier
00:49:02.810 --> 00:49:07.390
in einem Saal mit 5000 Leuten, voll
belegt. Da sitzen Sie noch neben der
00:49:07.390 --> 00:49:12.860
Tribüne, die sich mit 5000 Leuten, die
sich am Samstagabend zwischen Weihnachten
00:49:12.860 --> 00:49:16.700
und Silvester hier hinsetzen. Also da, wo
die allermeisten Menschen einfach gar
00:49:16.700 --> 00:49:19.810
nichts tun und sich die Flasche Wein an
den Hals anschließen.
00:49:19.810 --> 00:49:24.730
Lachen
Und warum tun die 5000 Leute das? Um einen
00:49:24.730 --> 00:49:27.790
Statistik Vortrag zu hören.
Lachen
00:49:27.790 --> 00:49:32.850
Das gibt mir Hoffnung. Ich werde glücklich
heimfahren. Da kann die Bahn mit mir
00:49:32.850 --> 00:49:36.650
machen, was sie will. Und ich bedanke
mich, dass ihr hier wart, und wünsche euch
00:49:36.650 --> 00:49:39.780
ein schönes neues Jahrzehnt.
00:49:39.780 --> 00:49:52.909
Großer, tosender Applaus
00:49:52.909 --> 00:50:02.840
Standing Ovation
00:50:02.840 --> 00:50:10.134
Applaus
00:50:10.134 --> 00:50:13.390
Jetzt stehen sie wieder auf...
00:50:13.390 --> 00:50:16.424
Applaus
00:50:16.424 --> 00:50:18.097
Danke schön.
00:50:18.097 --> 00:50:26.910
Applaus
00:50:26.910 --> 00:50:30.408
Vielen lieben Dank.
00:50:30.408 --> 00:50:36.760
Herald 1: Wow. Auch von mir nochmal
herzlichen Dank. Super Vortrag wie immer,
00:50:36.760 --> 00:50:40.850
super lustig. Dankeschön David, dass du
das immer wieder machst, echt schön. Wir
00:50:40.850 --> 00:50:45.920
haben noch ein bisschen Zeit für Fragen.
Bitte an die Mikrofone. Es gibt 4, 5
00:50:45.920 --> 00:50:49.630
Stück, glaube ich, hier im Saal, wenn ihr
Fragen habt. Wir fangen mal mit Mikrofon 1
00:50:49.630 --> 00:50:53.381
an.
Frage: Du hast ja damit angefangen, dass
00:50:53.381 --> 00:50:57.150
du der Fairness halber die
Pünktlichkeitsdefinition der Bahn von 6
00:50:57.150 --> 00:51:02.000
Minuten, höchstens, gesetzt hast. Hast du
aus purer Neugier mal Sachen
00:51:02.000 --> 00:51:05.010
durchgerechnet mit
Pünktlichkeitsdefinitionen, die irgendwie
00:51:05.010 --> 00:51:09.119
sinnvoller anfühlen? Müssen ja nicht
gleich die 30 Sekunden aus Japan sein.
00:51:09.119 --> 00:51:12.800
D: Ja, da kann man sich streiten, welchen
Wert man setzt.
00:51:12.800 --> 00:51:17.970
F: Hast du und welche?
D: Ja, habe ich. Das sieht dann so aus,
00:51:17.970 --> 00:51:22.060
als wenn man das eng zieht, am Schluss
natürlich alle Züge verspätet sind. Jeder
00:51:22.060 --> 00:51:28.880
hat mal irgendwie eine Minute. Was ich
gemacht habe, war: Ich habe mal eine
00:51:28.880 --> 00:51:32.330
Reibungslos-Metrik gesetzt. Reibungslos,
habe ich gesagt, das ist alles, was
00:51:32.330 --> 00:51:38.171
maximal 3 Minuten zu spät ist, nicht
ausgefallen und keinen Gleiswechsel, weil
00:51:38.171 --> 00:51:40.840
das geht mir immer unglaublich auf die
Nerven, wenn ich dann mit Koffer einmal
00:51:40.840 --> 00:51:44.730
hoch und runter... Und das waren dann
irgendwie 60%. Aber nagele mich jetzt
00:51:44.730 --> 00:51:50.170
darauf nicht fest. Ich habe es jetzt
nicht im Kopf, aber es waren deutlich
00:51:50.170 --> 00:51:52.780
weniger. Ich glaube, es war bei 60% oder
so, diese Pünktlichkeit.
00:51:52.780 --> 00:51:55.800
F: Danke.
Herald 1: Ich weiß jetzt nicht, welches
00:51:55.800 --> 00:51:58.410
Mikro Erster war. Wir fragen mal den
Signal Angel, der hat eine Frage.
00:51:58.410 --> 00:52:01.837
Signal Angel: Also der Stream schließt
sich den Standing Ovations an.
00:52:01.837 --> 00:52:04.619
D: Danke schön!
Signal: Und es gab viele Leute, die darauf
00:52:04.619 --> 00:52:07.670
hingewiesen haben, dass für ausgefallene
Züge oft Ersatzfahrten bereitgestellt
00:52:07.670 --> 00:52:08.670
werden.
D: Ja.
00:52:08.670 --> 00:52:10.320
Signal: Die das dann teilweise
kompensieren. Wie taucht das bei dir in
00:52:10.320 --> 00:52:12.070
der Statistik auf?
D: Das taucht bei mir gar nicht auf.
00:52:12.070 --> 00:52:15.430
Deswegen war ich mir auch nicht komplett
sicher. Deswegen habe ich das auch gesagt.
00:52:15.430 --> 00:52:20.000
Wenn die komplett neue Fahrt haben die
irgendwie gar nicht im Plan aufgetaucht
00:52:20.000 --> 00:52:25.980
waren, dann werde ich die vermutlich nicht
drin haben. Wenn die Fahrten in
00:52:25.980 --> 00:52:28.350
irgendeiner Form in den Plandaten drinnen
waren, habe ich die aber drin. Deswegen
00:52:28.350 --> 00:52:32.400
kann ich es nicht genau sagen. Ich weiß
jedenfalls, dass die Kollegen beim SPIEGEL
00:52:32.400 --> 00:52:36.420
eine ähnliche Analyse neulich hatten auf
einem kleineren Datensatz. Und da war das
00:52:36.420 --> 00:52:43.020
auch jenseits der 4% Ausfallquote. Wenn es
falsch ist, stimmt das zumindest überein.
00:52:43.020 --> 00:52:45.190
Es kann sein, dass sie drin sind. Ich bin
mir nicht völlig sicher.
00:52:45.190 --> 00:52:50.860
Herald 1: Danke, Mikrofon 5 bitte mit
einer Frage.
00:52:50.860 --> 00:52:54.520
F: Vielen dank für diesen sehr
interessanten Vortrag. Es war bestimmt
00:52:54.520 --> 00:52:58.180
auch super viel Aufwand, das alles zu
analysieren und nach den Standing Ovations
00:52:58.180 --> 00:53:02.590
traue ich mich ja auch fast gar nicht,
eine kritische Frage zu stellen.
00:53:02.590 --> 00:53:06.330
D: Bitte!
F: Aber Sie hatten ja ziemlich an den
00:53:06.330 --> 00:53:12.640
Anfangsslides bei den Bahnhöfen, die den
Zügen Verspätungen hinzufügen oder wo die
00:53:12.640 --> 00:53:18.080
Züge vielleicht Verspätung aufholen. Aber
ist es nicht viel eher so, dass die
00:53:18.080 --> 00:53:22.000
Strecken zwischen den Bahnhöfen dazu
führen, dass die Züge Verspätung bekommen
00:53:22.000 --> 00:53:25.730
und nicht die Bahnhöfe selber? Und wäre
das dann nicht auch für die Bahn
00:53:25.730 --> 00:53:29.890
interessant zu schauen, zwischen welchen
Bahnhöfen kriegen die Züge am meisten
00:53:29.890 --> 00:53:32.670
Verspätung?
D: Also das ist eine exakt sehr geile
00:53:32.670 --> 00:53:37.260
Frage. Weil diese Auswertung war in der
Tat ein bisschen tricky, genau aus dem
00:53:37.260 --> 00:53:40.780
Grund. Vielleicht ist der Bahnhof
Frankfurt die Verspätung gar nicht schuld,
00:53:40.780 --> 00:53:44.791
sondern die Gleise beim Rein- und
Rausfahren zum Beispiel. Deswegen messe
00:53:44.791 --> 00:53:50.500
ich die Verspätungsänderung von dem
Streckensegment vor dem Bahnhof und dem
00:53:50.500 --> 00:53:54.280
Streckensegment nach dem Bahnhof. Und der
jeweilige Bahnhof kriegt man den
00:53:54.280 --> 00:53:58.800
Durchschnitt, damit ich genau von diesem
Effekt geheilt werde. Dann habe ich einen
00:53:58.800 --> 00:54:03.910
sehr guten Durchschnittswert. Und wer halt
immer was dazufügt im Schnitt, der wird
00:54:03.910 --> 00:54:07.880
auch selber was dazu beitragen. Oder beide
Streckenstreckensegmente dahin sind
00:54:07.880 --> 00:54:14.631
schlecht, also immer. Dann ist das auch
für mich ein Bahnhofsproblem. Also genau
00:54:14.631 --> 00:54:18.180
genommen, was ich hier analysiere ist dann
des Problem des Bahnhofs und der näheren
00:54:18.180 --> 00:54:21.420
Umgebung darum herum. Danke für diese
Frage.
00:54:21.420 --> 00:54:25.540
F: Vielen Dank für die Antwort.
Applaus
00:54:25.540 --> 00:54:33.450
D: Da hab ich mir nämlich lange Gedanken
gemacht, ob ich da jetzt einfach immer nur
00:54:33.450 --> 00:54:36.540
die Änderung der Verspätung nehme, aber
das hätte ich mir selbst als Statistik
00:54:36.540 --> 00:54:41.280
zerrissen, wenn ich da einen bei erwischt
hätte. Aber deswegen perfekt, dass es
00:54:41.280 --> 00:54:45.460
aufgefallen ist. Sehr gut.
Herald 1: Wir haben nur gute Menschen
00:54:45.460 --> 00:54:49.350
hier, sehr schön. lacht Wir nehmen
Mikrofon 3, wechseln mal die Seite bitte.
00:54:49.350 --> 00:54:53.020
D: Ich muss immer ein bisschen suchen.
Bitte entschuldigt, wenn ich euch nicht
00:54:53.020 --> 00:54:57.869
sehe. Da hinten ist er.
F: Du hattest am Anfang angeprangert oder
00:54:57.869 --> 00:55:05.190
in der Mitte angeprangert, dass die
Ausfälle nicht zu Verspätungen zählen. Und
00:55:05.190 --> 00:55:11.520
hattest aber am Anfang diese Slide, wo der
Berliner Flughafen immer ausfällt. Und es
00:55:11.520 --> 00:55:15.790
gibt ja vielleicht auch andere Bahnhöfe,
die umgebaut werden oder wo eben in
00:55:15.790 --> 00:55:21.731
Anführungszeichen planmäßig ausfallen.
Hast du die irgendwie
00:55:21.731 --> 00:55:23.441
rausgerechnet oder wie läuft das?
D: Nach meiner Information sind die Stopps
00:55:23.441 --> 00:55:25.820
dann gar nicht im Plan.
F: Ah, okay.
00:55:25.820 --> 00:55:29.430
D: Das sieht so aus: Ihr habt die
Plandaten mit den Stopps und dann habt ihr
00:55:29.430 --> 00:55:34.119
die Änderungen. Und da ist dann, wenn da
was ausfällt, dann ist da eine Cancelation
00:55:34.119 --> 00:55:37.880
Time drin, nämlich der Zeitpunkt des
Ausfalls. Da kann man auch noch schöne
00:55:37.880 --> 00:55:41.910
Auswertungen mit machen. Ausfälle mit
kurzer Vorlaufzeit und so weiter. Das
00:55:41.910 --> 00:55:47.910
würde dann in den Daten nach meiner
Kenntnis anders aussehen, wobei ich das
00:55:47.910 --> 00:55:51.800
auch nur reverse engineere. Die
dokumentieren nicht alles. Ich weiß nicht,
00:55:51.800 --> 00:55:56.250
wer von euch vorhin in dem Bahn-API-
Vortrag drin war. Aber man muss sehr viel
00:55:56.250 --> 00:56:01.230
reverse engineeren, wenn man das macht.
Also auch das mit einem Körnchen Salz.
00:56:01.230 --> 00:56:07.510
Herald: Danke, wir nehmen Mikrofon 2.
F: Ich bin auch Bahnfahrer, aber nach
00:56:07.510 --> 00:56:12.630
meiner Erfahrung ist der Regionalverkehr
viel häufiger verspätet als der
00:56:12.630 --> 00:56:17.181
Fernverkehr und deshalb die Frage: Wann
gibt's die Analyse für den Nahverkehr?
00:56:17.181 --> 00:56:23.130
D: Wo kommst du denn her?
F: Ich lebe südlich von Stuttgart.
00:56:23.130 --> 00:56:28.310
D: Südlich von Stuttgart. Also ich hab die
Nahverkehrsbahnhöfe nicht runtergeladen.
00:56:28.310 --> 00:56:34.369
Was ich aber hab (einfach weil sonst die
Requests wären explodiert), aber was ich
00:56:34.369 --> 00:56:39.530
hab, ist natürlich sämtlicher Nahverkehr,
der über alle Fernbahnhöfe gefahren ist,
00:56:39.530 --> 00:56:44.030
und die sind strategisch gut verteilt,
sodass sich da in der Tat auch für den
00:56:44.030 --> 00:56:48.430
Nahverkehr was sehen kann. Vielleicht
mache ich mal eine Pünktlichkeit von dem
00:56:48.430 --> 00:56:52.030
nahen Verkehr, der in den Fernverkehrs
Bahnhöfen vorbeigefahren ist. Weil das
00:56:52.030 --> 00:56:55.557
habe ich; dann muss ich mal als Tabelle
auf meine Webseite stellen. Oder so
00:56:55.557 --> 00:57:03.780
einfach. Dann kannst du gucken.
Applaus
00:57:03.780 --> 00:57:05.800
Herald 1: Wir haben noch ein kleines
bisschen Zeit, Mikrofon 6 nochmal, die
00:57:05.800 --> 00:57:09.060
andere Seite.
F: Vielen Dank nochmal für den Vortrag.
00:57:09.060 --> 00:57:15.440
Aus München kommend haben wir eine
chronisch schlechte S-Bahn, und ich habe
00:57:15.440 --> 00:57:19.100
mich auch gefragt: Ist den der
Regionalverkehr noch einmal
00:57:19.100 --> 00:57:22.160
unterschiedlich zum Nahverkehr? Oder ist
einfach die Münchner S-Bahn dauernd zu
00:57:22.160 --> 00:57:26.090
spät und im Rest von Deutschland ist gut?
D: Die fährt ja über eure großen Bahnhöfe,
00:57:26.090 --> 00:57:30.430
habt ja zwei oder drei richtig dicke, ne?
München Ost, München und noch
00:57:30.430 --> 00:57:31.859
irgendeinen.
F: Ja.
00:57:31.859 --> 00:57:36.500
D: Dann hab ich die drinnen. Kann ich mal
gucken. Würde dann auch in der Frage
00:57:36.500 --> 00:57:45.911
auftauchen, ob die da über 90%; Diese über
90% Pünktlichkeit im Regionalverkehr sind
00:57:45.911 --> 00:57:49.480
für Bahn und Subunternehmen vermutlich.
Ich muss mal gucken, aber die anderen hab
00:57:49.480 --> 00:57:54.300
ich ja drin. Zur Not als Dirttunternehmen.
Vielleicht beziehe ich die einfach mal mit
00:57:54.300 --> 00:57:58.390
ein in die regionale Analyse. Das könnte
interessant sein, wenn ich dafür
00:57:58.390 --> 00:58:00.880
irgendwann Zeit habe. Erwartet das jetzt
nicht morgen früh.
00:58:00.880 --> 00:58:04.410
F: Danke.
Harald 1: Super, wir nehmen euch beide
00:58:04.410 --> 00:58:09.500
hier, Mikrofon 4 zuerst.
F: Auf den Slides 80 und 84 war
00:58:09.500 --> 00:58:15.764
dargestellt, wie die Bahn die Teilausfälle
rausrechnet, aus der Statistik. Aber
00:58:15.764 --> 00:58:19.650
müssten nicht die gesamten Züge
herausgerechnet werden aus der Statistik?
00:58:19.650 --> 00:58:22.190
D: Ähm.
F: Die Verspätung akkumuliert sich ja
00:58:22.190 --> 00:58:27.120
natürlich und dann wäre die Statistik ja
dementsprechend besser.
00:58:27.120 --> 00:58:29.547
D: Jetzt hab ich mein PowerPoint
abgeschossen.
00:58:29.547 --> 00:58:34.820
Leises lachen
Nö, wieso müsstest du die ganze Züge
00:58:34.820 --> 00:58:38.590
herausrechnen? Das verstehe ich nicht. Es
kommt ja. Es ist ja schön granular für
00:58:38.590 --> 00:58:43.830
Stopps zu rechnen. Angenommen, das ganze
System würde so funktionieren, dass alle
00:58:43.830 --> 00:58:47.360
Züge auf der Hälfte Ihrer Stopps pünktlich
sind, und auf der anderen Hälfte
00:58:47.360 --> 00:58:50.830
unpünktlich. Dann wäre das doch halb
pünktlich. Ich sehe nicht, warum. Wir
00:58:50.830 --> 00:58:54.290
arbeiten ja feiner als auf Granularität
von Zügen. Das ist doch besser?
00:58:54.290 --> 00:58:59.150
F: Aber es werden ja Teilausfälle auch
rausgerechnet. Ist es dann wirklich nur
00:58:59.150 --> 00:59:01.610
der ausgefallene Stopp?
D: Nee, soweit ich weiß, ist da wirklich
00:59:01.610 --> 00:59:04.094
nur der ausgefallene Stopp, ja.
F: Ok, gut. Danke.
00:59:04.094 --> 00:59:09.540
Harald 1: So, dann noch Mikrophon 1.
F: Vielen Dank nochmal für den Talk. Meine
00:59:09.540 --> 00:59:14.119
Frage geht in die Richtung: "Perverse
incentive", sprich die Kennzahlen, an
00:59:14.119 --> 00:59:18.670
denen sich die Bahn messen lässt. Hat sie
sehr darauf hingewiesen, dass die
00:59:18.670 --> 00:59:24.180
Ausfallrate da vielleicht nicht so; Also
gut sein könnte wenn..,
00:59:24.180 --> 00:59:29.275
D: Ja, wäre schön, wenn sie drin wäre.
F: Ja, genau, wenn sie mit drin wäre. Eine
00:59:29.275 --> 00:59:38.070
andere Sache die da reinspielt: Wie hoch
die Ziele sind, die sich die Bahn setzt.
00:59:38.070 --> 00:59:42.630
Hast du in deinen Daten welche?
D: Das geht durch die Presse.
00:59:42.630 --> 00:59:47.440
F: Ich meine Ziele im Sinne von: Wie
schnell denn eine Strecke zu befahren ist?
00:59:47.440 --> 00:59:51.430
Man könnte ja die Züge pünktlicher machen
dadurch, dass man nach jedem Zug eine
00:59:51.430 --> 00:59:53.320
Stunde mehr Zeit gibt, dieselbe Strecke zu
fahren.
00:59:53.320 --> 00:59:54.619
D: Du meinst die Taktung?
F: Ja.
00:59:54.619 --> 00:59:58.990
D: Nee, die habe ich nicht. Die ist aber
bei der Bahn relativ eng, im Vergleich zu
00:59:58.990 --> 01:00:03.080
Flugzeugen - habe ich mir sagen lassen von
kundigen Personen - weswegen die Flugzeuge
01:00:03.080 --> 01:00:07.530
auch häufiger pünktlich sind; oder
ungefähr pünktlich. Aber bei der Bahn ist
01:00:07.530 --> 01:00:11.450
alles sehr eng getaktet, und vor allem
sind die Sachen interdependent. Wenn einer
01:00:11.450 --> 01:00:16.430
auf der Strecke liegen bleibt, halten alle
dahinter halt auch ein Problem. Das beides
01:00:16.430 --> 01:00:19.340
in Kombination sorgt für die Fragilität,
die wir sehen.
01:00:19.340 --> 01:00:26.320
F: Hast du vor, die Analyse in weiteren
Jahren fortzuführen, um dann da vielleicht
01:00:26.320 --> 01:00:32.450
die Richtung etwas zu sehen?
D: Ich bin mir nicht sicher. Zum einen
01:00:32.450 --> 01:00:37.730
habe ich wie alle anderen auch, Arbeit und
Familie, und zweitens ist die
01:00:37.730 --> 01:00:40.900
infrastrukturell sehr aufwendig. Ein
bisschen mache ich das sicher noch weiter,
01:00:40.900 --> 01:00:43.290
und dann gucke ich, habe ich noch
rauskriege. Aber ich kann nichts
01:00:43.290 --> 01:00:47.570
versprechen.
F: Letzter Nachschub: sind deine Daten
01:00:47.570 --> 01:00:52.470
von... also kriegt man die von dir?
D: Denke ich nicht, weil ich das nicht
01:00:52.470 --> 01:00:53.470
darf.
F: Ah.
01:00:53.470 --> 01:00:56.780
D: Am Ende hat die Bahn dafür das
Copyright. Viel mehr Copyright-Verstoß
01:00:56.780 --> 01:01:00.660
ginge gar nicht, als wenn ich das ganze
Ding nehme und euch einfach rauskopiere.
01:01:00.660 --> 01:01:08.950
Aber: sucht bei der Bahn die Timetable
API. Und dann ladet ihr das einfach
01:01:08.950 --> 01:01:13.900
runter. Es geht, das ist keine
Raketenwissenschaft.
01:01:13.900 --> 01:01:15.609
F: Danke.
D: Gut.
01:01:15.609 --> 01:01:20.088
Harald 1: Super. Nochmal einen riesengroßen
Applaus, an David. Herzlichen Dank.
01:01:20.088 --> 01:01:22.586
Applaus
01:01:22.586 --> 01:01:46.107
Abspannmusk