0:00:00.000,0:00:18.120
35C3 Vorspannmusik
0:00:18.120,0:00:24.570
Herald-Engel: Ja es ist mir eine riesige[br]Freude, heute hier auf dem 35C3 einen Talk
0:00:24.570,0:00:29.970
mit dem Titel "Archäologische Studien im[br]Datenmüll" vorzustellen. Er wird gehalten
0:00:29.970,0:00:34.720
von Katharina Nocun - sie ist Bloggerin,[br]Autorin, aber eigentlich kennt man sie
0:00:34.720,0:00:39.320
auch als Datenschutzaktivistin - und der[br]wunderbaren Letty. Also einen warmen
0:00:39.320,0:00:41.720
Applaus und viel Spaß bei diesem[br]spannenden Thema.
0:00:41.720,0:00:52.780
Applaus
0:00:52.780,0:00:57.629
Letty: Ja danke, Pupe. Es ist schön, dass[br]sich alle Haralde zum Horst machen mit dem
0:00:57.629,0:01:02.950
Französisch. Wir würden zu Beginn mal 'ne[br]Frage stellen - zwei Fragen stellen und
0:01:02.950,0:01:07.429
zwar die erste ist: Wie viel Personen[br]haben hier die Weihnachtsgeschenke bei
0:01:07.429,0:01:10.429
Amazon gekauft?[br]Katharina Nocun: Hola! Lachen
0:01:10.429,0:01:14.619
L: Ups! Lachen Okay ich würde mal grob[br]sagen die Hälfte. Lasst mal bitte eure
0:01:14.619,0:01:18.970
Arme oben, denn es geht weiter: Wer von[br]euch hat nur die Recherche bei Amazon
0:01:18.970,0:01:22.680
gemacht und danach woanders gekauft?[br]Kommen da noch welche hinzu? Ne, die die
0:01:22.680,0:01:27.450
gekauft haben bitte oben lassen, das wär[br]super. Okay es sieht so - okay wer nicht
0:01:27.450,0:01:31.380
bei Amazon kauft, recherchiert auch nicht[br]scheinbar. Okay. Oder es gab wenige, die
0:01:31.380,0:01:34.350
dazugekommen sind.[br]K: Also ich würd sagen das ist deutlich
0:01:34.350,0:01:37.540
mehr als 50 %.[br]L: Ja? Man sieht das nicht.
0:01:37.540,0:01:40.470
K: Ja, aber diejenigen, die eben[br]aufgezeigt haben, die werden mir sicher
0:01:40.470,0:01:45.110
zustimmen, wenn ich sage, das ist ziemlich[br]bequem, wenn nicht sogar verdammt bequem,
0:01:45.110,0:01:49.399
alles bei einem Anbieter zu suchen oder[br]auch bestellen zu können. Und man stellt
0:01:49.399,0:01:55.640
sich das in der Theorie ja auch so sehr[br]komfortabel vor. Ich weiß nicht, wer bei
0:01:55.640,0:02:01.280
DHL die Entscheidung getroffen hat, auf[br]Formel 1-Autos Werbung zu schalten. Ich
0:02:01.280,0:02:04.970
finde der Mensch hat aber sehr viel Humor.[br]Lachen
0:02:04.970,0:02:09.020
K: Denn in der Realität sieht es ja ein[br]bisschen anders aus, ne? Also so richtig gut
0:02:09.020,0:02:14.180
bezahlte Fahrer und schnelle Lieferung,[br]die gibt's in der Praxis eher selten und
0:02:14.180,0:02:19.590
bei Amazon würde ich sagen gar nicht. Und[br]der ein oder andere kennt's vielleicht,
0:02:19.590,0:02:26.300
dass da ein Paket abgegeben wurde oder[br]zugestellt wurde, ist noch kein - ist noch
0:02:26.300,0:02:30.310
lange keine Garantie dafür, dass es[br]wirklich da ist, wo man's hin haben will.
0:02:30.310,0:02:35.359
Also hier so ein Best of für alle, die es[br]noch nicht gelesen haben auf der Folie -
0:02:35.359,0:02:40.900
gesehen beim Tagesspiegel - Zitat: "Habe[br]das Paket im Müll versteckt - im blauen
0:02:40.900,0:02:43.440
Papiercontainer".[br]L: What could possibly go wrong?
0:02:43.440,0:02:48.690
K: Ja und da kommt ja richtig Freude auf[br]wenn man das liest und man denkt sich: "Ja
0:02:48.690,0:02:53.970
wie können wir dieses Problem lösen?"[br]Natürlich hat Amazon da ein Produkt für -
0:02:53.970,0:03:00.620
zumindest für seine US-Kunden. In den USA[br]kann man sich als Prime-Kunde entscheiden,
0:03:00.620,0:03:04.930
ich nutze jetzt Amazon Key. Amazon Key -[br]ähm ja - kontrolliert dann quasi - ist ein
0:03:04.930,0:03:08.460
intelligentes Schließsystem für die[br]Haustür, gibts auch fürs Auto, und dann
0:03:08.460,0:03:13.590
kann man beispielsweise sagen, ja also dem[br]Amazon Paketdienst dem vertraue ich
0:03:13.590,0:03:19.720
grundsätzlich - der kann die Pakete auch[br]innerhalb meines Hausflurs abstellen und
0:03:19.720,0:03:23.060
der kann auch die Tür aufschließen.[br]Passend dazu gibt's auch ein
0:03:23.060,0:03:27.079
Videoüberwachungssystem, wo man dann[br]kontrollieren kann beispielsweise wann die
0:03:27.079,0:03:32.840
Kinder betrunken nachts nach Hause kommen.[br]Und ich weiß nicht wie es euch geht, aber
0:03:32.840,0:03:36.230
ich finde das verdammt creepy. Ich würde[br]das niemals machen, denn ich denke mir, na
0:03:36.230,0:03:41.850
ja ich will mir genau überlegen, wem ich[br]Einblick in meine Wohnung geben will. Aber
0:03:41.850,0:03:46.739
als Datenschützerin habe ich mich gefragt,[br]ist nicht der Einblick den Amazon in unser
0:03:46.739,0:03:51.180
Leben bekommt durch unser Klickverhalten[br]nicht viel intimer, als so ein harmloser
0:03:51.180,0:03:55.630
Blick in den Hausflur? Weil wer bei mir in[br]die Wohnung guckt, der weiß vielleicht wie
0:03:55.630,0:03:59.820
ich lebe, ja? Aber wer mein[br]Onlineverhalten kennt - wer weiß, wann ich
0:03:59.820,0:04:05.320
wo wie klicke, der kann sich vielleicht[br]denken, wie ich denke - und das ist viel
0:04:05.320,0:04:11.859
intimer. Ich hab mich daher im letzten[br]Jahr oder vorletzten Jahr, genauer gesagt
0:04:11.859,0:04:16.720
im Jahr 2016, dazu entschieden, ein[br]Experiment zu machen: Ich wollte wissen,
0:04:16.720,0:04:21.959
was speichert Amazon eigentlich über seine[br]Nutzer und im Zuge dessen habe ich dann
0:04:21.959,0:04:24.370
auch angefangen alle meine[br]Weihnachtsgeschenke und sonstigen
0:04:24.370,0:04:28.229
Geschenke bei Amazon zu bestellen und auch[br]alles dort zu recherchieren, um einen
0:04:28.229,0:04:36.520
möglichst fetten Datensatz zu generieren.[br]Und mein Ziel war natürlich von Anfang an:
0:04:36.520,0:04:42.770
Ich möchte an diese Daten ran. Ich möchte[br]sie sezieren. Ich möchte Sie sehen. Ich
0:04:42.770,0:04:46.919
möchte wissen was genau Amazon über seine[br]Kunden speichert. Denn ich weiß nicht ob
0:04:46.919,0:04:52.250
ihr es wusstet, aber nach Artikel 15 der[br]Datenschutz-Grundverordnung hat jeder
0:04:52.250,0:04:56.780
Nutzer in ganz Europa das Recht jederzeit[br]zu seinem Anbieter zu gehen und zu sagen:
0:04:56.780,0:05:01.199
"Hey ich möchte eine kostenlose Kopie[br]meiner Daten haben" und der Anbieter muss
0:05:01.199,0:05:06.850
dann liefern. In der Praxis macht das aber[br]kaum jemand. Und bei Amazon hat das soweit
0:05:06.850,0:05:10.479
ich wusste noch nie jemand so richtig[br]durchgezogen, dass da was Verwertbares
0:05:10.479,0:05:14.150
rausgekommen ist. Also habe ich mich[br]entschlossen, ich gehe auf die
0:05:14.150,0:05:21.159
Datenpirsch. Was hab ich also gemacht? Ich[br]habe ganz viel eingekauft. Was hab ich
0:05:21.159,0:05:26.919
denn eingekauft? Ich hab fast 60 Bücher[br]innerhalb von 14 Monaten gekauft und falls
0:05:26.919,0:05:29.990
ihr euch jetzt fragt - ja ich hab[br]tatsächlich mittlerweile mindestens 50
0:05:29.990,0:05:36.400
Prozent davon auch gelesen. Ich habe...[br]Applaus
0:05:36.400,0:05:41.919
K: ...Ich hab außerdem aber auch so[br]praktische Sachen bestellt wie
0:05:41.919,0:05:47.889
beispielsweise Sprühkreide für eine[br]Protestaktion und eine Button-Maschine. In
0:05:47.889,0:05:52.241
meinem Kaufprofil hat sich dann aber auch[br]so komischer Kram angesammelt, wie
0:05:52.241,0:05:56.039
beispielsweise das[br]Lavendeleinschlafkissenspray. Der eine
0:05:56.039,0:06:02.389
oder andere kennt es vielleicht aus dem[br]Radisson Blu am CCH. Was leider nicht auf
0:06:02.389,0:06:06.770
dem Bild zu sehen ist, ist der[br]Hometrainer, den ich mir gekauft habe. Der
0:06:06.770,0:06:11.169
war so erfolgreich, dass ich ihn nach drei[br]Monaten wieder weiterverkauft hab. Ich
0:06:11.169,0:06:14.600
habe mir aber auch sinnvolle Sachen[br]gekauft, wie beispielsweise 'ne Maus,
0:06:14.600,0:06:19.430
einen Ordner oder auch Schnürsenkel und[br]bin auch durch Amazon Besitzerin der
0:06:19.430,0:06:26.229
schönsten Hausschuhe auf diesem Planeten.[br]Im August 2017 habe ich mir dann gedacht,
0:06:26.229,0:06:31.300
so jetzt ist der Datensatz schön fett[br]angefüttert mit Klicks und Käufen. Jetzt
0:06:31.300,0:06:36.669
frage ich mal meine Daten ab. Und das war[br]leider - muss ich sagen - der Beginn einer
0:06:36.669,0:06:42.979
langen und intensiven Brieffreundschaft[br]mit der Datenschutzabteilung. Und zunächst
0:06:42.979,0:06:45.970
habe ich nicht das bekommen, was ich haben[br]wollte. Ich habe dann aber immer weiter
0:06:45.970,0:06:49.680
nachgefragt und irgendwann haben sie[br]angefangen mir CD-ROMs zuzuschicken.
0:06:49.680,0:06:53.639
Lachen[br]K: Ja, musst' ich erstmal im Keller
0:06:53.639,0:06:58.000
gucken, wie man denn so antike Datenträger[br]auslesen kann und auf der ersten CD fand
0:06:58.000,0:07:03.661
sich leider auch nur das, was ich erwartet[br]hatte: Eine Kopie meiner Profildaten, die
0:07:03.661,0:07:07.499
auch online einsehbar sind, plus ein paar[br]Zusatzinformationen - also nicht das was
0:07:07.499,0:07:10.830
ich eigentlich wollte. Ich hab dann weiter[br]Stress gemacht, habe dann irgendwann 'ne
0:07:10.830,0:07:15.120
zweite CD-ROM zugeschickt bekommen.[br]Eigentlich habe ich drei zugeschickt
0:07:15.120,0:07:16.550
bekommen - die andere ist in der Post[br]verschwunden.
0:07:16.550,0:07:23.409
L: In der Mülltonne.[br]K: Wahrscheinlich. Ja und dann habe ich
0:07:23.409,0:07:27.130
auf dieser letzten CD mal geguckt was ist[br]denn da drauf? Und da waren so Sachen drauf
0:07:27.130,0:07:31.819
wie ein PDF, wo ich sehen konnte, was für[br]Suchanfragen ich getätigt habe. Ich konnte
0:07:31.819,0:07:36.439
sehen, auf welche Werbe-E-Mails ich wann[br]reagiert hab - auf die Sekunde genau. Und
0:07:36.439,0:07:40.669
ich konnte sehen, auf welche Werbeanzeigen[br]ich reagiert habe. Das Interessante war
0:07:40.669,0:07:46.659
allerdings so eine Excel-Tabelle und diese[br]Excel-Tabelle trug den unschuldigen Namen
0:07:46.659,0:07:52.209
"Clickstream". Die habe ich mal aufgemacht[br]und das hat erst mal eine ganze Zeit lang
0:07:52.209,0:07:56.859
zum Laden gebraucht. Und irgendwann habe[br]ich dann gesehen - okay diese Excel-
0:07:56.859,0:08:06.739
Tabelle hat 15.365 Zeilen und jede Zeile[br]hat bis zu 50 Zusatzangaben, also 50
0:08:06.739,0:08:11.659
Spalten. Ich war gestern mal im[br]Supermarkt, um das zu visualisieren. So
0:08:11.659,0:08:14.739
viel Papier wär das, wenn das ausgedruckt[br]wär. Mein eigentliches Ziel war es, auf
0:08:14.739,0:08:18.439
einen Stapel zu packen das wäre dann[br]größer als ich mit meinen 1,70m.
0:08:18.439,0:08:22.120
Allerdings haben wir das aus[br]Sicherheitsgründen sein lassen, denn das
0:08:22.120,0:08:26.530
wäre zusammengekracht.[br]L: Ja und als Katha mich gefragt hat, ob
0:08:26.530,0:08:30.629
ich ihre Daten auswerten will, dachte ich[br]als Erstes an meine Datenbankenvorlesung -
0:08:30.629,0:08:35.350
so Beziehung zwischen Kunden und[br]Lieferanten und was kauft man. Aber der
0:08:35.350,0:08:38.560
Clickstream von Amazon sind nicht nur die[br]Käufe. Denn eigentlich wird alles
0:08:38.560,0:08:41.979
abgespeichert, was wir mit der Seite[br]machen. Es ist egal ob wir nur auf die
0:08:41.979,0:08:45.610
Startseite gehen, ob wir Produkte suchen[br]oder ob wir uns ein Produkt genau
0:08:45.610,0:08:50.780
anschauen. Es wird sogar gespeichert, wenn[br]wir uns ein Bild vergrößern und natürlich
0:08:50.780,0:08:55.580
auch jede Interaktion, die wir haben, wenn[br]wir auf unserem Nutzerkonto sind. Und weil
0:08:55.580,0:08:58.790
wir hier ja einen Foundationstalk machen,[br]habe ich mir gedacht, ich will euch auch
0:08:58.790,0:09:02.210
ein bisschen mitnehmen in die Reise in die[br]Daten, die unbekannt sind und wie man
0:09:02.210,0:09:05.620
eigentlich mit so einem unbekannten[br]Datensatz vorgehen kann, ihn explorativ
0:09:05.620,0:09:08.950
analysieren kann, um zu wissen, was steckt[br]überhaupt in diesen Daten drin? Was kann
0:09:08.950,0:09:13.680
man vielleicht mit den Daten sehen? Also[br]wie schon gesagt, wir haben 50 Spalten
0:09:13.680,0:09:17.400
oder auch Dimensionen genannt, und da ich[br]die nicht alle hier auflisten kann, habe
0:09:17.400,0:09:21.320
ich versucht, 'ne grobe Zuordnung zu[br]Gruppen zu finden. Wir haben als erstes
0:09:21.320,0:09:26.200
natürlich 'ne Zeitangabe, ganz klar. Wir[br]haben Account-Details, sowas wie seid ihr
0:09:26.200,0:09:32.270
Prime-Kunde oder Business-Kunde, und 'nen[br]Ortsbezug. Amazon speichert die IP-Adresse
0:09:32.270,0:09:35.340
nicht vollständig - der letzte Block ist[br]weggestrichen. Aber was sie außerdem
0:09:35.340,0:09:39.560
speichern ist, in welchem Land, in welchem[br]Bundesland und welcher Internet-Service-
0:09:39.560,0:09:43.000
Provider, also der Internetanbieter, den[br]ihr da genutzt habt, um die Seite zu
0:09:43.000,0:09:48.350
besuchen. Außerdem wird natürlich die URL[br]gespeichert, die ihr da besucht habt und
0:09:48.350,0:09:52.630
wenn es auch noch ein Produkt ist, wird[br]dazu die Produkt-ID auch abgespeichert.
0:09:52.630,0:09:57.900
Achso, hm, oh jetzt habe ich die[br]Sessiondetails vergessen. Ja, die Session-
0:09:57.900,0:10:01.770
Details sind so alles, was so im Cookie[br]auch landet, damit man einfach sieht in
0:10:01.770,0:10:06.340
welcher Session man sich gerade befindet.[br]Und es gibt noch eine ID, die euch über
0:10:06.340,0:10:11.580
alle Dienste von Amazon hinweg[br]identifizieren kann. Und bei den
0:10:11.580,0:10:16.200
Navigationsdetails ist es eigentlich schon[br]ein bisschen klar, wo es hingeht. Amazon
0:10:16.200,0:10:20.420
sieht, von wo ihr kommt, wo ihr gerade[br]seid und wo geht ihr dann hin. Dieser
0:10:20.420,0:10:25.020
gesamte Verlauf wird einmal abgespeichert[br]- und nicht nur der Verlauf, sondern auch
0:10:25.020,0:10:27.710
was habt ihr da gemacht, welche[br]Interaktionen habt ihr gemacht, habt ihr
0:10:27.710,0:10:32.080
etwas in den Warenkorb hinzugefügt, habt[br]ihr euch ein Bild angeschaut oder habt ihr
0:10:32.080,0:10:37.420
etwas für später gespeichert? Als letztes[br]kann man so einen Block sehen, das heißt
0:10:37.420,0:10:42.380
Amazoninterna. Wir sehen, an welchen Web-[br]Server die Anfrage gestellt wurde und ob
0:10:42.380,0:10:46.780
die Anfrage eine interne IP-Adresse bei[br]Amazon hat. Ihr bekommt von Amazon
0:10:46.780,0:10:51.490
außerdem eine lange Liste mit all diesen[br]Dimensionen und die Erläuterung dazu, was
0:10:51.490,0:10:56.811
sich dahinter verbirgt. Manchmal speichert[br]Amazon aber nicht den Klartext, sondern
0:10:56.811,0:11:00.960
codiert etwas was z.B. wie: Null bedeutet,[br]ihr habt was in den Warenkorb gelegt.
0:11:00.960,0:11:04.710
Denkt man erst mal: Super hat man nicht so[br]viel zu parsen. Dann hab ich aber
0:11:04.710,0:11:07.850
festgestellt, als ich mir die Daten[br]genauer angeschaut habe, so Amazon erzählt
0:11:07.850,0:11:12.260
aber nicht, was sie alles codiert oder was[br]sie codieren. Manche Felder sind uns
0:11:12.260,0:11:15.130
schlicht unbekannt.[br]K: Ja, sagen wir mal so: Die
0:11:15.130,0:11:18.110
Brieffreundschaft dauert noch an.[br]L: Ich hoffe auch, wir werden darauf noch
0:11:18.110,0:11:22.221
nochmal Antwort bekommen. Wenn wir jetzt[br]also den Datensatz mit den 50 Spalten
0:11:22.221,0:11:26.740
vorstellen, haben wir irgendwie über[br]15.000 Einträge. Ich hab mal 2
0:11:26.740,0:11:29.140
herausgenommen, um einfach nur[br]exemplarisch zu zeigen, wie sind die
0:11:29.140,0:11:32.930
überhaupt aufgebaut. Also wir haben Datum,[br]wir haben 'ne Aktion, die wir machen,
0:11:32.930,0:11:36.950
sowas wie 'gesucht' oder 'gekauft', und dann[br]haben wir dazu die URL, aus welchem
0:11:36.950,0:11:41.110
Bundesland vielleicht das Ganze abgesetzt[br]wurde, welcher Internet-Provider da
0:11:41.110,0:11:45.490
dahinter steckt und wie lang die Ladezeit[br]war. Das haben wir natürlich nicht nur für
0:11:45.490,0:11:51.690
diese 2 Einträge, sondern wie gesagt für[br]über 15.000. Welchen Zeitraum betrachten
0:11:51.690,0:11:56.330
wir hier eigentlich in den Daten? Es geht[br]los am 1. August 2016 und es endet am
0:11:56.330,0:12:03.170
31. August 2017. Das sind dann etwa 196 Tage,[br]die mit Interaktionen behaftet sind und
0:12:03.170,0:12:09.010
das wären dann sozusagen 78 Einträge pro[br]Tag. Wenn ich mit so 'nem unbekannten
0:12:09.010,0:12:12.710
Datensatz arbeite, dann arbeite ich[br]eigentlich immer mit Python und dem Pandas
0:12:12.710,0:12:17.260
Package, was sich so für Datenanalyse[br]einfach als Standard durchgesetzt hat. Und
0:12:17.260,0:12:20.080
egal was mir Amazon sagt, was in den Daten[br]sind, ich schaue mir die Dimensionen immer
0:12:20.080,0:12:23.820
nochmal ganz genau an. Das heißt welche[br]Dimension habe ich und wie häufig wurde
0:12:23.820,0:12:28.581
sie benutzt? Es gibt extrem viele, die[br]immer benutzt werden - sowas wie Datum und
0:12:28.581,0:12:33.080
Uhrzeit. Die Angabe gibt es immer, aber es[br]gibt auch Dimensionen, die einfach nicht
0:12:33.080,0:12:35.970
so häufig genutzt werden, und wir haben[br]auch eine Dimension bekommen, die wurde
0:12:35.970,0:12:41.890
nie genutzt - irgendwas über Bilder. Keine[br]Ahnung was da drin ist. Ich hab mir dann
0:12:41.890,0:12:44.930
jede Dimension wirklich einzeln angeguckt,[br]was da drin steht und wie häufig das
0:12:44.930,0:12:50.410
passiert. Und bin über die Zeit gestoßen,[br]die wirklich eine sekundengenaue Angabe
0:12:50.410,0:12:54.760
sein soll, was man auf Amazon macht. Und[br]ich weiß nicht, wie man es hinbekommt, in
0:12:54.760,0:12:59.141
einer Sekunde irgendwie 45 Einträge zu[br]generieren, aber ich dachte mir, okay, ich
0:12:59.141,0:13:02.310
nehme erst mal noch eine andere Spalte und[br]schaue mal was da noch drin steht ist -
0:13:02.310,0:13:06.130
vielleicht ist das ja ein Ausreißer oder[br]es sind mehrere Ausreißer - weiß man ja
0:13:06.130,0:13:09.990
nicht. Dann hab ich mir so einen Tag[br]genauer angeguckt. Also man kann auch die
0:13:09.990,0:13:12.980
Zeitangabe nur für einen Tag nehmen. Das[br]ist irgendwie so eine relative
0:13:12.980,0:13:16.570
Gleichverteilung. Und dann hat man da so 3[br]Ausreißer - die sind irgendwie wahnsinnig
0:13:16.570,0:13:20.940
verdächtig, weil die stark abweichen von[br]den anderen und es gibt sogar einen der
0:13:20.940,0:13:27.490
irgendwie 710 Einträge beinhaltet aber ich[br]weiß ja nicht, wie intensiv Katha Amazon
0:13:27.490,0:13:32.510
genutzt hat in der Zeit von morgens bis[br]abends - auf jeden Fall sportlich. Dann
0:13:32.510,0:13:36.120
habe ich mir den Tag aber wirklich mal[br]ganz genau angeschaut. Wir haben 710
0:13:36.120,0:13:39.420
Einträge. Dann hab ich mal geguckt, was[br]ist denn für eine Zeitspanne die wir
0:13:39.420,0:13:46.030
haben? 20 Minuten und 35 Sekunden. Das[br]heißt für einen Eintrag würde Katha 1,74
0:13:46.030,0:13:49.560
Sekunden brauchen. Das Ganze würde dann[br]wahrscheinlich so aussehen.
0:13:49.560,0:13:51.660
Lachen[br]K: Ja und wenn ich das schaffe, spätestens
0:13:51.660,0:13:55.030
an der Stelle sollte ich meine Karriere[br]als Progamer überdenken.
0:13:55.030,0:14:00.280
L: Ja. Ich bin daraufhin nochmal genauer[br]in die Daten eingestiegen und Pandas hat
0:14:00.280,0:14:03.360
so 'nen value_counts, was das Histogramm[br]sozusagen darstellen würde -
0:14:03.360,0:14:07.130
Häufigkeitsverteilung und die Funktion und[br]ich wir sind jetzt richtig dicke auf jeden
0:14:07.130,0:14:13.170
Fall. Ich hab mir die wirklich komplett[br]nochmal angeschaut. Wo kommt das her? Mir
0:14:13.170,0:14:16.750
ist aufgefallen, dass diese Aktion nicht[br]immer definiert ist, die wird nur so 4.600
0:14:16.750,0:14:20.680
Mal überhaupt angegeben. Wo ich mir[br]dachte, okay, 'ne Interaktion - naja
0:14:20.680,0:14:23.600
vielleicht kann man's nicht immer[br]klassifizieren und dann sind mir zwei
0:14:23.600,0:14:28.290
andere Sachen noch aufgefallen: request[br]und lazy-load. Die zwei Sachen finde ich,
0:14:28.290,0:14:33.320
hören sich nicht wie eine Interaktion an.[br]Und da ich Webentwicklerin halt auch bin,
0:14:33.320,0:14:38.270
war mir so hm okay vielleicht wird da noch[br]etwas anderes in den Daten stecken. Und
0:14:38.270,0:14:41.760
hab mir daraufhin die URLs mal genauer[br]angeschaut, die in den Daten stecken und
0:14:41.760,0:14:44.540
spätestens bei Ajax, was 'ne[br]Webtechnologie ist, sagt mir mh
0:14:44.540,0:14:48.400
Nutzerinteraktion? Schauen wir mal in den[br]Browser. Wie gesagt, ich bin
0:14:48.400,0:14:53.430
Webentwicklerin, und so'n Browser verrät[br]'ne Menge über eine Webseite, wenn Fehler
0:14:53.430,0:14:56.730
drin sind oder was für einen Traffic im[br]Netzwerkverkehr - äh im Netzwerk
0:14:56.730,0:15:00.610
stattfindet. Und das hab ich auch mal für[br]Amazon gemacht und hab mir mal ein Spiel
0:15:00.610,0:15:03.740
einfach ausgesucht und hab geguckt was[br]wird eigentlich so alles geladen, während
0:15:03.740,0:15:08.750
man auf der Seite ist. Und ja, jede[br]Webseite lädt eine Menge Sachen nach. Und
0:15:08.750,0:15:12.660
als es dann irgendwann mal fertig geladen[br]hat, dachte mir okay, und jetzt suche ich
0:15:12.660,0:15:17.360
in dieser Auflistung nach den URLs, die[br]ich nicht zuordnen konnte. Und siehe da,
0:15:17.360,0:15:21.260
es sind wirklich Sachen die einfach[br]nachgeladen werden. So etwas wie ein Prime
0:15:21.260,0:15:24.570
Button oder Bilder und Rezensionen, was[br]für mich jetzt per se keine
0:15:24.570,0:15:29.400
Nutzerinteraktion ist. Aber es landet[br]komplett in dem Clickstream drin. Wenn wir
0:15:29.400,0:15:34.071
also die realen Nutzerinteraktionen suchen[br]von den über 15.000 Einträgen, dann hab
0:15:34.071,0:15:39.450
ich eine Annahme getroffen: Eine[br]Nutzerinteraktion muss die Page Action
0:15:39.450,0:15:42.960
angegeben haben, ansonsten ist es keine.[br]So selektieren wir die erst mal als
0:15:42.960,0:15:46.080
Erstes. Dann möchte ich auch nicht, dass[br]es ein request ist, weil das sieht auch
0:15:46.080,0:15:51.350
aus wie keine Interaktion und es darf auch[br]kein lazy-load sein. Wenn wir diesen
0:15:51.350,0:15:55.340
gesamten Wust nehmen und einfach mal aus[br]den Daten rauswerfen, dann haben wir 75 %
0:15:55.340,0:16:01.450
der Daten einfach mal weggeworfen haben[br]nur noch 3.747 Einträge übrig, die reale
0:16:01.450,0:16:07.080
oder die ich als Annahme als reale[br]Nutzerinteraktion sehe. Ich weiß nicht,
0:16:07.080,0:16:11.120
wie viele von euch auf GitHub unterwegs[br]sind, aber ich liebe den Graph, der so ein
0:16:11.120,0:16:15.240
bisschen die Aktivität zeigt, die man auf[br]GitHub hat. Das Gleiche könnte man auch
0:16:15.240,0:16:19.790
für Amazon machen. Und ich weiß nicht, ob[br]ich darüber so glücklich wäre bei mir.
0:16:19.790,0:16:24.150
Jedenfalls steht jedes Kästchen für eine[br]Interaktion und die extrem dunklen lilanen
0:16:24.150,0:16:29.480
Kästchen zeigen bis zu 180 Interaktionen,[br]die man mal am Tag getätigt hat
0:16:29.480,0:16:34.460
K: Beispielsweise vor Weihnachten.[br]L: Genau - sieht man besonders gut. Aber
0:16:34.460,0:16:38.310
das heißt ja auch noch nicht, dass jede[br]Interaktion wirklich zu einem Kauf
0:16:38.310,0:16:42.060
überleitet. Und ich hab mal versucht[br]herauszufinden, wie Amazon überhaupt
0:16:42.060,0:16:46.010
klassifiziert, ob man etwas kauft. Und ich[br]dachte mir, hey, Page Action, du bist ja
0:16:46.010,0:16:50.460
eine gute Idee anzugucken und Amazon wird[br]doch mit Sicherheit ordentliche, gepflegte
0:16:50.460,0:16:55.160
Daten haben und sowas wie ein "Order" drin[br]stehen haben oder 'nen "Purchase" - nix
0:16:55.160,0:17:00.050
da. Amazon hat aus irgendwelchen Gründen[br]'ne Horde an Einträgen, die man per Hand
0:17:00.050,0:17:05.530
herausfinden muss aus seinem Datensatz.[br]Damit man überhaupt eine Idee davon
0:17:05.530,0:17:10.010
bekommt, welche Interaktionen sind[br]wirklich Käufe und welche nicht. Ich habe
0:17:10.010,0:17:14.250
auch nicht herausgefunden ob's hinter[br]dieser Nummerierung von "PlaceOrder"
0:17:14.250,0:17:18.380
irgendeinen Zusammenhang gibt, wann die[br]auftreten, das ist nicht aus dem Datensatz
0:17:18.380,0:17:24.529
ersichtlich gewesen. Wenn wir also mal die[br]Interaktion mit den Käufen vergleichen -
0:17:24.529,0:17:29.029
leider sind die Kästchen ein bisschen hell[br]- von den 196 Tagen, an denen man
0:17:29.029,0:17:33.330
interagiert hat, hat man am Ende nur an 24[br]Tagen gekauft. Also ist ein viel, viel
0:17:33.330,0:17:37.679
geringerer Teil. Aber man sieht den[br]Dezember - da hat Katha auf jeden Fall
0:17:37.679,0:17:41.259
viermal hintereinander gekauft. Und in[br]ihren Daten habe ich außerdem gesehen,
0:17:41.259,0:17:45.650
dass sie extrem interessiert an Büchern[br]ist und im Dezember einfach mal 32 Bücher
0:17:45.650,0:17:49.722
an 4 Tagen gekauft hat.[br]Lachen
0:17:49.722,0:17:52.990
L: Wir lassen das Thema mit den[br]Interaktionen und Käufen jetzt mal hinter
0:17:52.990,0:17:58.299
uns und begeben uns auf die Orte, in denen[br]Katha war, als sie auf Amazon
0:17:58.299,0:18:03.679
herumgebrowst ist. Als Erstes ist mir[br]aufgefallen, in Berlin ist sie am
0:18:03.679,0:18:08.529
häufigsten im Internet auf Amazon. Okay,[br]vielleicht wohnt sie da. Dann hat man
0:18:08.529,0:18:12.470
irgendwie Brandenburg und Schleswig-[br]Holstein noch ziemlich häufig. Weiß ich
0:18:12.470,0:18:15.980
nicht, was der Bezug dazu ist, und dann[br]weniger häufig aber auch existent
0:18:15.980,0:18:21.070
Nordrhein-Westfalen und Niedersachsen.[br]K: Ja, ich lös mal auf. Ich wohne in
0:18:21.070,0:18:25.810
Berlin, das ist richtig, und um aus Berlin[br]rauszukommen muss man grundsätzlich erstmal
0:18:25.810,0:18:31.350
immer durch Brandenburg durch. In der[br]Zeit, in der ich diesen Versuch gemacht
0:18:31.350,0:18:36.159
habe, bin ich beruflich nach Schleswig-[br]Holstein gependelt. Das heißt man konnte
0:18:36.159,0:18:40.299
in dem Datensatz recht gut sehen, an[br]welchen Tagen ich wo gearbeitet habe. In
0:18:40.299,0:18:43.789
Nordrhein-Westfalen lebt meine Familie und[br]immer wenn ich nach Nordrhein-Westfalen
0:18:43.789,0:18:46.990
gefahren bin, bin ich auch durch[br]Niedersachsen durchgefahren. Was mich so
0:18:46.990,0:18:51.889
ein bisschen überrascht hat war, dass ich[br]an dem Datensatz schon vermuten konnte,
0:18:51.889,0:18:56.450
wann ich meine Eltern besucht habe. Und[br]das war dann doch ein bisschen creepy.
0:18:56.450,0:18:59.470
L: Das ist einfach nur die Spalte, die man[br]anschauen kann, wenn es um die
0:18:59.470,0:19:04.049
Bundesländer geht.[br]K: Ah ja, und genau. Woher weiß Amazon,
0:19:04.049,0:19:08.049
dass in NRW meine Eltern wohnen? Ganz[br]einfach: kurz vor Weihnachten ratet mal wo
0:19:08.049,0:19:11.700
ich meine Pakete hingeschickt hab, ne,[br]weil ich auf den letzten Drücker gekauft
0:19:11.700,0:19:15.090
habe. Und das sind solche kleinen[br]Verbindungen, wo man wirklich sagen kann
0:19:15.090,0:19:18.091
man: naja, wenn ich mehrere Datensätze als[br]Amazon habe, kann ich da total einfach
0:19:18.091,0:19:23.639
auch sehr private Details rausfinden.[br]L: Genau. Als Nächstes habe ich mir im
0:19:23.639,0:19:27.879
Vorfeld die Internet Service Provider mal[br]genauer angeschaut und da ist mir eins
0:19:27.879,0:19:31.519
aufgefallen: einige verraten, wo sie sind.[br]So weiß ich zum Beispiel, dass Katha im
0:19:31.519,0:19:35.229
Freifunk in Hamburg unterwegs war.[br]K: Ja, da bin ich immer umgestiegen, weil
0:19:35.229,0:19:39.190
ich nach Kiel gefahren bin.[br]L: Und dann hab ich da was im Februar 2017
0:19:39.190,0:19:44.350
gesehen, da war sie auf den Bahamas.[br]K: Nicht was ihr denkt, das war Urlaub.
0:19:44.350,0:19:48.790
Lachen[br]L: Und im Juli 2017 war sie in Polen.
0:19:48.790,0:19:53.010
K: Genau, das war ein Familienurlaub.[br]L: Es gibt da noch einen anderen
0:19:53.010,0:19:57.249
Aufenthalt, der mir aufgefallen ist. Und[br]ich vermute, du hast eine Beziehung zu
0:19:57.249,0:20:01.029
Universitäten oder Bibliotheken.[br]K: Ja, ich schreib tatsächlich am liebsten
0:20:01.029,0:20:04.970
in der Bibliothek.[br]L: Viele von euch werden den Verein zur
0:20:04.970,0:20:09.019
Förderung eines Deutschen Forschungsnetzes[br]kennen in Form von eduroam. Das ist die
0:20:09.019,0:20:12.340
Einrichtung, die in Deutschland das[br]Internet in Bildungs- und
0:20:12.340,0:20:16.409
Forschungseinrichtungen, Universitäten[br]oder Bibliotheken zur Verfügung stellt und
0:20:16.409,0:20:20.159
auch das sieht man in den Daten. Was[br]Amazon irgendwie scheinbar beim Internet
0:20:20.159,0:20:25.090
Service Provider macht, ist, sie erlauben[br]nur 50 Zeichen und da ist der Name vom DFN
0:20:25.090,0:20:29.879
definitiv zu lang für. Aber wir gucken mal[br]was du so in 'ner Bibliothek machst,
0:20:29.879,0:20:34.201
während du eigentlich arbeiten solltest.[br]Du rutschst mal kurz aus zu Amazon, so
0:20:34.201,0:20:37.900
wenige Sekunden - das kann mal passieren.[br]Dann kommt das schlechte Gewissen
0:20:37.900,0:20:42.480
wahrscheinlich. Dann hast du so 'ne Käufe[br]von oder so 'ne Aufenthalte von einer
0:20:42.480,0:20:47.549
Minute - bestimmt zielgerichtet irgendwas[br]gesucht und für später weggespeichert. Was
0:20:47.549,0:20:51.230
machst du 15 Minuten lang auf Amazon? Das[br]kann man doch schon fast Prokrastination
0:20:51.230,0:20:53.860
nennen.[br]K: Na, das würde ich jetzt nicht so sagen.
0:20:53.860,0:20:58.700
L: Nee, stimmt, denn wir haben noch was[br]Besseres: Du warst über anderthalb Stunden
0:20:58.700,0:21:02.020
auf der Seite von Amazon.[br]Lachen
0:21:02.020,0:21:07.890
K: Reine Recherche.[br]L: Was auf dieser Page Action, die ich
0:21:07.890,0:21:11.279
erwähnt habe, jetzt so häufig, für die[br]Nutzerinteraktion irgendwie hervorgetreten
0:21:11.279,0:21:16.230
ist, dass Amazon ab einem ganz bestimmten[br]Zeitpunkt versucht hat herauszufinden, ob
0:21:16.230,0:21:20.370
man den Tab gerade in den Vordergrund oder[br]den Hintergrund legt. Da Kathas Datensatz
0:21:20.370,0:21:24.309
jetzt nur ein begrenzter Datensatz ist,[br]kann ich nicht sagen, ob das Zufall ist
0:21:24.309,0:21:28.070
oder ob Amazon versucht, wirklich[br]kontinuierlich die Erkennung zu
0:21:28.070,0:21:31.309
verbessern, damit sie einfach wirklich[br]wissen, wann interagiert man mit der
0:21:31.309,0:21:33.679
Seite, wann legt man etwas in den[br]Hintergrund.
0:21:33.679,0:21:39.190
K: Ja und spannend fand ich in dem[br]Datensatz auch, dass man gar nicht so viel
0:21:39.190,0:21:43.970
technischen Sachverstand auch benötigt, um[br]sich ein grobes Bild davon zu machen, was
0:21:43.970,0:21:48.039
da alles drin schlummert. Ich habe[br]beispielsweise mal in der Spalte V geguckt
0:21:48.039,0:21:53.480
- die Spalte V steht für Referrer und das[br]kann man für Nicht-Techies übersetzen
0:21:53.480,0:21:57.879
ungefähr wie: "Naja woher kommst du[br]denn?". Das heißt, Amazon merkt sich, von
0:21:57.879,0:22:01.789
welcher Seite ich sie ansurfe und in[br]meinem Fall war es so, dass ich mehrere
0:22:01.789,0:22:06.309
Artikel von Spiegel Online dann mit dem[br]kompletten Link in meinem Clickstream
0:22:06.309,0:22:09.350
gefunden habe und das ist deshalb[br]interessant, weil man dann natürlich sagen
0:22:09.350,0:22:12.990
kann, so okay, welche Medien konsumiert[br]dieser jemand eigentlich, oder vielleicht
0:22:12.990,0:22:18.289
auch wofür interessiert er sich inhaltlich[br]außerhalb Amazons sonst noch? Ich habe
0:22:18.289,0:22:24.379
auch einen Link gefunden vom Telepolis von[br]heise online, ein Artikel in dem es um
0:22:24.379,0:22:30.360
CETA geht. CETA ist das Handelsabkommen[br]zwischen Kanada und der EU und das ist ein
0:22:30.360,0:22:33.529
kritischer Beitrag und da kann man sich[br]natürlich auch überlegen, okay, wenn
0:22:33.529,0:22:37.670
Amazon wirklich weiß, von was für[br]politischen Artikeln wir kommen, dann kann
0:22:37.670,0:22:42.000
man daraus natürlich auch Rückschlüsse[br]über das politische Mindset ziehen. In der
0:22:42.000,0:22:46.490
Tat habe ich in der Zeit eine Kampagne[br]gegen CETA in Schleswig-Holstein geleitet
0:22:46.490,0:22:53.499
und deshalb bin ich auch gependelt. Und[br]man kann gar nicht genug betonen, wie groß
0:22:53.499,0:23:01.200
der Unterschied zwischen gekauften Daten,[br]- äh - gekauften Produkten und geklickten
0:23:01.200,0:23:06.379
Produkten ist. Ich habe hier für diesen[br]Vortrag mal alles was ich in der Zeit
0:23:06.379,0:23:10.440
gekauft habe auf meinem Küchentisch[br]drapiert. Wenn ich aber alle Produkte, die
0:23:10.440,0:23:14.950
ich nur angesehen habe, auf ein Foto[br]quetschen wollen würde dann müsste ich
0:23:14.950,0:23:18.380
nicht nur meine komplette Küche[br]leerräumen, sondern wahrscheinlich meine
0:23:18.380,0:23:22.649
ganze Wohnung. Denn das wird sonst nicht[br]reinpassen. Das ist viel, viel mehr.
0:23:22.649,0:23:27.429
L: Was man in den Daten außerdem gesehen[br]hat ist, dass man sagen kann, dass Katha
0:23:27.429,0:23:31.889
auf jeden Fall über 500 Mal nach Begriffen[br]gesucht hat und auch dass sie ungefähr 450
0:23:31.889,0:23:37.480
Mal direkt auf Produkte zugegangen ist.[br]Man kann aber schon sagen, dass es noch
0:23:37.480,0:23:40.950
eine ganze Ecke mehr ist, weil das sind[br]nur die Sachen die offensichtlich waren
0:23:40.950,0:23:43.799
und wenn man nochmal per Hand wieder in[br]diesen Datensatz reinspringt und nach
0:23:43.799,0:23:46.559
Mustern sucht, kann man auch sehen, dass[br]es noch mehr Produkte sind, die man sich
0:23:46.559,0:23:49.820
angeschaut hat.[br]K: Ja, ich hab mich dann natürlich
0:23:49.820,0:23:56.730
gefragt, was sieht eigentlich jemand, der[br]mich persönlich nicht kennt, nur diesen
0:23:56.730,0:24:04.039
Datensatz sieht. Wen sieht er dann? Und[br]finde ich das eigentlich okay? Und ich hab
0:24:04.039,0:24:07.009
mir dann mal so einige Sachen angeschaut, die[br]ich angeklickt habe und mal aus
0:24:07.009,0:24:11.950
unterschiedlichen Brillen betrachtet.[br]Nehmen wir mal das Thema Lebensplanung.
0:24:11.950,0:24:16.870
Stellen wir mal vor jemand fragt sich,[br]naja, wie stellt sich Katharina Nocun ihre
0:24:16.870,0:24:20.140
Zukunft so vor, wie ist ihre[br]Lebensplanung? Und der guckt sich meinen
0:24:20.140,0:24:24.159
Clickstream an - was findet der da? Ich[br]hab mir ein Buch angeschaut, das sich mit
0:24:24.159,0:24:28.629
Pro-Argumenten fürs Kinderkriegen[br]auseinandersetzt. Dann habe ich mir aber
0:24:28.629,0:24:33.200
auch ein Buch angeschaut was ich mit[br]alternativen Partnerschaftsformen und
0:24:33.200,0:24:38.649
Polyamorie auseinandersetzt und natürlich[br]noch ein Buch von einer Aussteigerin, die
0:24:38.649,0:24:45.169
sagt, ich werde der Konsumgesellschaft den[br]Rücken kehren. Und wenn man diese 3
0:24:45.169,0:24:49.179
Produkte und noch ein paar mehr in der[br]Richtung zusammenlegt, wird man denken, so
0:24:49.179,0:24:52.120
okay, das ist zumindest eine[br]außergewöhnliche, originelle bis hin zu
0:24:52.120,0:24:56.240
exotische oder vielleicht auch schwierige[br]Lebensplanung, wenn man das alles unter
0:24:56.240,0:25:02.110
einen Hut bekommen will. Aber wie ist es[br]denn tatsächlich? Das Buch über Kinder
0:25:02.110,0:25:07.390
habe ich mir angeschaut, weil ich auf den[br]Autor aufmerksam geworden bin, weil ich
0:25:07.390,0:25:10.710
den Blog "Spreeblick" sehr schätze und[br]schlichtweg wissen wollte, naja was
0:25:10.710,0:25:15.639
schreibt der Typ denn sonst noch. Bei dem[br]zweiten Buch war es so, dass ich den Autor
0:25:15.639,0:25:18.039
kenne und er hat mich zur Lesung[br]eingeladen - da wollte ich mich vorher
0:25:18.039,0:25:23.029
schlau machen, worum geht denn eigentlich[br]bei der Veranstaltung? Und bei dem dritten
0:25:23.029,0:25:27.159
Buch ist es schlichtweg so, wir sind beim[br]selben Verlag. Ich wollte einfach gucken,
0:25:27.159,0:25:33.279
was hat der Verlag bei dem ich bin, sonst[br]noch in der Sachbuchsparte? Das heißt
0:25:33.279,0:25:40.179
Clickstream oder das Bild, das aus meinem[br]Clickstream generiert wird, und die
0:25:40.179,0:25:45.659
Person, die ich bin, sind womöglich zwei[br]ganz unterschiedliche Dinge. Nehmen wir
0:25:45.659,0:25:49.809
mal das Thema Gesundheit, da wird es noch[br]viel deutlicher. Ich hab mir Schnaps
0:25:49.809,0:25:56.570
angeguckt, dafür gibt's sogar eine eigene[br]Kategorie bei Amazon: Alkohol. Man könnte
0:25:56.570,0:26:02.149
ja jetzt Vermutungen anstellen, warum[br]interessiere ich mich für Schnaps. Naja,
0:26:02.149,0:26:04.760
vielleicht habe ich ja gesundheitliche[br]Probleme und möchte ein bisschen
0:26:04.760,0:26:10.330
Selbstmedikation betreiben. Ich habe mir[br]tatsächlich ein Buch über Arthrose
0:26:10.330,0:26:15.489
angeschaut - ne ziemlich schwere Krankheit[br]- und was noch viel erschreckender ist,
0:26:15.489,0:26:20.529
ich habe mir nicht nur ein, zwei, drei,[br]sondern sehr viele Bücher zum Thema Krebs
0:26:20.529,0:26:27.519
angeschaut. Hier exemplarisch eins mit dem[br]Titel "Krebs natürlich heilen". Und wenn
0:26:27.519,0:26:30.950
man diese - meinen Clickstream - so[br]anschauen würde, würde man ja denken,
0:26:30.950,0:26:37.559
Katharina Nocun ist ein gesundheitliches[br]Wrack. Aber wie sieht es denn wirklich
0:26:37.559,0:26:40.809
aus? Ich muss sagen, dieser Gin ist[br]wirklich gut, ich trinke ihn wirklich
0:26:40.809,0:26:42.889
gerne.[br]Lachen
0:26:42.889,0:26:48.169
K: Die Bücher über schwere Krankheiten[br]habe ich mir aber deshalb angeschaut, weil
0:26:48.169,0:26:52.980
ich eine Recherche betrieben habe. Ich[br]wollte wissen, wie hoch ist der Anteil an
0:26:52.980,0:27:00.350
esoterischen Quatsch-Büchern in der Amazon[br]Bestsellerliste beim Thema Gesundheit. Und
0:27:00.350,0:27:05.230
diese Intention sieht man aber nicht, wenn[br]man nur den Clickstream sieht. Ich habe
0:27:05.230,0:27:08.730
weder Krebs, noch Arthrose, noch[br]irgendwelche Anzeichen dafür. Interessant
0:27:08.730,0:27:14.140
wird es auch bei der politischen[br]Einstellung. In meinem Clickstream finden
0:27:14.140,0:27:18.480
sich unglaublich viele Bücher die sich mit[br]dem Thema AfD auseinandersetzen und zwar
0:27:18.480,0:27:27.299
einmal kontra AfD, aber auch Bücher von[br]rechten, rechtsextremen Autoren und
0:27:27.299,0:27:32.879
Verschwörungstheoretikern. Und wenn man[br]nur meinen Clickstream betrachtet, wird
0:27:32.879,0:27:36.520
man mich glaube ich für eine ziemlich[br]merkwürdige bis unsympathische Person
0:27:36.520,0:27:43.049
halten. Und man wird denken, die ist[br]rechts. Tatsächlich war es natürlich so,
0:27:43.049,0:27:46.169
ich setze mich kritisch mit der AfD in[br]meinem Blog auseinander und habe
0:27:46.169,0:27:49.980
recherchiert und da recherchiert man...[br]Applaus
0:27:49.980,0:27:53.159
L: Ja, die AfD kann wirklich niemand[br]unterstützen, das muss man hier mal echt
0:27:53.159,0:27:57.360
sagen.[br]K: Ja und da wollte ich mir natürlich auch
0:27:57.360,0:28:01.789
ein bisschen angucken, naja, was schreibt[br]denn so die rechte Ecke oder was
0:28:01.789,0:28:06.460
publizieren so ein paar Scharfmacher aus[br]der rechten Ecke und wie hoch ist das
0:28:06.460,0:28:12.269
eigentlich bei den Amazon Bestsellerlisten[br]gerankt. Und wer aber nur meinen Datensatz
0:28:12.269,0:28:15.450
sieht, der sieht das nicht - der wird mich[br]vielleicht für rechtsextrem halten.
0:28:15.450,0:28:22.440
Interessant werden solche Zusammenhänge,[br]wenn man sich überlegt, wer ein Interesse
0:28:22.440,0:28:27.269
an solchen Daten haben könnte. Denn wo[br]Daten sind, entstehen schnell
0:28:27.269,0:28:31.549
Begehrlichkeiten und natürlich gibt es[br]auch Behörden, die durchaus ein Interesse
0:28:31.549,0:28:36.980
daran haben können, solche Nutzerdaten[br]abzufragen und zwar alles was da ist und
0:28:36.980,0:28:42.070
wenn der Clickstream da ist, dann wird er[br]auch abgefragt. Und stellen wir uns mal
0:28:42.070,0:28:46.980
vor, ein Polizeibeamter kommt auf die[br]Idee, die Katha, die ist vielleicht cyber-
0:28:46.980,0:28:51.679
kriminell oder vielleicht ist sie auch ein[br]potenzieller Gefährder oder von ihr geht
0:28:51.679,0:28:56.609
eine drohende Gefahr aus. Und wir wollen[br]jetzt gezielt mal gucken, ob es
0:28:56.609,0:29:05.139
irgendwelche Indizien gibt, die diese[br]These stützt. Was sehen diese Leute? Naja,
0:29:05.139,0:29:13.440
zunächst einmal findet sich auf meiner[br]Liste ein sogenanntes Killerspiel. Es ist
0:29:13.440,0:29:19.029
schon mal extrem sympathisch aus, wenn man[br]aus Behördensicht da mal draufguckt. Dann
0:29:19.029,0:29:24.499
habe ich mir auch noch angeschaut, ein[br]schwarzes T-Shirt mit einem Aufdruck auf
0:29:24.499,0:29:30.419
dem steht "Chemist - only because[br]superwoman is not an official job title".
0:29:30.419,0:29:36.269
Man könnte also denken, ich habe durchaus[br]interessante Skills und Hobbys. Als
0:29:36.269,0:29:44.010
Nächstes ein verdächtig aussehender[br]Gegenstand - ein Kochtopf, und eine
0:29:44.010,0:29:50.800
Sturmmaske. Ja und ich weiß nicht, wie ihr[br]das seht, aber aus Behördensicht wird das
0:29:50.800,0:29:53.700
überhaupt nicht gut für mich aussehen,[br]wenn man schon mal mit der Brille
0:29:53.700,0:29:59.049
draufguckt, naja die könnte was planen,[br]die könnte gefährlich sein. Ich glaube, an
0:29:59.049,0:30:02.489
der Stelle wäre es dann höchste Zeit für[br]einen Hausbesuch. Aber ihr könnt euch
0:30:02.489,0:30:08.830
natürlich denken, es gibt eine total[br]einfache und harmlose Erklärung für jedes
0:30:08.830,0:30:15.519
Produkt. Genau, "könnte ja jeder sagen",[br]kommt hier vorne aus dem Publikum. Das
0:30:15.519,0:30:19.889
wäre dann das Gegenargument und damit habe[br]ich schlechte Karten. Und ich weiß nicht,
0:30:19.889,0:30:25.059
wie es euch geht, aber ich finde so eine[br]Möglichkeit, sich zu überlegen, was allein
0:30:25.059,0:30:29.649
aus so einem Datenabfall an Konsequenzen[br]für mich entstehen könnte im Worst Case
0:30:29.649,0:30:34.489
Szenario, extrem bedrohlich.[br]L: Genau, denn Katha hat mir ihr Vertrauen
0:30:34.489,0:30:38.199
geschenkt, dass ich die Daten anschaue und[br]vertraulich behandele. Wie sieht das aber
0:30:38.199,0:30:44.539
Amazon? Amazon ist groß, ziemlich groß,[br]hat ungefähr 300 Millionen Nutzer und ich
0:30:44.539,0:30:48.340
habe die Analyse für eine Person gemacht.[br]Amazon kann natürlich die Analyse für alle
0:30:48.340,0:30:52.230
Nutzer machen und erkennt darin Muster und[br]weiß am Ende auch, welches Produkt mit
0:30:52.230,0:30:58.749
welchem im Warenkorb landet.[br]K: Ja und was bedeutet im Warenkorb
0:30:58.749,0:31:03.499
landet, ne? Amazon weiß beispielsweise,[br]was kaufen Leute, die auch dieses Produkt
0:31:03.499,0:31:09.679
gekauft haben. Ein einfachstes Beispiel[br]ist ja die Feinwaage, ne. Als Koch möchte
0:31:09.679,0:31:14.090
man vielleicht exakt wissen, wieviel muss[br]hier rein und wieviel hab ich jetzt hier
0:31:14.090,0:31:18.779
rein getan. Und wenn man das aber kaufen[br]will, kriegt man direkt so diese geilen
0:31:18.779,0:31:21.179
Produktvorschläge.[br]Lachen
0:31:21.179,0:31:29.109
K: Durchaus ein Zeichen dafür, dass es[br]auch andere Verwendungszwecke für
0:31:29.109,0:31:36.220
Feinwaagen gibt. Und ihr lacht, aber das[br]kann wirklich ernsthafte Konsequenzen für
0:31:36.220,0:31:39.850
einen Menschen haben, wenn er vielleicht[br]ohne es zu wissen in einer Schublade
0:31:39.850,0:31:43.549
landet, mit der überhaupt nichts am Hut[br]hat. Anderes Beispiel: Wenn ich jetzt nach
0:31:43.549,0:31:49.580
einem Glasschneider bei Amazon suche,[br]kriege ich eine Sturmmaske empfohlen.
0:31:49.580,0:31:55.000
Lachen[br]K: Was man bei Reitequipment empfohlen
0:31:55.000,0:32:00.720
bekommt, kann sich der eine oder andere[br]vielleicht denken. Und das ist ein
0:32:00.720,0:32:04.669
Problem, denn ich weiß nicht, wie es euch[br]geht, aber ich möchte gerne wissen in
0:32:04.669,0:32:08.989
welchen Schubladen ich lande und ich[br]möchte da vielleicht auch mitreden, wenn
0:32:08.989,0:32:12.619
diese Schubladen mir unangenehm sind. Oder[br]vielleicht finde ich auch, dass es gewisse
0:32:12.619,0:32:17.869
Schubladen einfach nicht geben sollte. Und[br]das Problem ist, dass ich bei meiner
0:32:17.869,0:32:22.999
Datenabfrage eben nur diesen winzigen[br]kleinen Mosaikstein aus dem großen
0:32:22.999,0:32:25.721
Datensatz bekommen habe, aber die[br]eigentliche Information über die
0:32:25.721,0:32:30.059
Möglichkeiten der Auswertung für diesen[br]einen Datensatz, die kann ich erst
0:32:30.059,0:32:34.519
vollumfänglich erfassen, wenn ich das[br]Ganze kenne. Das wird aber Amazon nicht
0:32:34.519,0:32:37.789
rausrücken und Amazon wird auch keine[br]Algorithmen zu Suchvorschlägen oder
0:32:37.789,0:32:42.169
sonstwas rausrücken, denn das ist[br]natürlich ein Geschäftsgeheimnis. Ich
0:32:42.169,0:32:46.419
denke aber das sind die eigentlich[br]spannenden Daten, die wir brauchen, um uns
0:32:46.419,0:32:50.040
wirklich ein Bild davon zu machen, wie[br]dieses Unternehmen uns sieht und wie
0:32:50.040,0:32:53.619
dieses Unternehmen uns auch gezielt[br]manipuliert, um uns beispielsweise
0:32:53.619,0:33:05.749
einzureden, dass wir mehr kaufen sollen.[br]Applaus
0:33:05.749,0:33:12.649
K: Und ich weiß nicht, wie ihr das seht,[br]aber der Name "Amazon" ist super passend.
0:33:12.649,0:33:16.999
Also, ich weiß nicht wer auf die Idee gekommen[br]ist damals, aber es ist ein Knüller. Der
0:33:16.999,0:33:23.299
Amazonas ist der größte Strom Südamerikas[br]und er speist sich aus unglaublich vielen
0:33:23.299,0:33:28.129
kleinen Bächen und Flüssen. Und genauso[br]ist es ja mit Amazon, ja? Ich habe in
0:33:28.129,0:33:32.529
meinem Experiment nur einen einzigen[br]Dienst von Amazon genutzt. Ich hätte den
0:33:32.529,0:33:36.620
Versuch aber natürlich auch ganz anders[br]machen können. Was wäre dann gewesen, wenn
0:33:36.620,0:33:43.639
ich beispielsweise während der kompletten[br]Zeit alle Videos, alle Filme nur noch mit
0:33:43.639,0:33:48.669
Amazon Prime gesehen hätte? Was wäre[br]gewesen, wenn ich mich entschieden hätte
0:33:48.669,0:33:53.979
in dieses Experiment Alexa, also Amazon[br]Echo mit reinzufügen und mir dieses Ding
0:33:53.979,0:33:59.440
vielleicht ins Schlafzimmer zu stellen?[br]Ich glaube der Datensatz wäre um einiges
0:33:59.440,0:34:04.149
aufschlussreicher und ich für meinen Teil[br]habe an dieser Stelle ganz bewusst am
0:34:04.149,0:34:08.610
Anfang des Experiments entschieden, nein,[br]das möchte ich nicht. Nein, es geht mir zu
0:34:08.610,0:34:13.290
weit. Ich stelle mir so ein Ding nicht in[br]die Wohnung.
0:34:13.290,0:34:22.250
Applaus[br]K: Und vor ein paar Wochen war ich dann
0:34:22.250,0:34:26.490
sehr froh, dass ich diese Entscheidung so[br]getroffen hatte damals. Denn ich weiß
0:34:26.490,0:34:30.109
nicht ob ihr es mitbekommen habt. Es war[br]groß in den Nachrichten, ein Nutzer hat
0:34:30.109,0:34:35.030
kürzlich bei Amazon seine Daten von Amazon[br]Echo abgefragt und hat daraufhin den
0:34:35.030,0:34:40.039
Datensatz einer vollkommen anderen Person[br]zurückbekommen. Nochmal so als Hinweis,
0:34:40.039,0:34:49.690
dass das Ding echt nicht ins Schlafzimmer[br]gehört. Und ja, nochmal um es deutlich zu
0:34:49.690,0:34:53.609
machen. Wenn jemand wirklich all diese[br]Dienste nutzt oder viele Dienste nutzt,
0:34:53.609,0:34:56.409
dann loggt ihr euch meistens mit derselben[br]Amazon-ID ein.
0:34:56.409,0:35:01.800
L: Genau, das ist ja auch das, was in 'nem[br]Amazon Datensatz gespeichert wurde. Also
0:35:01.800,0:35:04.390
wenn ihr woanders auf einen anderen Dienst[br]geht, dann wird das einfach mitgeloggt,
0:35:04.390,0:35:08.789
egal ob das jetzt auch wegen der gleichen[br]Login-Adresse ist. Ihr habt auf jeden Fall
0:35:08.789,0:35:13.420
auch das im Cookie stehen, welche ID ihr[br]dahinter habt.
0:35:13.420,0:35:16.420
K: Und ihr fragt euch ja jetzt, das ist ja[br]schön und gut dass du deine Daten hast,
0:35:16.420,0:35:21.780
das ist toll für mich, aber was ist mit[br]meinen Daten und wie komme ich an die? Es
0:35:21.780,0:35:24.559
gibt viele Wege um an seine Daten zu[br]kommen. Ich kann euch einfach mal
0:35:24.559,0:35:30.030
erzählen, wie ich das gemacht habe.[br]Zunächst einmal: ich hab mir die AGB
0:35:30.030,0:35:34.560
durchgelesen - tatsächlich vollständig. Es[br]ist ein ganz neues Erlebnis. Ich bin jetzt
0:35:34.560,0:35:41.040
top informiert.[br]Applaus
0:35:41.040,0:35:44.320
K: Und ich habe mir die[br]Datenschutzerklärung durchgelesen. Ja und
0:35:44.320,0:35:49.070
warum habe ich das gemacht? Sowohl in AGB[br]und Datenschutzerklärung sind schon mal so
0:35:49.070,0:35:53.810
grob Datenkategorien angesprochen, und die[br]kann ich mir notieren, damit ich so weiß, was
0:35:53.810,0:35:57.720
kann ich dann erwarten oder was sollte ich[br]erwarten, was bei so einer Auskunft
0:35:57.720,0:36:04.960
rauskommen sollte. Zusätzlich habe ich[br]meinen gesunden Menschenverstand benutzt,
0:36:04.960,0:36:08.420
um mal zu überlegen...[br]Applaus
0:36:08.420,0:36:15.040
K: ...um mal zu überlegen, naja was kann[br]ich denn nach den Gesetzen der Logik
0:36:15.040,0:36:18.980
erwarten. Also beispielsweise, ich bin auf[br]Amazon, eine Woche später kriege ich eine
0:36:18.980,0:36:22.130
E-Mail, "wollen sie dieses Produkt nicht[br]doch kaufen?", also müssen die für eine
0:36:22.130,0:36:26.250
Woche speichern, was ich geklickt hab. Und[br]egal wie oft die sagen, "Nein, haben wir
0:36:26.250,0:36:30.221
nicht". Das ist eine Lüge weil sonst wird[br]es technisch sehr schwierig sein, das
0:36:30.221,0:36:35.300
umzusetzen. Und aus diesen Informationen[br]hab ich dann eine Checkliste gebaut mit
0:36:35.300,0:36:39.170
meiner Erwartungshaltung. Was erwarte ich,[br]was in der vollständigen Antwort drin sein
0:36:39.170,0:36:44.970
sollte, und erst dann habe ich die Anfrage[br]formuliert und gestellt. Und ich kann gar
0:36:44.970,0:36:50.150
nicht oft genug betonen, wie wichtig es[br]ist, bei Anfragen immer 'ne Frist zu
0:36:50.150,0:36:55.330
nennen. Ohne Frist wird sich da niemand[br]bewegen. Zwar gibt es nach der
0:36:55.330,0:36:58.900
Datenschutz-Grundverordnung einen[br]Zeitrahmen, in dem die euch antworten
0:36:58.900,0:37:03.609
sollten, idealerweise innerhalb von einem[br]Monat, aber es schadet nicht, diese Frist
0:37:03.609,0:37:08.119
trotzdem nochmal explizit reinzuschreiben[br]und auch sofort nochmal zu erinnern, wenn
0:37:08.119,0:37:12.599
die Zeit überschritten wird. Und[br]motivierend kann natürlich auch sein, wenn
0:37:12.599,0:37:15.680
man noch reinschreibt, naja wenn ihr nicht[br]antwortet - müsst ihr wissen, aber dann
0:37:15.680,0:37:22.680
wenn ich mich an die Aufsichtsbehörden.[br]Mit der Anfrage ist es leider noch nicht
0:37:22.680,0:37:27.900
getan. Wenn ihr so eine Anfrage stellt,[br]stellt euch auf eine Brieffreundschaft ein
0:37:27.900,0:37:32.839
- ist ja vielleicht auch etwas Schönes,[br]wenn ihr diese Anfrage stellt, werdet ihr
0:37:32.839,0:37:36.869
zuerst mit hoher Wahrscheinlichkeit die[br]Antwort zurückbekommen: "Naja, schauen Sie
0:37:36.869,0:37:40.690
mal in Ihrem Profil nach, da sind all Ihre[br]Daten". Das ist natürlich Quatsch, das ist
0:37:40.690,0:37:45.210
nur ein Bruchteil von den Daten, die ihr[br]eigentlich haben wollt. Also verschicken
0:37:45.210,0:37:51.079
wir einen "friendly reminder". Als[br]nächstes kommt vielleicht ein Brief oder
0:37:51.079,0:37:55.089
eine E-Mail: "Ja, wir haben hier ihre[br]Daten" und dann schaut ihr da rein und
0:37:55.089,0:37:59.910
denkt so, okay, da hat jemand die Profildaten[br]jetzt nochmal in PDF gepackt oder
0:37:59.910,0:38:02.359
ausgedruckt. Hmm.[br]L: Ausgedruckt und wieder eingescannt.
0:38:02.359,0:38:06.869
K: Genau. Auch nicht das, was wir haben[br]wollen - solltet ihr euch gar nicht drauf
0:38:06.869,0:38:13.000
einlassen, damit zufrieden geben. Also[br]wieder "friendly reminder". Dann habt ihr
0:38:13.000,0:38:17.770
das nächste Level erreicht. Dann wird[br]irgendwann die Einsicht kommen so "Huch,
0:38:17.770,0:38:20.666
wir haben ein paar Daten gefunden, wir[br]haben die Ihnen jetzt mal geschickt". Das
0:38:20.666,0:38:28.010
ist so die Stelle mit der CD und an der[br]Stelle wird's eben spannend. Die
0:38:28.010,0:38:31.070
Wahrscheinlichkeit, dass ihr dieses Spiel[br]ein paar Mal wiederholen müsst, ist sehr
0:38:31.070,0:38:35.480
hoch. Und irgendwann, wenn ihr das oft[br]genug wiederholt habt, habt ihr dann euren
0:38:35.480,0:38:40.380
Datensatz. Und diesen Datensatz könnt ihr[br]dann nach Belieben durchsuchen,
0:38:40.380,0:38:44.839
durchforsten, analysieren, und glaubt mir,[br]es lohnt sich. Denn es ist eine Sache,
0:38:44.839,0:38:48.809
abstrakt zu wissen, dass man überwacht[br]wird auf Schritt und Klick, und etwas
0:38:48.809,0:38:53.260
vollkommen anderes, seinen eigenen[br]kaputten Schlafrhythmus der letzten
0:38:53.260,0:38:57.210
anderthalb Jahre vor sich zu sehen.[br]Lachen
0:38:57.210,0:39:01.309
K: Und das ist etwas, das würde ich keinem[br]Einzelhändler anvertrauen wollen.
0:39:01.309,0:39:04.880
Applaus[br]K: Und ich habe mir danach die Frage
0:39:04.880,0:39:08.710
gestellt, möchte ich das? Und jeder, der[br]so einen Datensatz sieht, wird sich diese
0:39:08.710,0:39:13.420
Frage zwangsläufig auch stellen. Und in[br]meinem Fall war es dann so, dass ich mich
0:39:13.420,0:39:18.680
entschieden habe, in Zukunft meine[br]gebrauchten Bücher direkt beim Anbieter zu
0:39:18.680,0:39:22.240
kaufen, nicht mehr über Amazon Marketplace.[br]Das ein oder andere Mal hab ich damit
0:39:22.240,0:39:27.290
sogar Geld gespart.[br]Applaus
0:39:27.290,0:39:32.410
K: Und die Information darüber, was der[br]Dienst speichert, ermöglicht uns ja auch
0:39:32.410,0:39:36.069
vielleicht zu sagen, ich nutze den Dienst[br]in Zukunft anders oder aber ich nutze ihn
0:39:36.069,0:39:39.910
vielleicht gar nicht mehr. Und wenn ihr[br]ihn gar nicht mehr nutzt, dann würde ich
0:39:39.910,0:39:45.240
empfehlen, naja dann könnt ihr auch so ein[br]Löschantrag verschicken. Kostet nix. Ist
0:39:45.240,0:39:51.600
auch vielleicht eine kurze[br]Brieffreundschaft und wir haben uns bei
0:39:51.600,0:39:58.309
diesem Vortrag auch überlegt, dass wir[br]nicht sagen wollen, das ist ein
0:39:58.309,0:40:03.480
individuelles Problem von Nutzerinnen und[br]Nutzern, die Amazon nutzen. Nein, das
0:40:03.480,0:40:07.480
Problem ist, dass Amazon ähnlich agiert[br]wie andere Dienste auch, um mal ehrlich zu
0:40:07.480,0:40:12.650
sein. Überwachung ist längst zur[br]Standardeinstellung geworden. Und was das
0:40:12.650,0:40:16.400
für den Einzelnen bedeutet, das wollten[br]wir sichtbar machen, aber wir finden
0:40:16.400,0:40:21.680
trotzdem, wir müssen alle gemeinsam dafür[br]kämpfen, dass Datenschutz, Privatsphäre,
0:40:21.680,0:40:26.950
Datensparsamkeit verdammt nochmal die[br]Standardeinstellung ist
0:40:26.950,0:40:36.740
großer Applaus[br]K: Ja und damit sind wir auch schon am
0:40:36.740,0:40:41.670
Ende. Mehr Infos und Formulare für eigene[br]Datenanträge, Auskünfte, Löschanträge
0:40:41.670,0:40:46.490
findet ihr bei mir im Blog.[br]L: Und wer sich für die Datenanalyse
0:40:46.490,0:40:50.359
interessiert, da veröffentliche ich gleich[br]auf Ama..., ach auf Amazon... auf
0:40:50.359,0:40:52.359
GitHub...[br]Lachen
0:40:52.359,0:40:56.039
L: ...ein Repository, wo sich jeder auch[br]die Daten anschauen kann und sich selber
0:40:56.039,0:40:59.909
seinen eigenen kaputten Schlafrhythmus mal[br]angucken kann.
0:40:59.909,0:41:02.719
K: Vielen Dank![br]L: Dankeschön!
0:41:02.719,0:41:05.355
Herald: Ja wunderbar! [br]Applaus
0:41:05.355,0:41:08.439
Herald: Einen großen Applaus![br]großer Applaus
0:41:08.439,0:41:10.449
Abspannmusik
0:41:10.449,0:41:14.796
Untertitel erstellt von c3subtitles.de[br]im Jahr 2020. Mach mit und hilf uns!
0:41:14.796,0:41:32.000
Abspannmusik