0:00:00.000,0:00:18.120 35C3 Vorspannmusik 0:00:18.120,0:00:24.570 Herald-Engel: Ja es ist mir eine riesige[br]Freude, heute hier auf dem 35C3 einen Talk 0:00:24.570,0:00:29.970 mit dem Titel "Archäologische Studien im[br]Datenmüll" vorzustellen. Er wird gehalten 0:00:29.970,0:00:34.720 von Katharina Nocun - sie ist Bloggerin,[br]Autorin, aber eigentlich kennt man sie 0:00:34.720,0:00:39.320 auch als Datenschutzaktivistin - und der[br]wunderbaren Letty. Also einen warmen 0:00:39.320,0:00:41.720 Applaus und viel Spaß bei diesem[br]spannenden Thema. 0:00:41.720,0:00:52.780 Applaus 0:00:52.780,0:00:57.629 Letty: Ja danke, Pupe. Es ist schön, dass[br]sich alle Haralde zum Horst machen mit dem 0:00:57.629,0:01:02.950 Französisch. Wir würden zu Beginn mal 'ne[br]Frage stellen - zwei Fragen stellen und 0:01:02.950,0:01:07.429 zwar die erste ist: Wie viel Personen[br]haben hier die Weihnachtsgeschenke bei 0:01:07.429,0:01:10.429 Amazon gekauft?[br]Katharina Nocun: Hola! Lachen 0:01:10.429,0:01:14.619 L: Ups! Lachen Okay ich würde mal grob[br]sagen die Hälfte. Lasst mal bitte eure 0:01:14.619,0:01:18.970 Arme oben, denn es geht weiter: Wer von[br]euch hat nur die Recherche bei Amazon 0:01:18.970,0:01:22.680 gemacht und danach woanders gekauft?[br]Kommen da noch welche hinzu? Ne, die die 0:01:22.680,0:01:27.450 gekauft haben bitte oben lassen, das wär[br]super. Okay es sieht so - okay wer nicht 0:01:27.450,0:01:31.380 bei Amazon kauft, recherchiert auch nicht[br]scheinbar. Okay. Oder es gab wenige, die 0:01:31.380,0:01:34.350 dazugekommen sind.[br]K: Also ich würd sagen das ist deutlich 0:01:34.350,0:01:37.540 mehr als 50 %.[br]L: Ja? Man sieht das nicht. 0:01:37.540,0:01:40.470 K: Ja, aber diejenigen, die eben[br]aufgezeigt haben, die werden mir sicher 0:01:40.470,0:01:45.110 zustimmen, wenn ich sage, das ist ziemlich[br]bequem, wenn nicht sogar verdammt bequem, 0:01:45.110,0:01:49.399 alles bei einem Anbieter zu suchen oder[br]auch bestellen zu können. Und man stellt 0:01:49.399,0:01:55.640 sich das in der Theorie ja auch so sehr[br]komfortabel vor. Ich weiß nicht, wer bei 0:01:55.640,0:02:01.280 DHL die Entscheidung getroffen hat, auf[br]Formel 1-Autos Werbung zu schalten. Ich 0:02:01.280,0:02:04.970 finde der Mensch hat aber sehr viel Humor.[br]Lachen 0:02:04.970,0:02:09.020 K: Denn in der Realität sieht es ja ein[br]bisschen anders aus, ne? Also so richtig gut 0:02:09.020,0:02:14.180 bezahlte Fahrer und schnelle Lieferung,[br]die gibt's in der Praxis eher selten und 0:02:14.180,0:02:19.590 bei Amazon würde ich sagen gar nicht. Und[br]der ein oder andere kennt's vielleicht, 0:02:19.590,0:02:26.300 dass da ein Paket abgegeben wurde oder[br]zugestellt wurde, ist noch kein - ist noch 0:02:26.300,0:02:30.310 lange keine Garantie dafür, dass es[br]wirklich da ist, wo man's hin haben will. 0:02:30.310,0:02:35.359 Also hier so ein Best of für alle, die es[br]noch nicht gelesen haben auf der Folie - 0:02:35.359,0:02:40.900 gesehen beim Tagesspiegel - Zitat: "Habe[br]das Paket im Müll versteckt - im blauen 0:02:40.900,0:02:43.440 Papiercontainer".[br]L: What could possibly go wrong? 0:02:43.440,0:02:48.690 K: Ja und da kommt ja richtig Freude auf[br]wenn man das liest und man denkt sich: "Ja 0:02:48.690,0:02:53.970 wie können wir dieses Problem lösen?"[br]Natürlich hat Amazon da ein Produkt für - 0:02:53.970,0:03:00.620 zumindest für seine US-Kunden. In den USA[br]kann man sich als Prime-Kunde entscheiden, 0:03:00.620,0:03:04.930 ich nutze jetzt Amazon Key. Amazon Key -[br]ähm ja - kontrolliert dann quasi - ist ein 0:03:04.930,0:03:08.460 intelligentes Schließsystem für die[br]Haustür, gibts auch fürs Auto, und dann 0:03:08.460,0:03:13.590 kann man beispielsweise sagen, ja also dem[br]Amazon Paketdienst dem vertraue ich 0:03:13.590,0:03:19.720 grundsätzlich - der kann die Pakete auch[br]innerhalb meines Hausflurs abstellen und 0:03:19.720,0:03:23.060 der kann auch die Tür aufschließen.[br]Passend dazu gibt's auch ein 0:03:23.060,0:03:27.079 Videoüberwachungssystem, wo man dann[br]kontrollieren kann beispielsweise wann die 0:03:27.079,0:03:32.840 Kinder betrunken nachts nach Hause kommen.[br]Und ich weiß nicht wie es euch geht, aber 0:03:32.840,0:03:36.230 ich finde das verdammt creepy. Ich würde[br]das niemals machen, denn ich denke mir, na 0:03:36.230,0:03:41.850 ja ich will mir genau überlegen, wem ich[br]Einblick in meine Wohnung geben will. Aber 0:03:41.850,0:03:46.739 als Datenschützerin habe ich mich gefragt,[br]ist nicht der Einblick den Amazon in unser 0:03:46.739,0:03:51.180 Leben bekommt durch unser Klickverhalten[br]nicht viel intimer, als so ein harmloser 0:03:51.180,0:03:55.630 Blick in den Hausflur? Weil wer bei mir in[br]die Wohnung guckt, der weiß vielleicht wie 0:03:55.630,0:03:59.820 ich lebe, ja? Aber wer mein[br]Onlineverhalten kennt - wer weiß, wann ich 0:03:59.820,0:04:05.320 wo wie klicke, der kann sich vielleicht[br]denken, wie ich denke - und das ist viel 0:04:05.320,0:04:11.859 intimer. Ich hab mich daher im letzten[br]Jahr oder vorletzten Jahr, genauer gesagt 0:04:11.859,0:04:16.720 im Jahr 2016, dazu entschieden, ein[br]Experiment zu machen: Ich wollte wissen, 0:04:16.720,0:04:21.959 was speichert Amazon eigentlich über seine[br]Nutzer und im Zuge dessen habe ich dann 0:04:21.959,0:04:24.370 auch angefangen alle meine[br]Weihnachtsgeschenke und sonstigen 0:04:24.370,0:04:28.229 Geschenke bei Amazon zu bestellen und auch[br]alles dort zu recherchieren, um einen 0:04:28.229,0:04:36.520 möglichst fetten Datensatz zu generieren.[br]Und mein Ziel war natürlich von Anfang an: 0:04:36.520,0:04:42.770 Ich möchte an diese Daten ran. Ich möchte[br]sie sezieren. Ich möchte Sie sehen. Ich 0:04:42.770,0:04:46.919 möchte wissen was genau Amazon über seine[br]Kunden speichert. Denn ich weiß nicht ob 0:04:46.919,0:04:52.250 ihr es wusstet, aber nach Artikel 15 der[br]Datenschutz-Grundverordnung hat jeder 0:04:52.250,0:04:56.780 Nutzer in ganz Europa das Recht jederzeit[br]zu seinem Anbieter zu gehen und zu sagen: 0:04:56.780,0:05:01.199 "Hey ich möchte eine kostenlose Kopie[br]meiner Daten haben" und der Anbieter muss 0:05:01.199,0:05:06.850 dann liefern. In der Praxis macht das aber[br]kaum jemand. Und bei Amazon hat das soweit 0:05:06.850,0:05:10.479 ich wusste noch nie jemand so richtig[br]durchgezogen, dass da was Verwertbares 0:05:10.479,0:05:14.150 rausgekommen ist. Also habe ich mich[br]entschlossen, ich gehe auf die 0:05:14.150,0:05:21.159 Datenpirsch. Was hab ich also gemacht? Ich[br]habe ganz viel eingekauft. Was hab ich 0:05:21.159,0:05:26.919 denn eingekauft? Ich hab fast 60 Bücher[br]innerhalb von 14 Monaten gekauft und falls 0:05:26.919,0:05:29.990 ihr euch jetzt fragt - ja ich hab[br]tatsächlich mittlerweile mindestens 50 0:05:29.990,0:05:36.400 Prozent davon auch gelesen. Ich habe...[br]Applaus 0:05:36.400,0:05:41.919 K: ...Ich hab außerdem aber auch so[br]praktische Sachen bestellt wie 0:05:41.919,0:05:47.889 beispielsweise Sprühkreide für eine[br]Protestaktion und eine Button-Maschine. In 0:05:47.889,0:05:52.241 meinem Kaufprofil hat sich dann aber auch[br]so komischer Kram angesammelt, wie 0:05:52.241,0:05:56.039 beispielsweise das[br]Lavendeleinschlafkissenspray. Der eine 0:05:56.039,0:06:02.389 oder andere kennt es vielleicht aus dem[br]Radisson Blu am CCH. Was leider nicht auf 0:06:02.389,0:06:06.770 dem Bild zu sehen ist, ist der[br]Hometrainer, den ich mir gekauft habe. Der 0:06:06.770,0:06:11.169 war so erfolgreich, dass ich ihn nach drei[br]Monaten wieder weiterverkauft hab. Ich 0:06:11.169,0:06:14.600 habe mir aber auch sinnvolle Sachen[br]gekauft, wie beispielsweise 'ne Maus, 0:06:14.600,0:06:19.430 einen Ordner oder auch Schnürsenkel und[br]bin auch durch Amazon Besitzerin der 0:06:19.430,0:06:26.229 schönsten Hausschuhe auf diesem Planeten.[br]Im August 2017 habe ich mir dann gedacht, 0:06:26.229,0:06:31.300 so jetzt ist der Datensatz schön fett[br]angefüttert mit Klicks und Käufen. Jetzt 0:06:31.300,0:06:36.669 frage ich mal meine Daten ab. Und das war[br]leider - muss ich sagen - der Beginn einer 0:06:36.669,0:06:42.979 langen und intensiven Brieffreundschaft[br]mit der Datenschutzabteilung. Und zunächst 0:06:42.979,0:06:45.970 habe ich nicht das bekommen, was ich haben[br]wollte. Ich habe dann aber immer weiter 0:06:45.970,0:06:49.680 nachgefragt und irgendwann haben sie[br]angefangen mir CD-ROMs zuzuschicken. 0:06:49.680,0:06:53.639 Lachen[br]K: Ja, musst' ich erstmal im Keller 0:06:53.639,0:06:58.000 gucken, wie man denn so antike Datenträger[br]auslesen kann und auf der ersten CD fand 0:06:58.000,0:07:03.661 sich leider auch nur das, was ich erwartet[br]hatte: Eine Kopie meiner Profildaten, die 0:07:03.661,0:07:07.499 auch online einsehbar sind, plus ein paar[br]Zusatzinformationen - also nicht das was 0:07:07.499,0:07:10.830 ich eigentlich wollte. Ich hab dann weiter[br]Stress gemacht, habe dann irgendwann 'ne 0:07:10.830,0:07:15.120 zweite CD-ROM zugeschickt bekommen.[br]Eigentlich habe ich drei zugeschickt 0:07:15.120,0:07:16.550 bekommen - die andere ist in der Post[br]verschwunden. 0:07:16.550,0:07:23.409 L: In der Mülltonne.[br]K: Wahrscheinlich. Ja und dann habe ich 0:07:23.409,0:07:27.130 auf dieser letzten CD mal geguckt was ist[br]denn da drauf? Und da waren so Sachen drauf 0:07:27.130,0:07:31.819 wie ein PDF, wo ich sehen konnte, was für[br]Suchanfragen ich getätigt habe. Ich konnte 0:07:31.819,0:07:36.439 sehen, auf welche Werbe-E-Mails ich wann[br]reagiert hab - auf die Sekunde genau. Und 0:07:36.439,0:07:40.669 ich konnte sehen, auf welche Werbeanzeigen[br]ich reagiert habe. Das Interessante war 0:07:40.669,0:07:46.659 allerdings so eine Excel-Tabelle und diese[br]Excel-Tabelle trug den unschuldigen Namen 0:07:46.659,0:07:52.209 "Clickstream". Die habe ich mal aufgemacht[br]und das hat erst mal eine ganze Zeit lang 0:07:52.209,0:07:56.859 zum Laden gebraucht. Und irgendwann habe[br]ich dann gesehen - okay diese Excel- 0:07:56.859,0:08:06.739 Tabelle hat 15.365 Zeilen und jede Zeile[br]hat bis zu 50 Zusatzangaben, also 50 0:08:06.739,0:08:11.659 Spalten. Ich war gestern mal im[br]Supermarkt, um das zu visualisieren. So 0:08:11.659,0:08:14.739 viel Papier wär das, wenn das ausgedruckt[br]wär. Mein eigentliches Ziel war es, auf 0:08:14.739,0:08:18.439 einen Stapel zu packen das wäre dann[br]größer als ich mit meinen 1,70m. 0:08:18.439,0:08:22.120 Allerdings haben wir das aus[br]Sicherheitsgründen sein lassen, denn das 0:08:22.120,0:08:26.530 wäre zusammengekracht.[br]L: Ja und als Katha mich gefragt hat, ob 0:08:26.530,0:08:30.629 ich ihre Daten auswerten will, dachte ich[br]als Erstes an meine Datenbankenvorlesung - 0:08:30.629,0:08:35.350 so Beziehung zwischen Kunden und[br]Lieferanten und was kauft man. Aber der 0:08:35.350,0:08:38.560 Clickstream von Amazon sind nicht nur die[br]Käufe. Denn eigentlich wird alles 0:08:38.560,0:08:41.979 abgespeichert, was wir mit der Seite[br]machen. Es ist egal ob wir nur auf die 0:08:41.979,0:08:45.610 Startseite gehen, ob wir Produkte suchen[br]oder ob wir uns ein Produkt genau 0:08:45.610,0:08:50.780 anschauen. Es wird sogar gespeichert, wenn[br]wir uns ein Bild vergrößern und natürlich 0:08:50.780,0:08:55.580 auch jede Interaktion, die wir haben, wenn[br]wir auf unserem Nutzerkonto sind. Und weil 0:08:55.580,0:08:58.790 wir hier ja einen Foundationstalk machen,[br]habe ich mir gedacht, ich will euch auch 0:08:58.790,0:09:02.210 ein bisschen mitnehmen in die Reise in die[br]Daten, die unbekannt sind und wie man 0:09:02.210,0:09:05.620 eigentlich mit so einem unbekannten[br]Datensatz vorgehen kann, ihn explorativ 0:09:05.620,0:09:08.950 analysieren kann, um zu wissen, was steckt[br]überhaupt in diesen Daten drin? Was kann 0:09:08.950,0:09:13.680 man vielleicht mit den Daten sehen? Also[br]wie schon gesagt, wir haben 50 Spalten 0:09:13.680,0:09:17.400 oder auch Dimensionen genannt, und da ich[br]die nicht alle hier auflisten kann, habe 0:09:17.400,0:09:21.320 ich versucht, 'ne grobe Zuordnung zu[br]Gruppen zu finden. Wir haben als erstes 0:09:21.320,0:09:26.200 natürlich 'ne Zeitangabe, ganz klar. Wir[br]haben Account-Details, sowas wie seid ihr 0:09:26.200,0:09:32.270 Prime-Kunde oder Business-Kunde, und 'nen[br]Ortsbezug. Amazon speichert die IP-Adresse 0:09:32.270,0:09:35.340 nicht vollständig - der letzte Block ist[br]weggestrichen. Aber was sie außerdem 0:09:35.340,0:09:39.560 speichern ist, in welchem Land, in welchem[br]Bundesland und welcher Internet-Service- 0:09:39.560,0:09:43.000 Provider, also der Internetanbieter, den[br]ihr da genutzt habt, um die Seite zu 0:09:43.000,0:09:48.350 besuchen. Außerdem wird natürlich die URL[br]gespeichert, die ihr da besucht habt und 0:09:48.350,0:09:52.630 wenn es auch noch ein Produkt ist, wird[br]dazu die Produkt-ID auch abgespeichert. 0:09:52.630,0:09:57.900 Achso, hm, oh jetzt habe ich die[br]Sessiondetails vergessen. Ja, die Session- 0:09:57.900,0:10:01.770 Details sind so alles, was so im Cookie[br]auch landet, damit man einfach sieht in 0:10:01.770,0:10:06.340 welcher Session man sich gerade befindet.[br]Und es gibt noch eine ID, die euch über 0:10:06.340,0:10:11.580 alle Dienste von Amazon hinweg[br]identifizieren kann. Und bei den 0:10:11.580,0:10:16.200 Navigationsdetails ist es eigentlich schon[br]ein bisschen klar, wo es hingeht. Amazon 0:10:16.200,0:10:20.420 sieht, von wo ihr kommt, wo ihr gerade[br]seid und wo geht ihr dann hin. Dieser 0:10:20.420,0:10:25.020 gesamte Verlauf wird einmal abgespeichert[br]- und nicht nur der Verlauf, sondern auch 0:10:25.020,0:10:27.710 was habt ihr da gemacht, welche[br]Interaktionen habt ihr gemacht, habt ihr 0:10:27.710,0:10:32.080 etwas in den Warenkorb hinzugefügt, habt[br]ihr euch ein Bild angeschaut oder habt ihr 0:10:32.080,0:10:37.420 etwas für später gespeichert? Als letztes[br]kann man so einen Block sehen, das heißt 0:10:37.420,0:10:42.380 Amazoninterna. Wir sehen, an welchen Web-[br]Server die Anfrage gestellt wurde und ob 0:10:42.380,0:10:46.780 die Anfrage eine interne IP-Adresse bei[br]Amazon hat. Ihr bekommt von Amazon 0:10:46.780,0:10:51.490 außerdem eine lange Liste mit all diesen[br]Dimensionen und die Erläuterung dazu, was 0:10:51.490,0:10:56.811 sich dahinter verbirgt. Manchmal speichert[br]Amazon aber nicht den Klartext, sondern 0:10:56.811,0:11:00.960 codiert etwas was z.B. wie: Null bedeutet,[br]ihr habt was in den Warenkorb gelegt. 0:11:00.960,0:11:04.710 Denkt man erst mal: Super hat man nicht so[br]viel zu parsen. Dann hab ich aber 0:11:04.710,0:11:07.850 festgestellt, als ich mir die Daten[br]genauer angeschaut habe, so Amazon erzählt 0:11:07.850,0:11:12.260 aber nicht, was sie alles codiert oder was[br]sie codieren. Manche Felder sind uns 0:11:12.260,0:11:15.130 schlicht unbekannt.[br]K: Ja, sagen wir mal so: Die 0:11:15.130,0:11:18.110 Brieffreundschaft dauert noch an.[br]L: Ich hoffe auch, wir werden darauf noch 0:11:18.110,0:11:22.221 nochmal Antwort bekommen. Wenn wir jetzt[br]also den Datensatz mit den 50 Spalten 0:11:22.221,0:11:26.740 vorstellen, haben wir irgendwie über[br]15.000 Einträge. Ich hab mal 2 0:11:26.740,0:11:29.140 herausgenommen, um einfach nur[br]exemplarisch zu zeigen, wie sind die 0:11:29.140,0:11:32.930 überhaupt aufgebaut. Also wir haben Datum,[br]wir haben 'ne Aktion, die wir machen, 0:11:32.930,0:11:36.950 sowas wie 'gesucht' oder 'gekauft', und dann[br]haben wir dazu die URL, aus welchem 0:11:36.950,0:11:41.110 Bundesland vielleicht das Ganze abgesetzt[br]wurde, welcher Internet-Provider da 0:11:41.110,0:11:45.490 dahinter steckt und wie lang die Ladezeit[br]war. Das haben wir natürlich nicht nur für 0:11:45.490,0:11:51.690 diese 2 Einträge, sondern wie gesagt für[br]über 15.000. Welchen Zeitraum betrachten 0:11:51.690,0:11:56.330 wir hier eigentlich in den Daten? Es geht[br]los am 1. August 2016 und es endet am 0:11:56.330,0:12:03.170 31. August 2017. Das sind dann etwa 196 Tage,[br]die mit Interaktionen behaftet sind und 0:12:03.170,0:12:09.010 das wären dann sozusagen 78 Einträge pro[br]Tag. Wenn ich mit so 'nem unbekannten 0:12:09.010,0:12:12.710 Datensatz arbeite, dann arbeite ich[br]eigentlich immer mit Python und dem Pandas 0:12:12.710,0:12:17.260 Package, was sich so für Datenanalyse[br]einfach als Standard durchgesetzt hat. Und 0:12:17.260,0:12:20.080 egal was mir Amazon sagt, was in den Daten[br]sind, ich schaue mir die Dimensionen immer 0:12:20.080,0:12:23.820 nochmal ganz genau an. Das heißt welche[br]Dimension habe ich und wie häufig wurde 0:12:23.820,0:12:28.581 sie benutzt? Es gibt extrem viele, die[br]immer benutzt werden - sowas wie Datum und 0:12:28.581,0:12:33.080 Uhrzeit. Die Angabe gibt es immer, aber es[br]gibt auch Dimensionen, die einfach nicht 0:12:33.080,0:12:35.970 so häufig genutzt werden, und wir haben[br]auch eine Dimension bekommen, die wurde 0:12:35.970,0:12:41.890 nie genutzt - irgendwas über Bilder. Keine[br]Ahnung was da drin ist. Ich hab mir dann 0:12:41.890,0:12:44.930 jede Dimension wirklich einzeln angeguckt,[br]was da drin steht und wie häufig das 0:12:44.930,0:12:50.410 passiert. Und bin über die Zeit gestoßen,[br]die wirklich eine sekundengenaue Angabe 0:12:50.410,0:12:54.760 sein soll, was man auf Amazon macht. Und[br]ich weiß nicht, wie man es hinbekommt, in 0:12:54.760,0:12:59.141 einer Sekunde irgendwie 45 Einträge zu[br]generieren, aber ich dachte mir, okay, ich 0:12:59.141,0:13:02.310 nehme erst mal noch eine andere Spalte und[br]schaue mal was da noch drin steht ist - 0:13:02.310,0:13:06.130 vielleicht ist das ja ein Ausreißer oder[br]es sind mehrere Ausreißer - weiß man ja 0:13:06.130,0:13:09.990 nicht. Dann hab ich mir so einen Tag[br]genauer angeguckt. Also man kann auch die 0:13:09.990,0:13:12.980 Zeitangabe nur für einen Tag nehmen. Das[br]ist irgendwie so eine relative 0:13:12.980,0:13:16.570 Gleichverteilung. Und dann hat man da so 3[br]Ausreißer - die sind irgendwie wahnsinnig 0:13:16.570,0:13:20.940 verdächtig, weil die stark abweichen von[br]den anderen und es gibt sogar einen der 0:13:20.940,0:13:27.490 irgendwie 710 Einträge beinhaltet aber ich[br]weiß ja nicht, wie intensiv Katha Amazon 0:13:27.490,0:13:32.510 genutzt hat in der Zeit von morgens bis[br]abends - auf jeden Fall sportlich. Dann 0:13:32.510,0:13:36.120 habe ich mir den Tag aber wirklich mal[br]ganz genau angeschaut. Wir haben 710 0:13:36.120,0:13:39.420 Einträge. Dann hab ich mal geguckt, was[br]ist denn für eine Zeitspanne die wir 0:13:39.420,0:13:46.030 haben? 20 Minuten und 35 Sekunden. Das[br]heißt für einen Eintrag würde Katha 1,74 0:13:46.030,0:13:49.560 Sekunden brauchen. Das Ganze würde dann[br]wahrscheinlich so aussehen. 0:13:49.560,0:13:51.660 Lachen[br]K: Ja und wenn ich das schaffe, spätestens 0:13:51.660,0:13:55.030 an der Stelle sollte ich meine Karriere[br]als Progamer überdenken. 0:13:55.030,0:14:00.280 L: Ja. Ich bin daraufhin nochmal genauer[br]in die Daten eingestiegen und Pandas hat 0:14:00.280,0:14:03.360 so 'nen value_counts, was das Histogramm[br]sozusagen darstellen würde - 0:14:03.360,0:14:07.130 Häufigkeitsverteilung und die Funktion und[br]ich wir sind jetzt richtig dicke auf jeden 0:14:07.130,0:14:13.170 Fall. Ich hab mir die wirklich komplett[br]nochmal angeschaut. Wo kommt das her? Mir 0:14:13.170,0:14:16.750 ist aufgefallen, dass diese Aktion nicht[br]immer definiert ist, die wird nur so 4.600 0:14:16.750,0:14:20.680 Mal überhaupt angegeben. Wo ich mir[br]dachte, okay, 'ne Interaktion - naja 0:14:20.680,0:14:23.600 vielleicht kann man's nicht immer[br]klassifizieren und dann sind mir zwei 0:14:23.600,0:14:28.290 andere Sachen noch aufgefallen: request[br]und lazy-load. Die zwei Sachen finde ich, 0:14:28.290,0:14:33.320 hören sich nicht wie eine Interaktion an.[br]Und da ich Webentwicklerin halt auch bin, 0:14:33.320,0:14:38.270 war mir so hm okay vielleicht wird da noch[br]etwas anderes in den Daten stecken. Und 0:14:38.270,0:14:41.760 hab mir daraufhin die URLs mal genauer[br]angeschaut, die in den Daten stecken und 0:14:41.760,0:14:44.540 spätestens bei Ajax, was 'ne[br]Webtechnologie ist, sagt mir mh 0:14:44.540,0:14:48.400 Nutzerinteraktion? Schauen wir mal in den[br]Browser. Wie gesagt, ich bin 0:14:48.400,0:14:53.430 Webentwicklerin, und so'n Browser verrät[br]'ne Menge über eine Webseite, wenn Fehler 0:14:53.430,0:14:56.730 drin sind oder was für einen Traffic im[br]Netzwerkverkehr - äh im Netzwerk 0:14:56.730,0:15:00.610 stattfindet. Und das hab ich auch mal für[br]Amazon gemacht und hab mir mal ein Spiel 0:15:00.610,0:15:03.740 einfach ausgesucht und hab geguckt was[br]wird eigentlich so alles geladen, während 0:15:03.740,0:15:08.750 man auf der Seite ist. Und ja, jede[br]Webseite lädt eine Menge Sachen nach. Und 0:15:08.750,0:15:12.660 als es dann irgendwann mal fertig geladen[br]hat, dachte mir okay, und jetzt suche ich 0:15:12.660,0:15:17.360 in dieser Auflistung nach den URLs, die[br]ich nicht zuordnen konnte. Und siehe da, 0:15:17.360,0:15:21.260 es sind wirklich Sachen die einfach[br]nachgeladen werden. So etwas wie ein Prime 0:15:21.260,0:15:24.570 Button oder Bilder und Rezensionen, was[br]für mich jetzt per se keine 0:15:24.570,0:15:29.400 Nutzerinteraktion ist. Aber es landet[br]komplett in dem Clickstream drin. Wenn wir 0:15:29.400,0:15:34.071 also die realen Nutzerinteraktionen suchen[br]von den über 15.000 Einträgen, dann hab 0:15:34.071,0:15:39.450 ich eine Annahme getroffen: Eine[br]Nutzerinteraktion muss die Page Action 0:15:39.450,0:15:42.960 angegeben haben, ansonsten ist es keine.[br]So selektieren wir die erst mal als 0:15:42.960,0:15:46.080 Erstes. Dann möchte ich auch nicht, dass[br]es ein request ist, weil das sieht auch 0:15:46.080,0:15:51.350 aus wie keine Interaktion und es darf auch[br]kein lazy-load sein. Wenn wir diesen 0:15:51.350,0:15:55.340 gesamten Wust nehmen und einfach mal aus[br]den Daten rauswerfen, dann haben wir 75 % 0:15:55.340,0:16:01.450 der Daten einfach mal weggeworfen haben[br]nur noch 3.747 Einträge übrig, die reale 0:16:01.450,0:16:07.080 oder die ich als Annahme als reale[br]Nutzerinteraktion sehe. Ich weiß nicht, 0:16:07.080,0:16:11.120 wie viele von euch auf GitHub unterwegs[br]sind, aber ich liebe den Graph, der so ein 0:16:11.120,0:16:15.240 bisschen die Aktivität zeigt, die man auf[br]GitHub hat. Das Gleiche könnte man auch 0:16:15.240,0:16:19.790 für Amazon machen. Und ich weiß nicht, ob[br]ich darüber so glücklich wäre bei mir. 0:16:19.790,0:16:24.150 Jedenfalls steht jedes Kästchen für eine[br]Interaktion und die extrem dunklen lilanen 0:16:24.150,0:16:29.480 Kästchen zeigen bis zu 180 Interaktionen,[br]die man mal am Tag getätigt hat 0:16:29.480,0:16:34.460 K: Beispielsweise vor Weihnachten.[br]L: Genau - sieht man besonders gut. Aber 0:16:34.460,0:16:38.310 das heißt ja auch noch nicht, dass jede[br]Interaktion wirklich zu einem Kauf 0:16:38.310,0:16:42.060 überleitet. Und ich hab mal versucht[br]herauszufinden, wie Amazon überhaupt 0:16:42.060,0:16:46.010 klassifiziert, ob man etwas kauft. Und ich[br]dachte mir, hey, Page Action, du bist ja 0:16:46.010,0:16:50.460 eine gute Idee anzugucken und Amazon wird[br]doch mit Sicherheit ordentliche, gepflegte 0:16:50.460,0:16:55.160 Daten haben und sowas wie ein "Order" drin[br]stehen haben oder 'nen "Purchase" - nix 0:16:55.160,0:17:00.050 da. Amazon hat aus irgendwelchen Gründen[br]'ne Horde an Einträgen, die man per Hand 0:17:00.050,0:17:05.530 herausfinden muss aus seinem Datensatz.[br]Damit man überhaupt eine Idee davon 0:17:05.530,0:17:10.010 bekommt, welche Interaktionen sind[br]wirklich Käufe und welche nicht. Ich habe 0:17:10.010,0:17:14.250 auch nicht herausgefunden ob's hinter[br]dieser Nummerierung von "PlaceOrder" 0:17:14.250,0:17:18.380 irgendeinen Zusammenhang gibt, wann die[br]auftreten, das ist nicht aus dem Datensatz 0:17:18.380,0:17:24.529 ersichtlich gewesen. Wenn wir also mal die[br]Interaktion mit den Käufen vergleichen - 0:17:24.529,0:17:29.029 leider sind die Kästchen ein bisschen hell[br]- von den 196 Tagen, an denen man 0:17:29.029,0:17:33.330 interagiert hat, hat man am Ende nur an 24[br]Tagen gekauft. Also ist ein viel, viel 0:17:33.330,0:17:37.679 geringerer Teil. Aber man sieht den[br]Dezember - da hat Katha auf jeden Fall 0:17:37.679,0:17:41.259 viermal hintereinander gekauft. Und in[br]ihren Daten habe ich außerdem gesehen, 0:17:41.259,0:17:45.650 dass sie extrem interessiert an Büchern[br]ist und im Dezember einfach mal 32 Bücher 0:17:45.650,0:17:49.722 an 4 Tagen gekauft hat.[br]Lachen 0:17:49.722,0:17:52.990 L: Wir lassen das Thema mit den[br]Interaktionen und Käufen jetzt mal hinter 0:17:52.990,0:17:58.299 uns und begeben uns auf die Orte, in denen[br]Katha war, als sie auf Amazon 0:17:58.299,0:18:03.679 herumgebrowst ist. Als Erstes ist mir[br]aufgefallen, in Berlin ist sie am 0:18:03.679,0:18:08.529 häufigsten im Internet auf Amazon. Okay,[br]vielleicht wohnt sie da. Dann hat man 0:18:08.529,0:18:12.470 irgendwie Brandenburg und Schleswig-[br]Holstein noch ziemlich häufig. Weiß ich 0:18:12.470,0:18:15.980 nicht, was der Bezug dazu ist, und dann[br]weniger häufig aber auch existent 0:18:15.980,0:18:21.070 Nordrhein-Westfalen und Niedersachsen.[br]K: Ja, ich lös mal auf. Ich wohne in 0:18:21.070,0:18:25.810 Berlin, das ist richtig, und um aus Berlin[br]rauszukommen muss man grundsätzlich erstmal 0:18:25.810,0:18:31.350 immer durch Brandenburg durch. In der[br]Zeit, in der ich diesen Versuch gemacht 0:18:31.350,0:18:36.159 habe, bin ich beruflich nach Schleswig-[br]Holstein gependelt. Das heißt man konnte 0:18:36.159,0:18:40.299 in dem Datensatz recht gut sehen, an[br]welchen Tagen ich wo gearbeitet habe. In 0:18:40.299,0:18:43.789 Nordrhein-Westfalen lebt meine Familie und[br]immer wenn ich nach Nordrhein-Westfalen 0:18:43.789,0:18:46.990 gefahren bin, bin ich auch durch[br]Niedersachsen durchgefahren. Was mich so 0:18:46.990,0:18:51.889 ein bisschen überrascht hat war, dass ich[br]an dem Datensatz schon vermuten konnte, 0:18:51.889,0:18:56.450 wann ich meine Eltern besucht habe. Und[br]das war dann doch ein bisschen creepy. 0:18:56.450,0:18:59.470 L: Das ist einfach nur die Spalte, die man[br]anschauen kann, wenn es um die 0:18:59.470,0:19:04.049 Bundesländer geht.[br]K: Ah ja, und genau. Woher weiß Amazon, 0:19:04.049,0:19:08.049 dass in NRW meine Eltern wohnen? Ganz[br]einfach: kurz vor Weihnachten ratet mal wo 0:19:08.049,0:19:11.700 ich meine Pakete hingeschickt hab, ne,[br]weil ich auf den letzten Drücker gekauft 0:19:11.700,0:19:15.090 habe. Und das sind solche kleinen[br]Verbindungen, wo man wirklich sagen kann 0:19:15.090,0:19:18.091 man: naja, wenn ich mehrere Datensätze als[br]Amazon habe, kann ich da total einfach 0:19:18.091,0:19:23.639 auch sehr private Details rausfinden.[br]L: Genau. Als Nächstes habe ich mir im 0:19:23.639,0:19:27.879 Vorfeld die Internet Service Provider mal[br]genauer angeschaut und da ist mir eins 0:19:27.879,0:19:31.519 aufgefallen: einige verraten, wo sie sind.[br]So weiß ich zum Beispiel, dass Katha im 0:19:31.519,0:19:35.229 Freifunk in Hamburg unterwegs war.[br]K: Ja, da bin ich immer umgestiegen, weil 0:19:35.229,0:19:39.190 ich nach Kiel gefahren bin.[br]L: Und dann hab ich da was im Februar 2017 0:19:39.190,0:19:44.350 gesehen, da war sie auf den Bahamas.[br]K: Nicht was ihr denkt, das war Urlaub. 0:19:44.350,0:19:48.790 Lachen[br]L: Und im Juli 2017 war sie in Polen. 0:19:48.790,0:19:53.010 K: Genau, das war ein Familienurlaub.[br]L: Es gibt da noch einen anderen 0:19:53.010,0:19:57.249 Aufenthalt, der mir aufgefallen ist. Und[br]ich vermute, du hast eine Beziehung zu 0:19:57.249,0:20:01.029 Universitäten oder Bibliotheken.[br]K: Ja, ich schreib tatsächlich am liebsten 0:20:01.029,0:20:04.970 in der Bibliothek.[br]L: Viele von euch werden den Verein zur 0:20:04.970,0:20:09.019 Förderung eines Deutschen Forschungsnetzes[br]kennen in Form von eduroam. Das ist die 0:20:09.019,0:20:12.340 Einrichtung, die in Deutschland das[br]Internet in Bildungs- und 0:20:12.340,0:20:16.409 Forschungseinrichtungen, Universitäten[br]oder Bibliotheken zur Verfügung stellt und 0:20:16.409,0:20:20.159 auch das sieht man in den Daten. Was[br]Amazon irgendwie scheinbar beim Internet 0:20:20.159,0:20:25.090 Service Provider macht, ist, sie erlauben[br]nur 50 Zeichen und da ist der Name vom DFN 0:20:25.090,0:20:29.879 definitiv zu lang für. Aber wir gucken mal[br]was du so in 'ner Bibliothek machst, 0:20:29.879,0:20:34.201 während du eigentlich arbeiten solltest.[br]Du rutschst mal kurz aus zu Amazon, so 0:20:34.201,0:20:37.900 wenige Sekunden - das kann mal passieren.[br]Dann kommt das schlechte Gewissen 0:20:37.900,0:20:42.480 wahrscheinlich. Dann hast du so 'ne Käufe[br]von oder so 'ne Aufenthalte von einer 0:20:42.480,0:20:47.549 Minute - bestimmt zielgerichtet irgendwas[br]gesucht und für später weggespeichert. Was 0:20:47.549,0:20:51.230 machst du 15 Minuten lang auf Amazon? Das[br]kann man doch schon fast Prokrastination 0:20:51.230,0:20:53.860 nennen.[br]K: Na, das würde ich jetzt nicht so sagen. 0:20:53.860,0:20:58.700 L: Nee, stimmt, denn wir haben noch was[br]Besseres: Du warst über anderthalb Stunden 0:20:58.700,0:21:02.020 auf der Seite von Amazon.[br]Lachen 0:21:02.020,0:21:07.890 K: Reine Recherche.[br]L: Was auf dieser Page Action, die ich 0:21:07.890,0:21:11.279 erwähnt habe, jetzt so häufig, für die[br]Nutzerinteraktion irgendwie hervorgetreten 0:21:11.279,0:21:16.230 ist, dass Amazon ab einem ganz bestimmten[br]Zeitpunkt versucht hat herauszufinden, ob 0:21:16.230,0:21:20.370 man den Tab gerade in den Vordergrund oder[br]den Hintergrund legt. Da Kathas Datensatz 0:21:20.370,0:21:24.309 jetzt nur ein begrenzter Datensatz ist,[br]kann ich nicht sagen, ob das Zufall ist 0:21:24.309,0:21:28.070 oder ob Amazon versucht, wirklich[br]kontinuierlich die Erkennung zu 0:21:28.070,0:21:31.309 verbessern, damit sie einfach wirklich[br]wissen, wann interagiert man mit der 0:21:31.309,0:21:33.679 Seite, wann legt man etwas in den[br]Hintergrund. 0:21:33.679,0:21:39.190 K: Ja und spannend fand ich in dem[br]Datensatz auch, dass man gar nicht so viel 0:21:39.190,0:21:43.970 technischen Sachverstand auch benötigt, um[br]sich ein grobes Bild davon zu machen, was 0:21:43.970,0:21:48.039 da alles drin schlummert. Ich habe[br]beispielsweise mal in der Spalte V geguckt 0:21:48.039,0:21:53.480 - die Spalte V steht für Referrer und das[br]kann man für Nicht-Techies übersetzen 0:21:53.480,0:21:57.879 ungefähr wie: "Naja woher kommst du[br]denn?". Das heißt, Amazon merkt sich, von 0:21:57.879,0:22:01.789 welcher Seite ich sie ansurfe und in[br]meinem Fall war es so, dass ich mehrere 0:22:01.789,0:22:06.309 Artikel von Spiegel Online dann mit dem[br]kompletten Link in meinem Clickstream 0:22:06.309,0:22:09.350 gefunden habe und das ist deshalb[br]interessant, weil man dann natürlich sagen 0:22:09.350,0:22:12.990 kann, so okay, welche Medien konsumiert[br]dieser jemand eigentlich, oder vielleicht 0:22:12.990,0:22:18.289 auch wofür interessiert er sich inhaltlich[br]außerhalb Amazons sonst noch? Ich habe 0:22:18.289,0:22:24.379 auch einen Link gefunden vom Telepolis von[br]heise online, ein Artikel in dem es um 0:22:24.379,0:22:30.360 CETA geht. CETA ist das Handelsabkommen[br]zwischen Kanada und der EU und das ist ein 0:22:30.360,0:22:33.529 kritischer Beitrag und da kann man sich[br]natürlich auch überlegen, okay, wenn 0:22:33.529,0:22:37.670 Amazon wirklich weiß, von was für[br]politischen Artikeln wir kommen, dann kann 0:22:37.670,0:22:42.000 man daraus natürlich auch Rückschlüsse[br]über das politische Mindset ziehen. In der 0:22:42.000,0:22:46.490 Tat habe ich in der Zeit eine Kampagne[br]gegen CETA in Schleswig-Holstein geleitet 0:22:46.490,0:22:53.499 und deshalb bin ich auch gependelt. Und[br]man kann gar nicht genug betonen, wie groß 0:22:53.499,0:23:01.200 der Unterschied zwischen gekauften Daten,[br]- äh - gekauften Produkten und geklickten 0:23:01.200,0:23:06.379 Produkten ist. Ich habe hier für diesen[br]Vortrag mal alles was ich in der Zeit 0:23:06.379,0:23:10.440 gekauft habe auf meinem Küchentisch[br]drapiert. Wenn ich aber alle Produkte, die 0:23:10.440,0:23:14.950 ich nur angesehen habe, auf ein Foto[br]quetschen wollen würde dann müsste ich 0:23:14.950,0:23:18.380 nicht nur meine komplette Küche[br]leerräumen, sondern wahrscheinlich meine 0:23:18.380,0:23:22.649 ganze Wohnung. Denn das wird sonst nicht[br]reinpassen. Das ist viel, viel mehr. 0:23:22.649,0:23:27.429 L: Was man in den Daten außerdem gesehen[br]hat ist, dass man sagen kann, dass Katha 0:23:27.429,0:23:31.889 auf jeden Fall über 500 Mal nach Begriffen[br]gesucht hat und auch dass sie ungefähr 450 0:23:31.889,0:23:37.480 Mal direkt auf Produkte zugegangen ist.[br]Man kann aber schon sagen, dass es noch 0:23:37.480,0:23:40.950 eine ganze Ecke mehr ist, weil das sind[br]nur die Sachen die offensichtlich waren 0:23:40.950,0:23:43.799 und wenn man nochmal per Hand wieder in[br]diesen Datensatz reinspringt und nach 0:23:43.799,0:23:46.559 Mustern sucht, kann man auch sehen, dass[br]es noch mehr Produkte sind, die man sich 0:23:46.559,0:23:49.820 angeschaut hat.[br]K: Ja, ich hab mich dann natürlich 0:23:49.820,0:23:56.730 gefragt, was sieht eigentlich jemand, der[br]mich persönlich nicht kennt, nur diesen 0:23:56.730,0:24:04.039 Datensatz sieht. Wen sieht er dann? Und[br]finde ich das eigentlich okay? Und ich hab 0:24:04.039,0:24:07.009 mir dann mal so einige Sachen angeschaut, die[br]ich angeklickt habe und mal aus 0:24:07.009,0:24:11.950 unterschiedlichen Brillen betrachtet.[br]Nehmen wir mal das Thema Lebensplanung. 0:24:11.950,0:24:16.870 Stellen wir mal vor jemand fragt sich,[br]naja, wie stellt sich Katharina Nocun ihre 0:24:16.870,0:24:20.140 Zukunft so vor, wie ist ihre[br]Lebensplanung? Und der guckt sich meinen 0:24:20.140,0:24:24.159 Clickstream an - was findet der da? Ich[br]hab mir ein Buch angeschaut, das sich mit 0:24:24.159,0:24:28.629 Pro-Argumenten fürs Kinderkriegen[br]auseinandersetzt. Dann habe ich mir aber 0:24:28.629,0:24:33.200 auch ein Buch angeschaut was ich mit[br]alternativen Partnerschaftsformen und 0:24:33.200,0:24:38.649 Polyamorie auseinandersetzt und natürlich[br]noch ein Buch von einer Aussteigerin, die 0:24:38.649,0:24:45.169 sagt, ich werde der Konsumgesellschaft den[br]Rücken kehren. Und wenn man diese 3 0:24:45.169,0:24:49.179 Produkte und noch ein paar mehr in der[br]Richtung zusammenlegt, wird man denken, so 0:24:49.179,0:24:52.120 okay, das ist zumindest eine[br]außergewöhnliche, originelle bis hin zu 0:24:52.120,0:24:56.240 exotische oder vielleicht auch schwierige[br]Lebensplanung, wenn man das alles unter 0:24:56.240,0:25:02.110 einen Hut bekommen will. Aber wie ist es[br]denn tatsächlich? Das Buch über Kinder 0:25:02.110,0:25:07.390 habe ich mir angeschaut, weil ich auf den[br]Autor aufmerksam geworden bin, weil ich 0:25:07.390,0:25:10.710 den Blog "Spreeblick" sehr schätze und[br]schlichtweg wissen wollte, naja was 0:25:10.710,0:25:15.639 schreibt der Typ denn sonst noch. Bei dem[br]zweiten Buch war es so, dass ich den Autor 0:25:15.639,0:25:18.039 kenne und er hat mich zur Lesung[br]eingeladen - da wollte ich mich vorher 0:25:18.039,0:25:23.029 schlau machen, worum geht denn eigentlich[br]bei der Veranstaltung? Und bei dem dritten 0:25:23.029,0:25:27.159 Buch ist es schlichtweg so, wir sind beim[br]selben Verlag. Ich wollte einfach gucken, 0:25:27.159,0:25:33.279 was hat der Verlag bei dem ich bin, sonst[br]noch in der Sachbuchsparte? Das heißt 0:25:33.279,0:25:40.179 Clickstream oder das Bild, das aus meinem[br]Clickstream generiert wird, und die 0:25:40.179,0:25:45.659 Person, die ich bin, sind womöglich zwei[br]ganz unterschiedliche Dinge. Nehmen wir 0:25:45.659,0:25:49.809 mal das Thema Gesundheit, da wird es noch[br]viel deutlicher. Ich hab mir Schnaps 0:25:49.809,0:25:56.570 angeguckt, dafür gibt's sogar eine eigene[br]Kategorie bei Amazon: Alkohol. Man könnte 0:25:56.570,0:26:02.149 ja jetzt Vermutungen anstellen, warum[br]interessiere ich mich für Schnaps. Naja, 0:26:02.149,0:26:04.760 vielleicht habe ich ja gesundheitliche[br]Probleme und möchte ein bisschen 0:26:04.760,0:26:10.330 Selbstmedikation betreiben. Ich habe mir[br]tatsächlich ein Buch über Arthrose 0:26:10.330,0:26:15.489 angeschaut - ne ziemlich schwere Krankheit[br]- und was noch viel erschreckender ist, 0:26:15.489,0:26:20.529 ich habe mir nicht nur ein, zwei, drei,[br]sondern sehr viele Bücher zum Thema Krebs 0:26:20.529,0:26:27.519 angeschaut. Hier exemplarisch eins mit dem[br]Titel "Krebs natürlich heilen". Und wenn 0:26:27.519,0:26:30.950 man diese - meinen Clickstream - so[br]anschauen würde, würde man ja denken, 0:26:30.950,0:26:37.559 Katharina Nocun ist ein gesundheitliches[br]Wrack. Aber wie sieht es denn wirklich 0:26:37.559,0:26:40.809 aus? Ich muss sagen, dieser Gin ist[br]wirklich gut, ich trinke ihn wirklich 0:26:40.809,0:26:42.889 gerne.[br]Lachen 0:26:42.889,0:26:48.169 K: Die Bücher über schwere Krankheiten[br]habe ich mir aber deshalb angeschaut, weil 0:26:48.169,0:26:52.980 ich eine Recherche betrieben habe. Ich[br]wollte wissen, wie hoch ist der Anteil an 0:26:52.980,0:27:00.350 esoterischen Quatsch-Büchern in der Amazon[br]Bestsellerliste beim Thema Gesundheit. Und 0:27:00.350,0:27:05.230 diese Intention sieht man aber nicht, wenn[br]man nur den Clickstream sieht. Ich habe 0:27:05.230,0:27:08.730 weder Krebs, noch Arthrose, noch[br]irgendwelche Anzeichen dafür. Interessant 0:27:08.730,0:27:14.140 wird es auch bei der politischen[br]Einstellung. In meinem Clickstream finden 0:27:14.140,0:27:18.480 sich unglaublich viele Bücher die sich mit[br]dem Thema AfD auseinandersetzen und zwar 0:27:18.480,0:27:27.299 einmal kontra AfD, aber auch Bücher von[br]rechten, rechtsextremen Autoren und 0:27:27.299,0:27:32.879 Verschwörungstheoretikern. Und wenn man[br]nur meinen Clickstream betrachtet, wird 0:27:32.879,0:27:36.520 man mich glaube ich für eine ziemlich[br]merkwürdige bis unsympathische Person 0:27:36.520,0:27:43.049 halten. Und man wird denken, die ist[br]rechts. Tatsächlich war es natürlich so, 0:27:43.049,0:27:46.169 ich setze mich kritisch mit der AfD in[br]meinem Blog auseinander und habe 0:27:46.169,0:27:49.980 recherchiert und da recherchiert man...[br]Applaus 0:27:49.980,0:27:53.159 L: Ja, die AfD kann wirklich niemand[br]unterstützen, das muss man hier mal echt 0:27:53.159,0:27:57.360 sagen.[br]K: Ja und da wollte ich mir natürlich auch 0:27:57.360,0:28:01.789 ein bisschen angucken, naja, was schreibt[br]denn so die rechte Ecke oder was 0:28:01.789,0:28:06.460 publizieren so ein paar Scharfmacher aus[br]der rechten Ecke und wie hoch ist das 0:28:06.460,0:28:12.269 eigentlich bei den Amazon Bestsellerlisten[br]gerankt. Und wer aber nur meinen Datensatz 0:28:12.269,0:28:15.450 sieht, der sieht das nicht - der wird mich[br]vielleicht für rechtsextrem halten. 0:28:15.450,0:28:22.440 Interessant werden solche Zusammenhänge,[br]wenn man sich überlegt, wer ein Interesse 0:28:22.440,0:28:27.269 an solchen Daten haben könnte. Denn wo[br]Daten sind, entstehen schnell 0:28:27.269,0:28:31.549 Begehrlichkeiten und natürlich gibt es[br]auch Behörden, die durchaus ein Interesse 0:28:31.549,0:28:36.980 daran haben können, solche Nutzerdaten[br]abzufragen und zwar alles was da ist und 0:28:36.980,0:28:42.070 wenn der Clickstream da ist, dann wird er[br]auch abgefragt. Und stellen wir uns mal 0:28:42.070,0:28:46.980 vor, ein Polizeibeamter kommt auf die[br]Idee, die Katha, die ist vielleicht cyber- 0:28:46.980,0:28:51.679 kriminell oder vielleicht ist sie auch ein[br]potenzieller Gefährder oder von ihr geht 0:28:51.679,0:28:56.609 eine drohende Gefahr aus. Und wir wollen[br]jetzt gezielt mal gucken, ob es 0:28:56.609,0:29:05.139 irgendwelche Indizien gibt, die diese[br]These stützt. Was sehen diese Leute? Naja, 0:29:05.139,0:29:13.440 zunächst einmal findet sich auf meiner[br]Liste ein sogenanntes Killerspiel. Es ist 0:29:13.440,0:29:19.029 schon mal extrem sympathisch aus, wenn man[br]aus Behördensicht da mal draufguckt. Dann 0:29:19.029,0:29:24.499 habe ich mir auch noch angeschaut, ein[br]schwarzes T-Shirt mit einem Aufdruck auf 0:29:24.499,0:29:30.419 dem steht "Chemist - only because[br]superwoman is not an official job title". 0:29:30.419,0:29:36.269 Man könnte also denken, ich habe durchaus[br]interessante Skills und Hobbys. Als 0:29:36.269,0:29:44.010 Nächstes ein verdächtig aussehender[br]Gegenstand - ein Kochtopf, und eine 0:29:44.010,0:29:50.800 Sturmmaske. Ja und ich weiß nicht, wie ihr[br]das seht, aber aus Behördensicht wird das 0:29:50.800,0:29:53.700 überhaupt nicht gut für mich aussehen,[br]wenn man schon mal mit der Brille 0:29:53.700,0:29:59.049 draufguckt, naja die könnte was planen,[br]die könnte gefährlich sein. Ich glaube, an 0:29:59.049,0:30:02.489 der Stelle wäre es dann höchste Zeit für[br]einen Hausbesuch. Aber ihr könnt euch 0:30:02.489,0:30:08.830 natürlich denken, es gibt eine total[br]einfache und harmlose Erklärung für jedes 0:30:08.830,0:30:15.519 Produkt. Genau, "könnte ja jeder sagen",[br]kommt hier vorne aus dem Publikum. Das 0:30:15.519,0:30:19.889 wäre dann das Gegenargument und damit habe[br]ich schlechte Karten. Und ich weiß nicht, 0:30:19.889,0:30:25.059 wie es euch geht, aber ich finde so eine[br]Möglichkeit, sich zu überlegen, was allein 0:30:25.059,0:30:29.649 aus so einem Datenabfall an Konsequenzen[br]für mich entstehen könnte im Worst Case 0:30:29.649,0:30:34.489 Szenario, extrem bedrohlich.[br]L: Genau, denn Katha hat mir ihr Vertrauen 0:30:34.489,0:30:38.199 geschenkt, dass ich die Daten anschaue und[br]vertraulich behandele. Wie sieht das aber 0:30:38.199,0:30:44.539 Amazon? Amazon ist groß, ziemlich groß,[br]hat ungefähr 300 Millionen Nutzer und ich 0:30:44.539,0:30:48.340 habe die Analyse für eine Person gemacht.[br]Amazon kann natürlich die Analyse für alle 0:30:48.340,0:30:52.230 Nutzer machen und erkennt darin Muster und[br]weiß am Ende auch, welches Produkt mit 0:30:52.230,0:30:58.749 welchem im Warenkorb landet.[br]K: Ja und was bedeutet im Warenkorb 0:30:58.749,0:31:03.499 landet, ne? Amazon weiß beispielsweise,[br]was kaufen Leute, die auch dieses Produkt 0:31:03.499,0:31:09.679 gekauft haben. Ein einfachstes Beispiel[br]ist ja die Feinwaage, ne. Als Koch möchte 0:31:09.679,0:31:14.090 man vielleicht exakt wissen, wieviel muss[br]hier rein und wieviel hab ich jetzt hier 0:31:14.090,0:31:18.779 rein getan. Und wenn man das aber kaufen[br]will, kriegt man direkt so diese geilen 0:31:18.779,0:31:21.179 Produktvorschläge.[br]Lachen 0:31:21.179,0:31:29.109 K: Durchaus ein Zeichen dafür, dass es[br]auch andere Verwendungszwecke für 0:31:29.109,0:31:36.220 Feinwaagen gibt. Und ihr lacht, aber das[br]kann wirklich ernsthafte Konsequenzen für 0:31:36.220,0:31:39.850 einen Menschen haben, wenn er vielleicht[br]ohne es zu wissen in einer Schublade 0:31:39.850,0:31:43.549 landet, mit der überhaupt nichts am Hut[br]hat. Anderes Beispiel: Wenn ich jetzt nach 0:31:43.549,0:31:49.580 einem Glasschneider bei Amazon suche,[br]kriege ich eine Sturmmaske empfohlen. 0:31:49.580,0:31:55.000 Lachen[br]K: Was man bei Reitequipment empfohlen 0:31:55.000,0:32:00.720 bekommt, kann sich der eine oder andere[br]vielleicht denken. Und das ist ein 0:32:00.720,0:32:04.669 Problem, denn ich weiß nicht, wie es euch[br]geht, aber ich möchte gerne wissen in 0:32:04.669,0:32:08.989 welchen Schubladen ich lande und ich[br]möchte da vielleicht auch mitreden, wenn 0:32:08.989,0:32:12.619 diese Schubladen mir unangenehm sind. Oder[br]vielleicht finde ich auch, dass es gewisse 0:32:12.619,0:32:17.869 Schubladen einfach nicht geben sollte. Und[br]das Problem ist, dass ich bei meiner 0:32:17.869,0:32:22.999 Datenabfrage eben nur diesen winzigen[br]kleinen Mosaikstein aus dem großen 0:32:22.999,0:32:25.721 Datensatz bekommen habe, aber die[br]eigentliche Information über die 0:32:25.721,0:32:30.059 Möglichkeiten der Auswertung für diesen[br]einen Datensatz, die kann ich erst 0:32:30.059,0:32:34.519 vollumfänglich erfassen, wenn ich das[br]Ganze kenne. Das wird aber Amazon nicht 0:32:34.519,0:32:37.789 rausrücken und Amazon wird auch keine[br]Algorithmen zu Suchvorschlägen oder 0:32:37.789,0:32:42.169 sonstwas rausrücken, denn das ist[br]natürlich ein Geschäftsgeheimnis. Ich 0:32:42.169,0:32:46.419 denke aber das sind die eigentlich[br]spannenden Daten, die wir brauchen, um uns 0:32:46.419,0:32:50.040 wirklich ein Bild davon zu machen, wie[br]dieses Unternehmen uns sieht und wie 0:32:50.040,0:32:53.619 dieses Unternehmen uns auch gezielt[br]manipuliert, um uns beispielsweise 0:32:53.619,0:33:05.749 einzureden, dass wir mehr kaufen sollen.[br]Applaus 0:33:05.749,0:33:12.649 K: Und ich weiß nicht, wie ihr das seht,[br]aber der Name "Amazon" ist super passend. 0:33:12.649,0:33:16.999 Also, ich weiß nicht wer auf die Idee gekommen[br]ist damals, aber es ist ein Knüller. Der 0:33:16.999,0:33:23.299 Amazonas ist der größte Strom Südamerikas[br]und er speist sich aus unglaublich vielen 0:33:23.299,0:33:28.129 kleinen Bächen und Flüssen. Und genauso[br]ist es ja mit Amazon, ja? Ich habe in 0:33:28.129,0:33:32.529 meinem Experiment nur einen einzigen[br]Dienst von Amazon genutzt. Ich hätte den 0:33:32.529,0:33:36.620 Versuch aber natürlich auch ganz anders[br]machen können. Was wäre dann gewesen, wenn 0:33:36.620,0:33:43.639 ich beispielsweise während der kompletten[br]Zeit alle Videos, alle Filme nur noch mit 0:33:43.639,0:33:48.669 Amazon Prime gesehen hätte? Was wäre[br]gewesen, wenn ich mich entschieden hätte 0:33:48.669,0:33:53.979 in dieses Experiment Alexa, also Amazon[br]Echo mit reinzufügen und mir dieses Ding 0:33:53.979,0:33:59.440 vielleicht ins Schlafzimmer zu stellen?[br]Ich glaube der Datensatz wäre um einiges 0:33:59.440,0:34:04.149 aufschlussreicher und ich für meinen Teil[br]habe an dieser Stelle ganz bewusst am 0:34:04.149,0:34:08.610 Anfang des Experiments entschieden, nein,[br]das möchte ich nicht. Nein, es geht mir zu 0:34:08.610,0:34:13.290 weit. Ich stelle mir so ein Ding nicht in[br]die Wohnung. 0:34:13.290,0:34:22.250 Applaus[br]K: Und vor ein paar Wochen war ich dann 0:34:22.250,0:34:26.490 sehr froh, dass ich diese Entscheidung so[br]getroffen hatte damals. Denn ich weiß 0:34:26.490,0:34:30.109 nicht ob ihr es mitbekommen habt. Es war[br]groß in den Nachrichten, ein Nutzer hat 0:34:30.109,0:34:35.030 kürzlich bei Amazon seine Daten von Amazon[br]Echo abgefragt und hat daraufhin den 0:34:35.030,0:34:40.039 Datensatz einer vollkommen anderen Person[br]zurückbekommen. Nochmal so als Hinweis, 0:34:40.039,0:34:49.690 dass das Ding echt nicht ins Schlafzimmer[br]gehört. Und ja, nochmal um es deutlich zu 0:34:49.690,0:34:53.609 machen. Wenn jemand wirklich all diese[br]Dienste nutzt oder viele Dienste nutzt, 0:34:53.609,0:34:56.409 dann loggt ihr euch meistens mit derselben[br]Amazon-ID ein. 0:34:56.409,0:35:01.800 L: Genau, das ist ja auch das, was in 'nem[br]Amazon Datensatz gespeichert wurde. Also 0:35:01.800,0:35:04.390 wenn ihr woanders auf einen anderen Dienst[br]geht, dann wird das einfach mitgeloggt, 0:35:04.390,0:35:08.789 egal ob das jetzt auch wegen der gleichen[br]Login-Adresse ist. Ihr habt auf jeden Fall 0:35:08.789,0:35:13.420 auch das im Cookie stehen, welche ID ihr[br]dahinter habt. 0:35:13.420,0:35:16.420 K: Und ihr fragt euch ja jetzt, das ist ja[br]schön und gut dass du deine Daten hast, 0:35:16.420,0:35:21.780 das ist toll für mich, aber was ist mit[br]meinen Daten und wie komme ich an die? Es 0:35:21.780,0:35:24.559 gibt viele Wege um an seine Daten zu[br]kommen. Ich kann euch einfach mal 0:35:24.559,0:35:30.030 erzählen, wie ich das gemacht habe.[br]Zunächst einmal: ich hab mir die AGB 0:35:30.030,0:35:34.560 durchgelesen - tatsächlich vollständig. Es[br]ist ein ganz neues Erlebnis. Ich bin jetzt 0:35:34.560,0:35:41.040 top informiert.[br]Applaus 0:35:41.040,0:35:44.320 K: Und ich habe mir die[br]Datenschutzerklärung durchgelesen. Ja und 0:35:44.320,0:35:49.070 warum habe ich das gemacht? Sowohl in AGB[br]und Datenschutzerklärung sind schon mal so 0:35:49.070,0:35:53.810 grob Datenkategorien angesprochen, und die[br]kann ich mir notieren, damit ich so weiß, was 0:35:53.810,0:35:57.720 kann ich dann erwarten oder was sollte ich[br]erwarten, was bei so einer Auskunft 0:35:57.720,0:36:04.960 rauskommen sollte. Zusätzlich habe ich[br]meinen gesunden Menschenverstand benutzt, 0:36:04.960,0:36:08.420 um mal zu überlegen...[br]Applaus 0:36:08.420,0:36:15.040 K: ...um mal zu überlegen, naja was kann[br]ich denn nach den Gesetzen der Logik 0:36:15.040,0:36:18.980 erwarten. Also beispielsweise, ich bin auf[br]Amazon, eine Woche später kriege ich eine 0:36:18.980,0:36:22.130 E-Mail, "wollen sie dieses Produkt nicht[br]doch kaufen?", also müssen die für eine 0:36:22.130,0:36:26.250 Woche speichern, was ich geklickt hab. Und[br]egal wie oft die sagen, "Nein, haben wir 0:36:26.250,0:36:30.221 nicht". Das ist eine Lüge weil sonst wird[br]es technisch sehr schwierig sein, das 0:36:30.221,0:36:35.300 umzusetzen. Und aus diesen Informationen[br]hab ich dann eine Checkliste gebaut mit 0:36:35.300,0:36:39.170 meiner Erwartungshaltung. Was erwarte ich,[br]was in der vollständigen Antwort drin sein 0:36:39.170,0:36:44.970 sollte, und erst dann habe ich die Anfrage[br]formuliert und gestellt. Und ich kann gar 0:36:44.970,0:36:50.150 nicht oft genug betonen, wie wichtig es[br]ist, bei Anfragen immer 'ne Frist zu 0:36:50.150,0:36:55.330 nennen. Ohne Frist wird sich da niemand[br]bewegen. Zwar gibt es nach der 0:36:55.330,0:36:58.900 Datenschutz-Grundverordnung einen[br]Zeitrahmen, in dem die euch antworten 0:36:58.900,0:37:03.609 sollten, idealerweise innerhalb von einem[br]Monat, aber es schadet nicht, diese Frist 0:37:03.609,0:37:08.119 trotzdem nochmal explizit reinzuschreiben[br]und auch sofort nochmal zu erinnern, wenn 0:37:08.119,0:37:12.599 die Zeit überschritten wird. Und[br]motivierend kann natürlich auch sein, wenn 0:37:12.599,0:37:15.680 man noch reinschreibt, naja wenn ihr nicht[br]antwortet - müsst ihr wissen, aber dann 0:37:15.680,0:37:22.680 wenn ich mich an die Aufsichtsbehörden.[br]Mit der Anfrage ist es leider noch nicht 0:37:22.680,0:37:27.900 getan. Wenn ihr so eine Anfrage stellt,[br]stellt euch auf eine Brieffreundschaft ein 0:37:27.900,0:37:32.839 - ist ja vielleicht auch etwas Schönes,[br]wenn ihr diese Anfrage stellt, werdet ihr 0:37:32.839,0:37:36.869 zuerst mit hoher Wahrscheinlichkeit die[br]Antwort zurückbekommen: "Naja, schauen Sie 0:37:36.869,0:37:40.690 mal in Ihrem Profil nach, da sind all Ihre[br]Daten". Das ist natürlich Quatsch, das ist 0:37:40.690,0:37:45.210 nur ein Bruchteil von den Daten, die ihr[br]eigentlich haben wollt. Also verschicken 0:37:45.210,0:37:51.079 wir einen "friendly reminder". Als[br]nächstes kommt vielleicht ein Brief oder 0:37:51.079,0:37:55.089 eine E-Mail: "Ja, wir haben hier ihre[br]Daten" und dann schaut ihr da rein und 0:37:55.089,0:37:59.910 denkt so, okay, da hat jemand die Profildaten[br]jetzt nochmal in PDF gepackt oder 0:37:59.910,0:38:02.359 ausgedruckt. Hmm.[br]L: Ausgedruckt und wieder eingescannt. 0:38:02.359,0:38:06.869 K: Genau. Auch nicht das, was wir haben[br]wollen - solltet ihr euch gar nicht drauf 0:38:06.869,0:38:13.000 einlassen, damit zufrieden geben. Also[br]wieder "friendly reminder". Dann habt ihr 0:38:13.000,0:38:17.770 das nächste Level erreicht. Dann wird[br]irgendwann die Einsicht kommen so "Huch, 0:38:17.770,0:38:20.666 wir haben ein paar Daten gefunden, wir[br]haben die Ihnen jetzt mal geschickt". Das 0:38:20.666,0:38:28.010 ist so die Stelle mit der CD und an der[br]Stelle wird's eben spannend. Die 0:38:28.010,0:38:31.070 Wahrscheinlichkeit, dass ihr dieses Spiel[br]ein paar Mal wiederholen müsst, ist sehr 0:38:31.070,0:38:35.480 hoch. Und irgendwann, wenn ihr das oft[br]genug wiederholt habt, habt ihr dann euren 0:38:35.480,0:38:40.380 Datensatz. Und diesen Datensatz könnt ihr[br]dann nach Belieben durchsuchen, 0:38:40.380,0:38:44.839 durchforsten, analysieren, und glaubt mir,[br]es lohnt sich. Denn es ist eine Sache, 0:38:44.839,0:38:48.809 abstrakt zu wissen, dass man überwacht[br]wird auf Schritt und Klick, und etwas 0:38:48.809,0:38:53.260 vollkommen anderes, seinen eigenen[br]kaputten Schlafrhythmus der letzten 0:38:53.260,0:38:57.210 anderthalb Jahre vor sich zu sehen.[br]Lachen 0:38:57.210,0:39:01.309 K: Und das ist etwas, das würde ich keinem[br]Einzelhändler anvertrauen wollen. 0:39:01.309,0:39:04.880 Applaus[br]K: Und ich habe mir danach die Frage 0:39:04.880,0:39:08.710 gestellt, möchte ich das? Und jeder, der[br]so einen Datensatz sieht, wird sich diese 0:39:08.710,0:39:13.420 Frage zwangsläufig auch stellen. Und in[br]meinem Fall war es dann so, dass ich mich 0:39:13.420,0:39:18.680 entschieden habe, in Zukunft meine[br]gebrauchten Bücher direkt beim Anbieter zu 0:39:18.680,0:39:22.240 kaufen, nicht mehr über Amazon Marketplace.[br]Das ein oder andere Mal hab ich damit 0:39:22.240,0:39:27.290 sogar Geld gespart.[br]Applaus 0:39:27.290,0:39:32.410 K: Und die Information darüber, was der[br]Dienst speichert, ermöglicht uns ja auch 0:39:32.410,0:39:36.069 vielleicht zu sagen, ich nutze den Dienst[br]in Zukunft anders oder aber ich nutze ihn 0:39:36.069,0:39:39.910 vielleicht gar nicht mehr. Und wenn ihr[br]ihn gar nicht mehr nutzt, dann würde ich 0:39:39.910,0:39:45.240 empfehlen, naja dann könnt ihr auch so ein[br]Löschantrag verschicken. Kostet nix. Ist 0:39:45.240,0:39:51.600 auch vielleicht eine kurze[br]Brieffreundschaft und wir haben uns bei 0:39:51.600,0:39:58.309 diesem Vortrag auch überlegt, dass wir[br]nicht sagen wollen, das ist ein 0:39:58.309,0:40:03.480 individuelles Problem von Nutzerinnen und[br]Nutzern, die Amazon nutzen. Nein, das 0:40:03.480,0:40:07.480 Problem ist, dass Amazon ähnlich agiert[br]wie andere Dienste auch, um mal ehrlich zu 0:40:07.480,0:40:12.650 sein. Überwachung ist längst zur[br]Standardeinstellung geworden. Und was das 0:40:12.650,0:40:16.400 für den Einzelnen bedeutet, das wollten[br]wir sichtbar machen, aber wir finden 0:40:16.400,0:40:21.680 trotzdem, wir müssen alle gemeinsam dafür[br]kämpfen, dass Datenschutz, Privatsphäre, 0:40:21.680,0:40:26.950 Datensparsamkeit verdammt nochmal die[br]Standardeinstellung ist 0:40:26.950,0:40:36.740 großer Applaus[br]K: Ja und damit sind wir auch schon am 0:40:36.740,0:40:41.670 Ende. Mehr Infos und Formulare für eigene[br]Datenanträge, Auskünfte, Löschanträge 0:40:41.670,0:40:46.490 findet ihr bei mir im Blog.[br]L: Und wer sich für die Datenanalyse 0:40:46.490,0:40:50.359 interessiert, da veröffentliche ich gleich[br]auf Ama..., ach auf Amazon... auf 0:40:50.359,0:40:52.359 GitHub...[br]Lachen 0:40:52.359,0:40:56.039 L: ...ein Repository, wo sich jeder auch[br]die Daten anschauen kann und sich selber 0:40:56.039,0:40:59.909 seinen eigenen kaputten Schlafrhythmus mal[br]angucken kann. 0:40:59.909,0:41:02.719 K: Vielen Dank![br]L: Dankeschön! 0:41:02.719,0:41:05.355 Herald: Ja wunderbar! [br]Applaus 0:41:05.355,0:41:08.439 Herald: Einen großen Applaus![br]großer Applaus 0:41:08.439,0:41:10.449 Abspannmusik 0:41:10.449,0:41:14.796 Untertitel erstellt von c3subtitles.de[br]im Jahr 2020. Mach mit und hilf uns! 0:41:14.796,0:41:32.000 Abspannmusik