CDS Blog

Image Credit: Ryoji.Ikeda

In diesem Blog wollen wir gemeinsam das Seminar und die Semesterprojekte der Studierenden dokumentieren. Viele werden jetzt fragen, aber warum mit Google Sites, warum gerade mit Hilfe von blogspot? Warum begeben wir uns gerade in die Mitte der von uns durchwegs kritisch zu betrachtenden Infrastrukturen? Dafür gibt es einige Gründe, viele davon sind rein pragmatisch, wie einfache Verfügbarkeit, unkomplizierte Verteilung und die schnellste Art und Weise über Google gefunden zu werden. Politischer Hauptgrund ist sicherlich mit dem kritischen Blick direkt in die Gefüge, denen wir uns täglich aussetzen, hineinzugehen, zu reflektieren, wo wir hiermit am knowledge-graph und in der Werbewirtschaft mitwirken, sich gerade nicht zurückzuziehen in vermeintlich abgeschottete Systeme, die die wenigsten von uns handhaben können. Dabei aber auch nachzudenken, was es denn brauchen würde, um von den großen Akteuren, den Datenhändlern und Überwachungsmärkten, unabhängig zu agieren, und was uns das bringen würde......

Tracking the trackers - Course Spring/Summer 2018




Im Sommersemester 2018 haben sich alle Studierenden in diesem Seminar dem Thema Tracker im World Wide Web und auf mobilen Plattformen gewidmet. Eine Auswahl der Semesterprojekte findet sich hier

1. Oktober 2018

Mein Name ist Karim - Was passiert mit den personenbezogenen Daten von Flüchtlingen?

Sarah El Sheimy und Valentin Bootz spüren den Datenreisen von Flüchtlichen und Asylsuchenden in Deutschland nach. WEITER

16. Dezember 2017

Wie fake können Partei News sein?

Sarah Elser fragt sich wie vertrauenswürdig und nachvollziehbar Informationen sind, die wir von Parteien im Zuge des Wahlkampfes zur Wahlwerbung erhalten? WEITER

16 Dezember 2017

Insektensterben? Realität vs. Medien

In seinem Blogpost und seinem Semesterprojekt beschäftigt sich ein Student, der hier lieber anonym bleiben möchte, mit der Debatte rund um das Insektensterben. Wie kam es zu der Aussage, dass ein Rückgang bis 80% zu beklagen sei? WEITER

16. Dezember 2017

Data Stories: Der Hack von Equifax und Sony Pictures

George Bellamy und Martin Schumann betrachten in diesen Blogpost Datenlecks und Hacking an den Beispielen Equifax und Sony. Sie erarbeiten hierbei den möglichen Ablauf, sowie umreissen die Auswirkungen rund um die Ereignisse. WEITER

14 Dezember 2017

Daten von Heute für das Wetter von Morgen

Johann Sergl interessiert sich für Klimamodelle und Temperaturmessung und erläutert in seinem Blogpost wie der Deutsche Wetterdienst Temperaturdaten generiert. WEITER

16.12.2017

Fieldguide to Fake News

Dieser kürzlich erschienene, wunderbare Leitfaden zur Erforschung von Fake News und trolligen Verhaltensweisen im Netz eignet sich vorzüglich als Lernmaterial. Critical data scientists werden ausführlich angeleitet, wie man online Phänomene dieser Art empirisch untersuchen und verstehen kann.

Es geht darin aber beiweitem nicht nur um die Identifikation von Falschmeldungen oder Social Bots, es geht darum "media literacy" und soziales Engagement im Hinblick auf die Gestaltung von Öffentlichkeiten zu fördern. Fake News werden hierbei nicht einfach nur als eine spezifische (unerwünschte) Art von Inhalten behandelt, sondern sie werden als Ausprägung einer spezifischen Art des Informationsflusses und der Kommunikation verstanden, Inhalte immer in Bezug zu ihrer Vermittlung, der genutzen Infrastrukturen, der Kommunikationskulturen gesetzt.

Das Glossar enthält wertvolle kurze Beschreibungen und Links zu verschiedenen Tools die im Fieldguide verwendet werden. Der gesamte Fieldguide eignet sich wunderbar als Trainingsvorlage, da die Methoden ausführlich und sogar im Workflow beschrieben werden. Es wird erläutert, was die Methoden leisten und was sie nicht leisten können.

https://fakenews.publicdatalab.org/

Datenreisen

Für unser Seminar zentral ist das Verständnis von Daten als hochveränderliches und fragiles Gut. Daten sind nicht als etwas "Gegebenes" zu verstehen. Im Gegenteil bereits bei ihrer Genese schwingen immer schon Entscheidungen mit, welche oftmals nur mehr schwer zu rekonstruieren sind.

Wir arbeiten mit dem Begriff der "data journey", Datenreise, wie von Bates et al (2016) hier beschrieben. Damit lenken wir den Blick auf das "social life of data", während Daten generiert werden, sie sich durch Raum und Zeit bewegen, und in unterschiedlichsten Praktiken ihre Reise durch die Informationsproduktion (Braman 2006) antreten. Wir versuchen den ersten Entscheidungen rund um die Datengenese bis zu ihrer Wiederverwendung in unterschiedlichsten Kontexten zu folgen. Wir "entpacken" Daten (Bier und Burrows 2013, Ruppert et al. 2012) und zeigen sie als ständig "Gemachte" oder "Geschaffene" ganz im Gegensatz zu den oftmals fahrlässig reduktionistischen und technozentristischen Ansätzen, welche Daten unhinterfragt wahrnehmen, sie gar als Basis eines neuen Denkstils nimmt, welcher Big Data als Lösung aller Probleme prognostiziert.

21 Oktober 2017 KM

Image taken from

The Secret Life of a Weather Datum

Datenwirtschaft 2

Wir bauen uns unsere eigene Dystopie mit Hilfe sogenannter Künstlicher Intelligenz. Die Maschinen sind jedoch nicht die eigentliche Bedrohung, noch lange nicht. Sondern die Gefahren gehen von den Menschen aus die KI benutzen und um "systems of systems" immer weiter so zu optimieren, dass mehr Werbung angeklickt wird, oder menschliches Verhalten beeinflußt und kontrolliert werden kann. Die Algorithmen sind noch dumm, und die Daten nur fragmentarisch, und doch: alle verwenden sie und wir sind Teil davon. Die Soziologin Zeynep Tufekci überlegt in ihrem TED Talk, welche Optionen uns in dieser Situation bleiben....

30 Oktober 2017 KM

Datenwirtschaft 1

Der Schwerpunkt unseres Seminars liegt klar auf Sozialen Daten. Dabei handelt es sich nicht nur um Daten, die wir auf und zwischen den diversen Social Media Plattformen hinterlassen, nicht einmal nur um rein Personen bezogene Daten, sondern jegliche Verdatung des sozialen Lebens (z.b. auch Verkehr, Umwelt, ...). Ein sehr wichtiger Bereich - und die "Goldgrube" der Datenindustrie - ist hierbei das systematische und globale Tracking von UserInnen und KonsumentInnen.

Zu diesem Thema kann ich die folgende Studie sehr empfehlen: „Kommerzielle digitale Überwachung im Alltag“„ von Wolfie Christl, 2014 im Auftrag für die Österreichische Arbeiterkammer erstellt. Hier wird sehr einleuchtend erklärt, was sich aus unseren digitalen Verhaltensweisen berechnen läßt. Und wie sich diese Berechnungen und Daten dann auf diversen Datenmärkten immer wieder neu verknüpfen lassen. Die Studie beinhaltet auch einige Vorschlägt, was passieren muss, damit die Privatsphäre und sensible Informationen auch geschützt werden können. Die Studie wurde im deutschen Sprachraum breit diskutiert und im Europäischen Parlament präsentiert.

Christl lebt in Wien und beschäftigt sich seit 15 Jahren mit den gesellschaftlichen Implikationen von Informations- und Kommunikationstechnologie, insbesondere mit der Ökonomie persönlicher Daten im digitalen Zeitalter. Er war Co-Schöpfer von Data Dealer, einem spannenden Spiel, das sich mit viel Witz und Ironie dem hochbrisanten Thema der persönlichen Daten im digitalen Zeitalter widmet.

20 Oktober 2017 KM

Calling Bullshit

"The world is awash in bullshit. Politicians are unconstrained by facts. Science is conducted by press release. Higher education rewards bullshit over analytic thought. Startup culture elevates bullshit to high art. Advertisers wink conspiratorially and invite us to join them in seeing through all the bullshit — and take advantage of our lowered guard to bombard us with bullshit of the second order. The majority of administrative activity, whether in private business or the public sphere, seems to be little more than a sophisticated exercise in the combinatorial reassembly of bullshit. We're sick of it. It's time to do something, and as educators, one constructive thing we know how to do is to teach people. So, the aim of this course is to help students navigate the bullshit-rich modern environment by identifying bullshit, seeing through it, and combating it with effective analysis and argument."

So leiten Carl T. Bergstrom and Jevin West ihren Kurs zu Statistik und Data Science ein..... http://callingbullshit.org/

15 Oktober 2017 KM

BIAS - oder die Utopie einer fehlerfreien Wissenschaft

Das altgriechische Wort, von dem "bias" abgeleitet ist, bezeichnet eine schräge Linie, in Abweichung von der Horizontalen. Der Englische Begriff bias ist nicht so einfach ins Deutsche zu übersetzen, der er hat viele Konnotationen: Tendenz, Vorurteil, Einseitigkeit, Verzerrung, Neigung, Schlagseite, systematische Messabweichung, .... In der Wissenschaft ist sein Gebrauch durchaus negativ. Objektivität sollte die systematische Bevorzugung oder Verzerrung gewisser Ergebnisse, Messungen oder Beobachtungen ausschließen. Jedoch ist bias oftmals bereits in die Mess- oder Analysemethoden eingebaut und bleibt unbemerkt. Dies ist überall, ganz besonders jedoch für Methoden der Vorhersage - prediction - fatal.

Die Big Data Utopie lautet wie folgt: Wenn wir alles über alle Entitäten in unseren Daten wissen könnten und auch alle diese Informationen speichern könnten, dann gäbe es keine Verzerrung mehr. Doch was bedeutet "alle", wie definiert man die Grundgesamtheit und bildet diese ab? Wir arbeiten heute auch in Zeiten von Big Data fast nur mit Stichproben oder Teildatensätzen. Dh. wir brauchen Statistik und andere Schätzverfahren um Aussagen treffen zu können. Weiters sind wir selten in der Lage alle Bedingungen unserer Verfahren vollständig kontrollieren zu können, ganz besonders dann, wenn wir mit Daten arbeiten, die andere erhoben haben, die vielleicht gar zu einem anderen Zweck gesammelt wurden.

12 September 2017