Heutige Gesellschaften werden zunehmend im Spiegel von Zahlen beschrieben: Einkommens- und Arbeitlosenstatistiken, Unfall- und Kriminalitätsstatistiken, Geburten- und Sterberaten, Schulabschlüsse und Hochschulrankings… Die Liste kann ins schier Unermessliche weitergeführt werden. In ihrem Alltag kommen die Menschen meist über die Nachrichten in Fernsehen und Zeitung mit solchen Zahlenreihen in Kontakt, sie gelten als Grundeinheit um gesellschafltichen Wandel anzuzeigen und sind die Basis für politische Entscheidungen.

Open Data Kataloge

Seit Anfang dieses Jahrtausends werden diese Daten in vielen Ländern dieser Welt einer breiten Öffentlichkeit nicht allein präsentiert, sondern über juristische Regelungen wie dem “freedom of information act” in den USA (2000) oder der Verabschiedung des “Informationsfreiheitsgesetzes” in der BRD (2005) der Zugang ermöglicht. Diese so genannten offenen Daten liegen mittlerweile aus zahlreichen Regionen der Welt vor. Die Qualität der Datensätze unterschiedet sich dabei jedoch zum Teil erheblich (siehe hierzu einen Index der WWW Foundation). Oft werden nicht einmal die grundlegenden, definitorischen Kriterien (offene Lizenzen, offene Datenformate, diskriminierungsfreier Zugang, proaktive Bereitstellung) offener Datensätze eingehalten.

Diesen Herausforderungen zu begegenen hat sich die Open Knowledge Foundation zum Ziel gesetzt, ein gemeinnütziger Verein der sich 2004 in Cambridge gründete und von dem es weltweit Dependancen in mehr oder weniger instiutionalisierter Form gibt. Doch nicht nur die Offenlegung ( Bsp.: fragdenstaat.de) und Vereinheitlichung staatlicher Datem sondern auch die aufklärerische Arbeit im Umgang mit offenen Datensätzen ist das erklärte Ziel der Open Knowledge Foundation. Aus ihrer Selbstbeschreibung geht hervor:

„We believe that a vibrant open knowledge commons will empower citizens and enable fair and sustainable societies.“

Annäherung an einen Datensatz

Diesem Credo haben auch wir uns für eine Sitzung in unserem Seminar im Sommersemester 2013 verschrieben. Wir wollten quasi am eigenen Leib erfahren was es heißt mit staatlichen Daten umzugehen. Unsere Recherche führte uns zu einigen Datenportalen (eurostat, govdata.de, Weltbank, daten-berlin.de) die uns mit Daten unterschiedlichster Couleur versorgten. Hauptkriterien für die Auswahl eines für uns geegneiten Datensatzes war eine relativ leichte Handhabung und die Hoffnung, dass sich in ihm, wenn man die Daten in eine neue visuelle Form überführt, neue Muster erkennen lassen.
Auf Grund der leichten Handhabung entschieden wir uns, uns auf Daten aus Berlin zu beschränken. Das Land Berlin stellt seine Wirtschafts-, Verkehrs- und Verwaltungsdaten seit September 2011 kostenlos zur Verfügung. Doch leider war auch hier die Auswahl noch sehr diffus: Datensätze die uns interessierten, waren zum Teil schlecht formatiert und damit schwer auszuwerten (bspw. Denkmäler in Berlin) und zu bearbeiten. Oder aber für uns interessante Daten waren nicht für alle Bezirke erhältlich (bspw. sind die Daten der Jugend- und Freizeiteinrichtungen bisher nur für den Bezirk Lichtenberg vorhanden). Bei unserer Suche nach einem geeigneten Datensatz verließen wir deshalb wieder den Pfad des Berliner Datenportals und schauten nach anderen Verwaltungsdaten. Dabei stießen wir auf die Berliner Kriminialitätsstatistiken, die jährlich von der Senatsverwaltung für Inneres und Sport herausgegeben wird. Genauer gesagt interessierten uns die Berichte zur politisch motivierten Kriminaliät (PMK) in Berlin.

eigener Datensatz: PMK-Berichte Berlin

Bei den PMK-Berichten handelt es sich um eine jährliche Lagedarstellung der Kriminalität aus dem jeweiligen politischen Spektrum, welche u.a. Aussagen über die Fallzahlen im jeweiligen Jahr und über die Jahre hinweg trifft. Die PMK-Berichte werden seit 2004 jährlich als pdf-Dokument herausgegeben, umfassen in der Regel zwischen 20 und 80 Seiten Text und Tabellen und enthalten auch Daten, die eine Vergleichbarkeit unter den Bezirken erlaubt.

Für die Analyse haben wir uns die Berichte ganz auf die klassische Art durchgelesen und die Daten auf interessante Muster hin untersucht. Darüberhinaus haben wir aber auch die im Bericht enthaltenen Daten zur PMK aufgeschlüsselt nach Berliner Bezirken auf eine interaktive Karte mittels JavaScript übertragen. Dies, wie gesagt, in der Hoffnung, dass sich Muster und Fragen ergeben, die in Tabellenform nicht auf den ersten oder zweiten Blick erkennbar sind. Eine ausführliche Anleitung wie wir das gemacht haben, damit man sich selbst an dieser Übung mit den selben oder ähnlich strukturierten Daten versuchen kann, findet man unter folgendem Link.

Tutorial: Visualisierung eines Datensatzes

Wenden wir uns zunächst der klassischen Betrachtung der Berichte zu und üben uns ein wenig im Hinterfragen der dargestellten Sachverhalte (Die Analyse bezieht sich dabei auf die Darstellung politisch-motivierter Kriminalität von links und von rechts. Die im Bericht enthaltenen Daten zur politisch-motivierten Ausländerkriminalität lassen wir an dieser Stelle außer Acht obwohl es dazu sicher auch einiges zu sagen gäbe)

Die PMK-Berichte auf den ersten Blick

Zunächst einmal fällt auf, dass die Einteilung zu einem politischen Spektrum nicht genauer definiert und allenfalls mit einigen Schlagworten angedeutet wird. So werden zur Kriminialität von rechts beispielsweise alle Delikte gezählt die Bezüge zum völkischen Nationalismus, Rassismus, Sozialdarwinismus oder Nationalsozialismus aufweisen. Zur Kriminalität von links werden Fälle gezählt die auf ein linkes Weltbild schließen lassen (Anarchismus, Kommunismus, Marxismus). Es gibt sogar Berichte (2005, 2006, 2007, 2008) in denen nicht einmal eine genaue Definition der Kriminalfälle vorkommt . Wie genau also diese Bezüge hergestellt werden und wo die Grenzziehung zwischen “politisch motiverter Tat” und “nicht politisch motivierter Tat” besteht bzw. wann eine Straftat in die Residualkategorie “sonstige” fällt, wird aus den Berichten allein nicht ersichtlich. In einem Blog von Hajo Funke, Professor am Touro College Berlin, wird auf genau diese Problematik Bezug genommen (http://hajofunke.wordpress.com/2012/08/01/berlin-zur-lagedarstellung-der-politisch-motivierten-kriminalitat-in-berlin-2011-kleine-anfrage/ ). Er stellte im August 2012 eine “kleine Anfrage” an die Senatsverwaltung für Inneres und Sport, woraufhin diese in ihrer Stellungnahme auf den „Themenfeldkatalog PMK“, das “allgemeine Definitionssystem PMK” bzw. eine “Gesamteinschätzung” (am Tatort vorgefundene Symbole und Schriftzüge, Hautfarbe der Opfer…) verweist. Wenn wir die Darstellung richtig verstehen, gibt es somit keine fundierten Kriterien für die Einteilung einer Straftat in das jeweilige politische Spektrum. Desweiteren erkennt man in der Betrachtung der Berichte über die Jahre hinweg eine stetige Veränderung in Bezug auf die Art und die Anzahl der Tatbestände welche dem linken oder rechten Spektrum zugeordnet werden. So wird in den anfänglichen Berichten aus den Jahren 2004 und 2005 eine genaue Aufschlüsselung der einzelnen Tatbestände geboten. In den folgenden Jahren changieren die einzelnen Tatbestände jedoch. D.h. zum Beispiel, dass zu der Gewaltkriminalität aus dem linken Spektrum Tatbestände wie Verkehrsgefährdung und Raub hinzu kommen. Die von beiden Seiten des politischen Spektrums geteilten Tatbestände sind Brandstifung, Körperverletzung, Landfriedensbruch, Tötungsdelikte, Widerstandsdelikte. Insofern ist eine methodologisch saubere Vergleichbarket zwischen linker und rechter Kriminalität (Querschnitt) als auch ein Vergleich linker oder rechter Kriminilatiät über die Jahre hinweg (Längsschnitt) nicht möglich.

Schaut man in der klassischen Art und Weise über die Berichte so tauchten bei uns, wie eben dargestellt eher, Fragen in Bezug auf definitorische oder methodologische Probleme auf. Doch was ist mit den Daten in den Berichten? Denn diese sind ja Dreh- und Angelpunkt zu Einschätzung der Lage und dienen als Grundlage um politische Entscheidungen zu rechtfertigen.

Die PMK-Daten auf den zweiten Blick

Schaut man sich die Zahlen in den Berichten an, so lassen sich grob einige Trends erkennen. Doch das durchsuchen der einzelnen Dokumente und Tabellen nach Mustern ist mühevoll und langwierg. Für eine Vereinfachung der Untersuchung wählten wir daher beispielhaft die Daten aller Jahre (2006-2012) der politisch motivierten Kriminalität, aufgeschlüsselt nach Bezirken und visualisierten deren Trends auf einer interaktiven Berlinkarte (hier noch einmal der Hinweis auf unser Tutorial).

politisch motivierte Straftaten in Berlin

Mit dem Regler der sich über der Karte befindet, kann man sich durch die Daten der vergangenen Jahre bewegen. Gleich auf den ersten Blick fällt einem auf, dass es keine Daten aus den Jahren 2004 und 2005 gibt. Für uns stellte sich hier die Frage warum dies so ist und machte uns noch einmal deutlich, dass die Verfügbarkeit von diesen Daten keine Selbstverständlichkeit ist, sondern eine Frage der politischen Entscheidung. Wandert man mit Hilfe des Reglers weiter durch die Jahre, so kann man intuitiv sehen welche Veränderung die Häufigekeit der politisch motivierten Kriminalität über die Jahre erfahren hat. Ob die Veränderung mit den oben genannten Hinzukommen bestimmer Tatbestände zusammenhängt oder ob sich diese Entwicklungen eher durch realpolitische Entwicklungen (Stichwort: Wirtschaftskrise, Gentrifizierung, Nato-Gipfel, Nazi-Demos etc.) begründen lassen, müsste durch einen weiteren Schritt der Analyse und Recherche geklärt werden. Zum Beispiel wäre es hilfreich, wenn man die Daten genauer aufschlüsselt, um zu überprüfen welche Tatbestände zu einem Anstieg bspw. der politisch motivierten Kriminalität von links im Jahre 2009 führte. Dies ist möglich, wenn man sich die Erläuterungen in den Berichten durch liest, in denen die entsprechenden Zahlen genannt werden. Es wäre aber wesentlich einfacher, wenn auch diese Zahlen, zumindest tabellarisch, für die jeweiligen Bezirke aufgeführt wären. Eine andere, zugegeben “quick and dirty”- Variante um die Daten zu befragen, kann man über das “google trend”-Tool ausprobieren. Dieses stellt in Form eines Graphen dar, wie oft Begriffe in der Suchmaschine über die Zeit hin angefragt worden sind und gibt damit ein relativ “genaues” Bild von der Präsenz bestimmter Themen in der Gesellschaft. In unserem Fall wäre es zum Beispiel interessant zu schauen, wie sich der Begriff der Gentrifizierung oder der Euro-Krise entwickelt hat. Und siehe da! Diese Begriffe haben eine zeitliche Überschneidung mit dem Anstieg politisch motivierter Kriminalität von links… Jedoch muss man sich hier wieder einen Grundsatz der Statistik ins Gedächtnis rufen: Korrelation ist keine Kausalität. Die zeitliche Überschneidung dieser Themen mit den Tatbeständen ist für uns, in diesem Moment, nur eine Vermutung und müsste weiter verifiziert werden-

Daten-Alphabetisierung für eine transparente Politik

Wie man aus unseren Erläuterungen schön erkennen kann, schließen sich eher weitere Fragen an die Datensätze aus den PMK-Berichten an, als dass sie Antworten geben. Doch indem man sich sich kritisch den Daten nähert, Fragen stellt und damit ein tiefer gehendes Verständnis von der Sachlage bekommt, findet, ganz selbstbestimmt, etwas statt was wir frei übersetzt Daten-Alphatbetisierung (engl.: data literacy) nennen. In einer Gesellschaft die mehr und mehr mit Hilfe von Zahlen regiert wird, ist die Kenntnis von und der Umgang mit Datensätzen eine wichtige Vorraussetzung um als mündiger Bürger an politischen Prozessen teil zu haben. Ein transparenter Staat und und offene, gut bearbeitbare Datensätze sind eine weitere Voraussetzung. Wir hoffen, dass wir mit unserem Blogartikel einen kleinen Beitrag zur Daten-Alphabetisierung leisten konnten und freuen uns über Anregungen und Kritik.

(mgoer)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

CAPTCHA-Bild

*