Eine anonyme Quelle hat der internationalen Presse eine Festplatte mit 260 GB Daten über die geheimen Geschäfte verschiedener Steueroasen zugespielt. Bis zu den aktuellen Berichten zu den Offshore-Leaks dauerte es dann über ein Jahr, denn:
Die Datenmenge ist enorm: etwa 150-mal so groß wie beim bisher größten veröffentlichten Leak, den Botschaftsdepeschen von Wikileaks. Die Depeschen lagen damals außerdem in einem einheitlichem Format vor und konnten darum standardisiert ausgewertet werden. Die Offshore-Festplatte enthält dagegen alle möglichen Formate durcheinander: Firmendatenbanken, E-Mails, Vorlagen in Word, Scans, Briefe als PDF.
Die weiteren Auswertungen zu den 122.000 Briefkastenfirmen mit Verbindungen in 170 Länder werden bestimmt spannend. Was mich allerdings viel mehr interessiert ist die Frage: wo zur Hölle kommen die Daten her? Dabei geht es mir nicht um die Person des edlen Spenders, dem ich ewige Anonymität wünsche – ich wüsste gerne, wo diese Daten gesammelt wurden.
Für Kontoinformationen einzelner Banken oder Handelsregisterauszüge einzelner Steueroasen, kann ich mir eine entsprechende Quelle noch leicht vorstellen. Um an die oben genannten Daten zu kommen, scheidet eine einzelne menschliche Quelle allerdings aus.
Auch als kollektive Leistung kann ich mir das nicht vorstellen: Wer hätte diese Menge an Daten koordiniert sammeln sollen? Eine Plattform wie WikiLeaks hätte die Daten sicherlich medienwirksam selbst (mit-)veröffentlicht und für mögliche Whistleblower auch hinreichend bekannt sein müssen. Und auch wenn sich jemand aktiv um die Befreiung der Daten bemüht hätte, wäre es ja nicht mit einer kleinen Truppe und ein paar Hacks getan gewesen.
Ganz oben angesetzt, weiß ich auch nicht, wie ich das mit einem Geheimdienst erklären sollte. Ich kann mir noch vorstellen, dass die zwei Millionen E-Mails mittels automatisierter Kommunikationsüberwachung abgefischt wurden (Stichwort: Echelon) und mit ihnen alle Scans und Word-Dokumente. Aber Firmendatenbanken? Um Rohdaten kann es sich also nicht handeln und das Echelon-Bodenpersonal scheidet aus. Wenn die Daten aber bereits verarbeitet und mit anderen Quellen verbunden worden sind, wird auch der Kreis derer enger, die Zugriff auf diese Daten haben – und damit das Risiko der Enttarnung größer. Irgendwie erscheint mir das unwahrscheinlich. Und warum hat der Informant die aus den Daten gewonnenen Informationen nicht auch noch mit auf die Platte gepackt und den Journalisten ein Jahr aufwendiger Forensik erspart?
Also: Woher kommen die Daten? Oder drehe ich hier grade frei und die Erklärung ist ganz einfach?
Update: Auch Wolfgang Michal vom Standard will erst ein paar Routinefragen geklärt wissen.