Meinung

Von Big Data zu Small Data

Das ziellose Sammeln von Daten und das Anlegen riesiger Datenbestände wird immer mehr zur potenziellen Gefahr, macht man sich doch damit nicht nur zum attraktiven Ziel für ransomware, sondern gerät auch ins Visier von Regulatoren, die immer öfter hohe Strafen für Datenlecks verhängen.

Nicolas Zahn
Drucken
Teilen

Lange war das Sammeln von Daten durch Unternehmen auf das absolute Minimum reduziert. Komplexe, unzuverlässige und vor allem teure Speichermedien führten dazu, dass jeder zusätzliche Speicherplatz gut begründet werden und sich wirtschaftlich lohnen musste. Diese Kalkulation hat sich durch technologischen Fortschritt schon lange geändert. Nicht nur wurde Speicherplatz und Rechenleistung immer günstiger und flexibler – Stichwort cloud – sondern die Möglichkeiten, Daten zu erheben, wurden ebenfalls massiv ausgeweitet: von digitalisierten Dokumenten, tragbaren Sensoren, sog. Wearables, hin zu den omnipräsenten Smartphones.

Die Kombination aus mehr Sensoren und günstigem Speicherplatz führte zum Mantra von big data. Verkürzt besagt dieses: sammeln wir erstmal alles Mögliche und machen später daraus was, z.B. spannende Aussagen über die Gewohnheiten unserer Kunden. Das klingt verlockend und führte in der Konsequenz dazu, dass der kleinste Onlineshop mehrseitige Formulare zum Sammeln von Informationen einführte.

Daten schaffen Angriffsfläche

Nun haben wir einen Haufen Organisationen, die auf einem noch grösseren Haufen an angesammelten Daten sitzen, wobei die wenigsten sie erfolgreich nutzen dürften. Unabhängig davon, wie entscheidend die Daten für den Erfolg eines Unternehmens sind und genutzt werden, machen sich die Unternehmen damit angreifbar. Der starke Anstieg von ransomware Angriffen in letzter Zeit verdeutlicht dies. Ein solcher Angriff, bei dem Daten verschlüsselt werden und Lösegeld gefordert wird, stellt Unternehmen vor mehrere Probleme.

Erstens muss die business continuity sichergestellt werden: Wie können unsere Prozesse auch ohne gewisse Daten oder Zugang zu Maschinen funktionieren? Können wir die verschlüsselten Daten innerhalb nützlicher Frist aus Backups wiederherstellen? Zweitens stellt sich auch die Frage nach den Konsequenzen eines Datenverlustes. Daten werden oft nicht nur verschlüsselt, sondern, weil man ja schon Zugriff darauf hat, auch gleich kopiert. Selbst bei «erfolgreichem» Umgang mit einem Angriff drohen also noch negative Folgen, weil erbeutete Daten entweder an interessierte Parteien weiterverkauft werden können oder gleich geleaked werden, was auch entsprechend sanktioniert werden kann, z.B. mittels den Bestimmungen der Datenschutz-Grundverordnung.

Liegt also in weniger Daten die Lösung bzw. zumindest ein gewisser Schutz vor ransomware?

Doch was ist mit künstlicher Intelligenz? Würde der Verzicht auf das Sammeln von Daten eine Organisation nicht von den Vorteilen der Anwendungen Künstlicher Intelligenz (KI) ausschliessen? Das scheint aus mehreren Gründen unwahrscheinlich. Erstens sollten Organisationen im Rahmen einer KI-Strategie auch ihre Datenstrategie erarbeiten und deshalb nur Daten sammeln, die für eine entsprechende KI-Anwendung nötig sind.

Zweitens werden grosse Datensets vor allem für das Training von Modellen verwendet. Hier wäre beispielsweise denkbar, dass mehrere Unternehmen zum Training von Modellen kooperieren könnten, jede einzelne Organisation jedoch nur einen Teil des Datenpools bei sich speichern muss.

Drittens hängt der heutige Datenhunger von KI mit den verwendeten Ansätzen des maschinellen Lernens zusammen. In der Geschichte der KI-Entwicklung hat es aber immer unterschiedliche Ansätze gegeben und es ist deshalb wahrscheinlich, dass in Zukunft auch andere KI-Ansätze verwendet werden, die weniger datenintensiv sind. Vielleicht ist es also an der Zeit, dass Unternehmen umdenken: weg von big data zu small data.

Data hording kommt nicht ohne Kosten und Risiken. Datensparsamkeit im Gegenzug bedeutet nicht, dass man auf die Vorteile von Datenanalysen verzichten muss. Sie verlangt aber vor dem wilden Sammeln eine Antwort auf die Frage: Welche Daten brauchen wir wofür? Diese Fragen sollten Organisationen im Rahmen einer Datenstrategie ohnehin beantworten. Es dürfte dabei jedoch der einen oder anderen Organisation klarwerden, dass nicht alle Daten, die aktuell erhoben und gespeichert werden, wirklich nötig sind.

Nicolas Zahn

Nicolas Zahn arbeitet als Senior Project Managerbei der Swiss Digital Initiative. Zuvor war er für die IT-Beratung Elca und die Credit Suisse tätig. Er ist spezialisiert auf die Schnittstelle zwischen Politik und Technologie und hat sich unter anderem in Singapur und Estland mit der digitalen Transformation des öffentlichen Sektors beschäftigt. Seit seinem Studium der internationalen Beziehungen befasst er sich ausserdem mit geopolitischen und regulatorischen Entwicklungen. Zahn ist Mitglied der Think-Tanks foraus und reatch sowie der Operation Libero.
Nicolas Zahn arbeitet als Senior Project Manager
bei der Swiss Digital Initiative. Zuvor war er für die IT-Beratung Elca und die Credit Suisse tätig. Er ist spezialisiert auf die Schnittstelle zwischen Politik und Technologie und hat sich unter anderem in Singapur und Estland mit der digitalen Transformation des öffentlichen Sektors beschäftigt. Seit seinem Studium der internationalen Beziehungen befasst er sich ausserdem mit geopolitischen und regulatorischen Entwicklungen. Zahn ist Mitglied der Think-Tanks foraus und reatch sowie der Operation Libero.