Big Data - nur Gewinner?
Was Big Data wirklich bringt
Big Data ist einer der dominierenden Trends in der IT, der auch das Motto der CeBiT 2014 prägte und in den letzten Jahren zu einem regelrechten Hype geworden ist. Doch so viele Daten heutzutage auch zur Verfügung stehen, die Fähigkeit und das Know-how, mit diesen Daten umzugehen, sind dünn gesät.
Big data is like teenage sex: everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it… (Dan Ariely)
Viel besser als Dan Ariely kann man es vermutlich nicht ausdrücken.
Schon bei der Beantwortung der Frage, was Big Data jetzt eigentlich ist, stößt man auf die ersten Probleme. Eine genaue Definition gibt es nicht, obwohl Kriterien (s. V-Kriterien) diesen schwammigen Begriff etwas einzugrenzen versuchen. Weitgehende Einigkeit besteht zumindest darüber, dass es um Technologie (Hard- wie Software) und Verfahren geht, die es ermöglichen, Erkenntnisse aus großen Datenmengen zu gewinnen. "Groß" ist in diesem Kontext relativ. Mittlerweile können Datenmengen mit einem herkömmlichen Computer und Standardsoftware verarbeitet werden, die vor einiger Zeit nur mit Supercomputern zu bewältigen waren. Dementsprechend entwickelt sich die Menge an Daten, die man als Big Data bezeichnen kann, exponentiell. Zur Veranschaulichung: das Datenvolumen verdoppelt sich laut einer Studie von IDC mittlerweile circa alle 2 Jahre. Willkommen im Petabyte Age.
Big Data kennt nur Gewinner
Im Big Data-Universum tummeln sich viele Gewinner: Hardwarehersteller verkaufen teure Tera- und Petabyte große Speichersysteme sowie Workstations/Server mit riesigem Arbeitsspeicher und vielen Kernen oder gleich ganze Cluster. Cloud-Anbieter, wie Amazon (AWS), Microsoft (Azure) oder Google bieten On Demand-Lösungen als Alternative zu teurer eigener Hardware an. Softwarehersteller wie Oracle, SAP, IBM oder SAS haben spezielle Datenbanken oder Analyse-Software für große Datenmengen entwickelt. Darüber hinaus hat sich ein ganzes Ökosystem an Open Source-Anwendungen (Hadoop, Spark, …) etc. gebildet. Und selbst auf dem Arbeitsmarkt hat Big Data ganz eigene Berufsbilder hervorgebracht: Branchengrößen wie Google beschäftigen ganze Teams an Machine Learning-Experten, während Googles Chef Ökonom Hal Varian den Statistiker kurzerhand zum Job der nächsten Dekade erklärt:
I keep saying the sexy job in the next ten years will be statisticians. And I’m not kidding. (Hal Varian)
Der nicht nur in Deutschland etwas angestaubte Berufsbegriff wurde mittlerweile hin zum Data Scientist modernisiert, unter dem man sich eine Mischung aus IT-Spezialist, Statistiker und Forscher mit ausgeprägten kommunikativen Fertigkeiten vorstellen kann. Das Berufsbild stellt die Antwort des Arbeitsmarkts auf die Herausforderungen von Big Data dar, wobei die drei Kompetenzbereiche selten von einer Person abgedeckt werden. Dementsprechend groß ist momentan die Nachfrage nach Data Scientists. Für größere Unternehmen gehört es darüber hinaus zum guten Ton, an der Big Data Parade mit dem Kauf von Hardware, Software, der Nutzung von Cloud-Lösungen und der Einrichtung von Business Analytics-Abteilungen teilzunehmen. Ein Geschäft, das die Kassen klingeln lässt.