«Data Science» Datenwissenschaft, was sie ist und wofür Unternehmen sie brauchen

Obwohl der Begriff Data Science in den letzten Jahren im Internet förmlich explodiert ist, hat der Mensch in Wahrheit schon immer Daten genutzt. Henry Ford zum Beispiel beschreibt in seinem Buch «Mein Leben, meine Erfolge», wie sein Unternehmen jeden seiner Arbeitsgänge zeitlich festlegte, woraufhin die Ingenieure nach Möglichkeiten zur Optimierung der Produktion suchten. So entstand das billige Auto.

Arthur Hailey erzählt in seinem Buch «Overload» auch, dass die Computer eines Stromerzeugers alle Rechnungen seiner Kunden analysieren und eine Liste möglicher Gauner erstellen, die Strom stehlen. Im Grunde ist das alles Data Science.

Was also ist Data Science?

Es handelt sich um ein interdisziplinäres Forschungsgebiet, das Daten, Algorithmen und Technologien umfasst, mit denen aus strukturierten oder unstrukturierten Daten Werte gewonnen und analytisch komplexe Probleme gelöst werden können.

Aus der riesigen Menge an Rohdaten, die Unternehmen zur Verfügung stehen, isolieren Data Science-Experten die Informationen, die für die Geschäftsentwicklung, für neue strategische Entscheidungen, für die Entwicklung neuer Produkte und für die Optimierung verschiedener interner Prozesse nützlich sein können. Obwohl dieses Fachgebiet im Wesentlichen interdisziplinär ist, basiert es auf Statistik und Mathematik. Mit ihrer Hilfe können Analysemodelle zur Vorhersage der Zukunft erstellt werden, wodurch sich die Datenwissenschaft von anderen Methoden unterscheidet.

Das explosionsartige Wachstum dieser Disziplin ist auf zwei Dinge gleichzeitig zurückzuführen:

  • Mit dem Aufkommen riesiger Mengen von Daten aller Art. Im Internet sind heute große Mengen an Daten verfügbar, die alle frei zugänglich sind. Die meisten dieser Daten sind unstrukturiert, aber genau das ist eine der wichtigsten Aufgaben von Data Scientists, nämlich die Strukturierung all dieser Rohdaten.
  • Mit den enormen Fortschritten in der Datenverarbeitung und dem Aufkommen der Cloud-Technologie müssen Daten verarbeitet werden. Daten müssen verarbeitet werden, und heute ist sogar ein einfacher Computer für ein paar hundert Dollar in der Lage, Gigabytes von Informationen zu verarbeiten. Hinzu kommt die Entwicklung von Cloud-Technologien. Das heißt, ein Spezialist kann die erforderliche Software direkt in der Cloud ausführen und bei Bedarf die Rechenleistung bis ins Unendliche steigern.

Wozu Data Science nützlich ist…

Next