Big Data: Was ist das? Eine Definition
Als Big Data oder Megadaten werden alle digitalen Daten bezeichnet, die durch den Einsatz neuer Technologien für private oder berufliche Zwecke entstehen. Dazu gehören Unternehmensdaten (E-Mails, Dokumente, Datenbanken, Geschäftsprozessor-Historien usw.) ebenso wie Daten von Sensoren, im Web veröffentlichte Inhalte (Bilder, Videos, Töne, Texte), E-Commerce-Transaktionen, Austausch in sozialen Netzwerken, Daten, die von vernetzten Objekten übertragen werden (elektronische Etiketten, Smart Meter, Smartphones usw.), geolokalisierte Daten usw.
Der Begriff „Big Data“ stammt laut der Association for Computing Machinery aus dem Jahr 1997. Im Jahr 2001 beschrieb der Meta-Group- (heute Gartner)-Analyst Doug Laney Big Data nach dem Prinzip der „drei V’s“:
- Volume, englisch für Umfang: Die immer größer werdende Datenmenge;
- Variety, englisch für Vielfalt: Die Vielfalt dieser Daten, die roh, unstrukturiert oder halbstrukturiert sein kann;
- Velocity, englisch für Geschwindigkeit: die Geschwindigkeit, die sich darauf bezieht, dass diese Daten in Echtzeit erzeugt, gesammelt und analysiert werden.
Einige Unternehmen fügen dieser Definition ein viertes „V“ für Veracity (engl. für Wahrhaftigkeit, Wahrheit) hinzu, was sich auf die Notwendigkeit bezieht, die Glaubwürdigkeit der Quelle und die Qualität des Inhalts zu überprüfen, um diese Daten nutzen zu können. Um den unternehmerischen Mehrwert und die Datenqualität auszudrücken, wurden mittlerweile noch die beiden Begriffe Value (engl. für Wert) und Variability (engl. für Variabilität) hinzugefügt.
Credit Video : explainity ® Erklärvideos
“Big Data” steht kurz gesagt für:
Riesige Datenmengen und
Technologien zur schnellen Auswertung riesiger Datenmengen von neuen Datenquellen.
Durch die großen Datenmengen und die immer größer werdende Komplexität und Schnelllebigkeit stößt eine manuelle herkömmliche Methode der Datenverarbeitung schnell an ihre Grenzen. Deshalb benötigt man heutzutage “Big Data” mit ihren Technologien zur schnelleren Auswertung riesiger Datenvolumen von neuen komplexen Datenquellen.
Big Data und Datenspeicherung
Der Aufstieg von Big Data folgte der Entwicklung von Datenspeicher- und -verarbeitungssystemen mit dem Aufkommen von Cloud Computing und Supercomputern. Cloud Computing ist ein Modell, bei welchem IT-Ressourcen und Anwendungen im Internet von Anbietern für Nutzer zur Verfügung gestellt werden, und vom “User” jederzeit abgerufen werden können. Heutzutage spricht man von Petabytes und Zettabytes, um die Volumina zu bezeichnen, die Big Data darstellt. Nach Prognosen von IDC (International Data Corporation) wird das weltweit produzierte Datenvolumen im Jahr 2020 40 Zettabyte erreichen.
*1 Petabyte = 1015 Bytes oder 1000Terabytes
*1 Zettabyte = 1021 Bytes oder 1 Milliarde Terabytes = 1 Trilliarde Bytes
Marketing, Wissenschaft, Handel: Die Domänen von Big Data
Die Nutzung von Big Data hat in vielen Bereichen neue Perspektiven eröffnet: Wissenschaftliche Forschung, Politik, Kommunikation, Medizin, Meteorologie, Ökologie, Finanzen, Handel usw.
Dank analytischer Werkzeuge und Datenmodellierung können Forscher, Unternehmen und Verwaltungen Trend- oder Vorhersageanalysen durchführen, Profile erstellen, Risiken antizipieren und Phänomene in Echtzeit überwachen…
Bestimmte spezialisierte Schulungen ermöglichen es ihnen, alle notwendigen Grundlagen für die Nutzung von Big Data zu beherrschen. Für Unternehmen, die sich auf Big-Data-Lösungen spezialisiert haben, ist dies ein wahres Eldorado und ein langfristiger Trend mit einem Markt, der auf mehrere zehn Milliarden Dollar geschätzt wird.
Big Data ermöglicht die Bewältigung einer riesigen technologischen Herausforderung: Die Speicherung einer großen Menge von Daten aus verschiedenen Kanälen auf einer riesigen Festplatte, die von allen Ecken des Planeten aus leicht zugänglich ist. Die Daten werden an einem sicheren Ort gespeichert und können im Falle eines Vorfalls jederzeit abgerufen werden.
Um dies zu erreichen, werden die Dateien in mehrere Fragmente, sogenannte „Chunks“, aufgeteilt. (Informationszerlegung, also „chunking“, um sich einem komplexen IT-Thema zu nähern). Diese Chunks werden dann auf mehrere Computer verteilt, und es gibt verschiedene Möglichkeiten, sie zu rekonstruieren. Tritt ein Absturz auf, kommt eine andere Maschine und übernimmt, indem sie einen anderen Weg einschlägt. Auf diese Weise bleiben die verschiedenen Puzzleteile ständig verfügbar und können auf die eine oder andere Weise zusammengesetzt werden. Es gibt verschiedene Quellen für Big Data.
Massive Datenvervielfältigung ist einer der Grundpfeiler der Big-Data-Architektur. Cloud Computing, hybride Supercomputer (High Performance Computing oder HPC) und verteilte Dateisysteme (DFS) gehören zu den wichtigsten Speichermodellen, die derzeit verfügbar sind.
*Hybride Supercomputer haben Merkmale von analogen und digitalen Computern. Logische und numerische Berechnungen liefert die digitale Komponente. Mathematische Herausforderungen und Lösungen zu Differentialgleichungen liefert die analoge Komponente.
*HPC High Performance Computing, englisch für Hochleistungsrechner
*DFS Distributed File System, englisch für verteiltes Dateisystem
Wie hilft Big Data bei der Vorhersage des Verbraucherverhaltens?
Zu Big Data gehören Informationen, die in sozialen Netzwerken veröffentlicht werden (Alters- und Kontaktdaten, Meinungen, Kommentare, Fotos, Videos), Web-Browsing (durch die berühmten Cookies) und Online-Käufe. Diese Daten liefern sehr interessante Anhaltspunkte über das Verbraucherverhalten und Markttrends.
Wenn Sie gerade Laufschuhe auf einer E-Commerce-Website gekauft und ein Foto von sich selbst beim Laufen des Paris-Marathons veröffentlicht haben, sind Sie ein attraktives Ziel für Sporthändler. Diese Marken können Ihnen zur Vervollständigung Ihrer Ausrüstung Newsletter oder Werbeangebote für Produkte im Zusammenhang mit Ihren Schuhen zusenden.
Big Data ermöglicht es, Ihr Profil, aber auch Ihr Gesamtverhalten zu kennen: Die Häufigkeit der Nutzung von sozialen Netzwerken und Ihrer Online-Einkäufe (Transaktionsverlauf, getätigte Ausgaben), genutzte Kanäle, Verbindungszeiten usw..
Wofür braucht man Big Data?
Big Data ist ein wesentliches Werkzeug für B2B- und B2C-Unternehmen. Die gesammelten Daten helfen ihnen, personalisierte Marketingkampagnen zu erstellen, die auf die Bedürfnisse, Vorlieben und Verhaltensweisen der Verbraucher abgestimmt sind. Diese Informationen tragen dazu bei, das Kundenerlebnis zu verbessern, neue Interessenten zu gewinnen und bestehende Kunden zu binden.
Ein verbessertes Targeting hilft dabei, Marketingkampagnen effektiver zu gestalten und das gewünschte Segment zu erreichen, das am ehesten an den Produkten und/oder Dienstleistungen des Unternehmens interessiert ist. Targeting kommt aus dem Englischen “target”, und bedeutet „Ziel“. Man kann es im Marketingbereich auch mit “Zielgruppenansprache” übersetzen. Targeting ist ein großer Bestandteil des Online-Marketings. Mit der Anwendung dieser Technik kann Werbung so exakt wie möglich auf eine Zielgruppe ausgerichtet werden. „Big Data“ ist auch ein Wettbewerbsvorteil für Fachleute, die über eine Fülle von Daten verfügen, da sie Verhaltensänderungen vorhersehen und besser verstehen können, warum sich die Verbraucher einem bestimmten Anbieter zugewandt haben.
Zudem ist Big Data ein wertvolles Werkzeug in vielen privaten und öffentlichen Bereichen, vom Online-Verkauf über wissenschaftliche Forschung, Kultur, Politik (Wahlkampf), Verkehr, Versicherungen, Industrie, Banken und Energie.
Quellen:
https://www.dgq.de/fachbeitraege/big-data-bei-viele-unternehmen-an-erster-stelle/
https://www.sas.com/de_de/insights/big-data/what-is-big-data.html
Marlene ist seit 25 Jahren Fotografin und Künstlerin. Ihre Leidenschaft für Sprachen und interkulturelle Kommunikation entwickelte sie durch internationale fotojournalistische Arbeiten. Heute nutzt sie ihre weitreichende Erfahrung auch als Korrekturleserin und übersetzt journalistische Artikel vom Französischen ins Deutsche. Marlene stellt sicher, dass jeder Text seine Authentizität bewahrt und an die sprachlichen sowie kulturellen Besonderheiten des deutschsprachigen Publikums angepasst wird.