Big Data

Der Begriff “Big Data” bedeutet wörtlich übersetzt „Massendaten“ und beschreibt große unstrukturierte Datenmengen, die herkömmliche Analyseverfahren überfordern. Big Data kann Unternehmen dabei helfen, Entwicklungen besser zu erkennen und frühzeitig zu reagieren.

Der Begriff Big  Data beschreibt eine große Menge an Daten, die Unternehmen nutzen können, Entwicklungen besser zu erkennen, und frühzeitig zu reagieren. Der Begriff Big Data beschreibt eine große Menge an Daten, die Unternehmen nutzen können, Entwicklungen besser zu erkennen, und frühzeitig zu reagieren.

Definition: Was bedeutet Big Data?

Der Begriff “Big Data” stammt aus dem Englischen und beschreibt große Datenmengen im Internet oder auch im digitalen Raum. Big Data sind komplexe Datensätze, mit denen Unternehmen jeden Tag in Kontakt kommen. Für Unternehmen bietet sich die Möglichkeit, diese großen Datenmengen zu analysieren und einen Vorteil aus ihnen zu ziehen. Auf Basis dieser Daten lassen sich so beispielsweise bessere Entscheidungen treffen oder auch neue Erkenntnisse gewinnen. Diese großen Datenmengen stammen aus unterschiedlichen Quellen. So können beispielsweise Webseiten, Shops, Social Media oder auch andere digitale Komponenten eine große Menge an Daten generieren. Big Data weisen häufig folgende Merkmale auf: großes Datenvolumen, eine hohe Geschwindigkeit und eine große Vielfalt der Daten. 

Definition: Was sind die Dimensionen von Big Data? 

Big Data kann je nach Aufteilung in drei oder auch sechs Dimensionen – auch “Vs” genannt – unterteilt werden, welche die wichtigsten Eigenschaften von Big Data wie folgt zusammenfassen: 

  • Volumen: Dies beschreibt die Menge an Daten. Hierbei kann es sich auch um Daten mit unbekanntem Wert handeln. Ziel ist es hierbei, eine große Menge an Daten mit einer geringen Dichte zu verarbeiten. 
  • Velocity (Geschwindigkeit): In der heutigen Zeit treffen Datenströme in einer schnellen Geschwindigkeit in das Unternehmen ein und müssen zeitig bearbeitet werden, um einen Mehrwert aus ihnen ziehen zu können. 
  • Variety (Vielfalt): Hier wird die Vielfalt der Daten beschrieben. Dabei kann zwischen strukturierten und unstrukturierten Daten unterschieden werden.
  • Value (Wert): Dies umfasst den Mehrwert der Daten für das Unternehmen.
  • Veracity (Echtheit der Daten): Die Echtheit kann auch als Richtigkeit der Daten bezeichnet werden. Hierbei geht es um die Qualität der vorliegenden Daten. Diese bestimmt sich nach der Vertrauenswürdigkeit der Herkunft und der Qualität des Inhalts.
  • Variability (Variabilität): Hierbei werden verschiedene Faktoren, wie zum Beispiel Fluktuationen, Varianz oder auch Saisonalität von Produkten, berücksichtigt. 

Definition: Was ist eine Big Data Analyse?

Die Big Data Analyse, auch Big-Data-Analytics genannt, kann als Auswertung von großen, dynamischen und vielfältigen Daten bezeichnet werden. Big Data Analytics bietet Unternehmen die Möglichkeit, die Daten sinnvoll zu nutzen und Perspektiven zu erkennen. Die Tätigkeiten von Big Data könne wie folgt unterteilt werden: 

  • Datenbeschaffung: Bereits bei der Datenbeschaffung wird die Datenquelle nach verschiedenen Faktoren ausgewertet. Hierbei spielen Faktoren wie zum Beispiel die Korrektheit, Vollständigkeit und Relevanz der Daten eine wichtige Rolle. Nach Auswertung der Datenquelle kann entschieden werden, wie und in welcher Form die Daten aus dieser Quelle genutzt werden. Danach werden die Daten abgerufen und gespeichert. Bei Informationen, die nicht lange aktuell bleiben, sollte auf den Zeitpunkt des Datenabrufs geachtet werden. 
  • Datenaufbereitung: Meist sind die Daten in ihrem ursprünglichen Zustand nicht für die weitere Analyse geeignet und müssen dementsprechend aufgearbeitet werden. So muss zum Beispiel "missing Data", also fehlende Werte, identifiziert und codiert werden. Ebenso sollten "Outliner", also Extremwerte, herausgefiltert werden, damit diese nicht die Analyse verfälschen. Anschließend sollten die Daten auf Fehler untersucht werden und anscheinend mit einem Filter bearbeitet werden. 
  • Datenauswertung: Anschließend werden die gesammelten Daten mit einer Analysesoftware ausgewertet. Hierbei können die häufigsten Analysen wie folgt unterteilt werden:
  • Data-Mining: Hier wird versucht, für den Menschen schwer erkennbare Zusammenhänge zu finden.
  • Predictive Analytics: Hiermit lassen sich quantitative Vorhersagen treffen.
  • Machine Learning: Die Software erkennt selbstständig bestimmte Muster und kategorisiert diese.
  • Text-Mining: Die Texte werden zu unterschiedlichen Zwecken analysiert.
  • Business Intelligence: Hier werden statistische Geschäftskennzahlen dargestellt. 

Welche Geschichte hat Big Data?

Der Begriff Big Data trat erstmals 1990 auf und bezeichnete eine große Menge an Daten, die damals eine Herausforderung für die IT darstellten. Schon zu jener Zeit gab es die Befürchtung, dass Computer an ihre Grenzen stoßen würden, weil die produzierten Daten mit der Zeit immer mehr werden würden. 2001 wurde der Begriff erneut definiert und festgestellt, dass, außer der Datenmenge, die Vielfalt und die Geschwindigkeit ebenfalls eine wichtige Rolle spielen. Big Data kam erneut 2006 auf, als Hadoop von Apache Spark als Open-Source-Projekt veröffentlicht wurde. Mit Hadoop waren zudem Big Data Analysen mit Standardhardware möglich, indem die Speicherkosten großer Datenmengen gesenkt wurden. Durch das Internet of Things kann die Hardware noch weiter entlastet werden, da mehr Geräte mit dem Internet verbunden sind und so die Datensammlung, beispielsweise zu Nutzungsmustern von Kunden und Produktleistungen, zwischen den Geräten aufgeteilt wird. Darüber hinaus unterstützen Entwicklungen wie Cloud-Computing und maschinelles Lernen die Nutzung von Big Data. Seit 2011 wird Big Data schließlich dank großen Unternehmen als Vorreiter häufig genutzt. Heutzutage stellt Big Data einen festen Bestandteil in den verschiedensten Branchen dar. 

Woher stammen die Daten für Big Data?

Die Daten für Big Data Analytics können aus unterschiedlichen Quellen stammen. Unter anderem können Smartphones, Smartwatches, Smart Homes oder auch vernetzte Fahrzeuge und Kundenkarten sowie andere vernetzte Geräte dargestellt werden. Der persönliche Bereich und die sensiblen Daten der Nutzer können hierbei möglicherweise teilweise verletzt werden, was zu Problemen führen kann. Jedoch ermöglicht der Einsatz der Analyse eine Verbesserung in fast allen Bereichen eines Unternehmens. Besonders stark lässt sich dies im Marketing, der Informationstechnik oder auch in der Technologieentwicklung spüren. Auch in verschiedenen Branchen, wie zum Beispiel der Marktforschung, kommt die Big Data Analyse erfolgreich zum Einsatz. Ziel ist hierbei immer die effiziente und nutzergerechte Verwendung der Daten.

Welche Vorteile bietet Big Data für Unternehmen?

Dank spezieller Software können Analysen verschiedene Vorteile und Chancen für den Umsatz erkennen, eine bessere Customer Journey generieren, effektiveres Marketing schalten und die Effizienz gegenüber Mitbewerbern steigern. Einige andere Vorteile können darüber hinaus wie folgt unterteilt werden:

  • Schnelle Wahrnehmung von Marktveränderungen: Mit Big Data ist es möglich, eine vorausschauende Analyse bezüglich Angebot und Nachfrage sowohl für den Wettbewerb als auch am Markt durchzuführen und so vorausschauend zu handeln. 
  • Informationen in Echtzeit: Das System sammelt Informationen in Echtzeit und ermöglicht so ein schnelles und oft rechtzeitiges Reagieren und Eingreifen auf Marktveränderungen. 
  • Onlinemarketing: Dank der erhobenen Daten können die Marketingmaßnahmen und die Werbung genau passend auf die Zielgruppe ausgerichtet werden und erhöhen so die Wahrscheinlichkeit eines Kaufes.
  • Schutz vor Betrug: Besonders Kreditkartenunternehmen nutzen Big Data als Lösung, um ein normales Gebrauchsmuster seiner Nutzer herauszufinden und so schneller auf Abweichungen oder Betrüger reagieren zu können. Nutzer müssen die Kreditkarte jedoch über einen gewissen Zeitraum verwenden, damit genug Daten für die Erstellung eines Gebrauchsmusters gesammelt werden können.
  • Verbesserungen im E-Commerce und der Logistik: Die Analyse der Daten bietet eine wertvolle Grundlage, anhand welcher erkannt werden kann, welche Produkte sich besonders gut verkaufen.
  • Verbesserte Customer Experience: Durch Datenanalysen kann zunächst die dadurch allgemeine Kundenkommunikation verbessert werden. So kann das Marketing gezielter erfolgen und somit die Customer Experience sowie die Kundenzufriedenheit gesteigert werden.
  • Vorhersagen von Trends: Durch die Analyse der Daten können kommende Trends vorhergesagt werden und Firmen frühzeitig darauf reagieren.
  • Reduzierung der Rate des Kaufabbruchs: Mit dem System lässt sich ein bestimmtes Kauf-Muster erkennen, weshalb es für Unternehmen einfacher ist, den Kauf-Abbruch der Kunden rechtzeitig zu erkennen und beispielsweise durch das Senden einer E-Mail zu verhindern. 

Welche möglichen Herausforder­ungen und Nachteile bringt Big Data mit sich? 

Einige Herausforderungen oder Nachteile können wie folgt unterteilt werden: 

  • Fehlerhafte Einordnung der Daten: Bei einer riesigen Datenflut kann es dazu kommen, dass die Daten nicht (korrekt) einsortiert werden und die weitere Aufbereitung somit nicht wahrgenommen werden. 
  • Mehr Aufwand: Eine große Menge an Daten bedeutet auch einen größeren Aufwand bei der Sammlung, Bearbeitung und Analyse. 
  • Eingriff in die Privatsphäre: Der Eingriff in die Privatsphäre der Nutzer zählt zu den am häufigsten kritisierten Punkten. Die analysierten Daten sowie deren Verknüpfung zu Mustern können teilweise tiefe Einblicke in das Privatleben von Personen geben und gelten daher als grenzwertig.
  • Risiko für Nutzer: Funktionen wie Cookies zeichnen die Bewegungen der Personen, die sich im Internet bewegen, auf und es besteht durchaus die Gefahr, dass Hacker die Software entschlüsseln und dann Zugriff auf die Bewegungsdaten und weitere Daten haben.
  • Nachteil für kleine Unternehmen: Big Data Analytics kann auch einen Nachteil besonders für kleine Unternehmen darstellen. Diese besitzen oft nicht die finanziellen Mittel, um solche Analyse durchführen zu können, was schlimmstenfalls zu einer Marktverdrängung durch größere Unternehmen führen kann.
  • Herausforderungen bei der Entschlüsselung der Daten: Die Analyseteams stehen unter einem großen Druck die Daten zeitig zu entschlüsseln, zu analysieren und sie gezielt einzusetzen.
  • Dauerhafte Präsenz: Die Big-Data-Technologie ändert sich ständig und somit auch die Systeme. Für Unternehmen stellt es eine Herausforderung dar, mit diesen Systemen immer aktuell auf dem Markt vertreten zu sein. 
  • Kosten: Damit alles reibungslos funktionieren kann wird eine große Anzahl an Servern und auch die dazugehörigen Tools benötigt. 

Was muss man bei einem Einstieg in Big Data beachten?

Um die Vorteile von Big Data nutzen zu können, sind drei Funktionsweisen, welche vor allem bei einem Einstieg beachtet werden müssen, von besonderer Bedeutung:

  • Integration: Hier werden Daten aus unterschiedlichen Quellen zusammengeführt und in das bestehende System des Unternehmens aufgenommen, wodurch die Herausforderung entsteht, das Volumen an Informationen in eine geeignete Form zu formatieren, sodass die Daten im unternehmenseigenen System brauchbar gemacht werden. 
  • Verwaltung: Nach der Speicherung der Daten erfolgt die anschließende Verwaltung der Daten. Hierbei kann ausgewählt werden, in welcher Form die Daten gespeichert werden sollen. Häufig kommt hier eine Cloud-Lösung zu Einsatz. 
  • Analyse: Anschließend erfolgt die Big Data Analyse, bei der die passenden Informationen recherchiert und analysiert werden können.

Warum ist Big Data wichtig?

Unternehmen, die ihre Daten mithilfe von Big Data beschaffen, haben einen entscheidenden Vorteil gegenüber ihrer Konkurrenten. Mit Big Data ist es möglich, vorausschauende Geschäftsentscheidungen zu treffen. Gerade im sich wandelnden Zeitalter, in dem die Erwartungen der Kunden immer höher werden und die Konkurrenz immer stärker wird, ist es wichtig, sich am Markt zentral vertreten und die Erwartungen der Kunden mithilfe von Informationen aus Datenbanken erfüllen zu können. Besonders in der Medizin spielt Big Data eine immer wichtiger werdende Rolle, da sich anhand der Daten die bestmögliche Behandlung für einen Patienten schneller und einfacher erkennen lässt. 

Noch mehr Wissen in unseren REMIRA Whitepapern

In unseren Whitepapern erhalten Sie nützliche Praxistipps rund um die Themen Supply Chain und Omnichannel Commerce.

Integriertes Sales & Operations Planning Bild

Integriertes Sales & Operations Planning

Kostenlos anfordern
Out-of-Stocks vermeiden - Verfügbarkeit erhöhen Bild

Out-of-Stocks vermeiden - Verfügbarkeit erhöhen

Kostenlos anfordern
Die optimale Supply Chain für den Ersatzteilhandel Bild

Die optimale Supply Chain für den Ersatzteilhandel

Kostenlos anfordern
Lagerverwaltung für Logistikdienstleister Bild

Lagerverwaltung für Logistikdienstleister

Kostenlos anfordern
Leitfaden Lieferantenintegration Bild

Leitfaden Lieferantenintegration

Kostenlos anfordern
Einfach Inventur: Der Inventurleitfaden Bild

Einfach Inventur: Der Inventurleitfaden

Kostenlos anfordern
Vendor Managed Inventory: Vorteile für Händler und Lieferanten Bild

Vendor Managed Inventory: Vorteile für Händler und Lieferanten

Kostenlos anfordern
S&OP in der Lebensmittelbranche Bild

S&OP in der Lebensmittelbranche

Kostenlos anfordern

Alle Glossar-Begriffe

Advanced Planning and Scheduling API Artikelnummer ASIN Auftrag Auftragsabwicklung Auftragsdurch­laufzeit Auftrags­fertigung Augmented Reality Auslagerung AutoStore Avisierung Bedarf Belegausgabepflicht Beleglose Lagerführung Beschaffung Beschaffungslogistik Beschaffungsmanagement Beschaffungsplanung Best-of-Breed Bestand Bestandscontrolling Big Data Blockchain Bottom-Up Planung Business Intelligence Software Buy Box Category Management Chaotische Lagerhaltung Charge Click and Collect Click and Reserve Cloud Commerce Corporate Social Responsibility Curated Shopping Curbside Pick-up Customer Experience Management Customer Journey Customer Relationship Management (CRM) Data Warehouse Digital Commerce Digital Signage Direct-to-Consumer (D2C) Disponent Distributionslager Distributionslogistik Dropshipping DSFinV-K Durchlaufregal Durchlaufzeit (DL) E-Procurement EAN EDI Clearing Center EDIFACT Endless Aisle Exoskelett Fahrerloses Transportsystem (FTS) Fast Moving Consumer Goods (FMCG) FEFO FIFO Fiskalisierung Fiskalspeicher Flottenmanagement Flurförderfahrzeug Fourth Party Logistics - 4PL Frontend Gamification Gebinde Gegenstrom­­­verfahren Geschenkbon GoBD Green Logistics GTIN - Global Trade Item Number Handelslogistik HIFO Integrated Business Planning (IBP) Integrierte Planung Internet of Things (IoT) Intralogistik Inventursoftware Inventurverfahren IWD PS 880 Kassensicherungsverordnung (KassenSichV) Kaufentscheidung Key Performance Indicator (KPI) KMU Kommissioniermethoden Kommissionier­verfahren Kommissio­nier­lager Konsignationslager Kontraktlogistik Kuppelproduktion Künstliche Intelligenz Ladeeinheit Ladehilfsmittel Lager Lagerarten Lagerbestand Lagerhaltung Lagerhaltungskosten Lagerkennzahlen Lagerlogistik Lagerverwaltungssystem Lebensmittellogistik Lieferantenintegration Lieferfähigkeit Lieferkettengesetz Liefertreue LIFO LOFO Logistik und ihre Teilbereiche Losgrößen Management by Exception Maschinelles Lernen Materialfluss Materialwirtschaft Maximalbestand MDE-Gerät Meldebestand Micro-Hub Mindestbestand Mindesthalt­barkeitsdatum (MHD) Mobile Commerce (M-Commerce) Mobile Datenerfassung Mobile Kasse mPOS (Mobile Point of Sale) Multichannel Nullbon Omnichannel Omnichannel Commerce Order Management Order Management System (OMS) Palette Payment Provider Permanente Inventur Pflichtenheft Pick-by-Cart Pick-by-Light Pick-by-Paper Pick-by-Scan Pick-by-Voice Pick-by-Watch Planogramm POS (Point of Sale) Procurement Software Product Experience Management (PXM) Product Lifecycle Management (PLM) Produktinformations­management (PIM) Produktionslogistik Push & Pull Quick Commerce Radio Frequency Identification (RFID) Recommendation Engines Regalplanung Repricing Responsive Design Ressourcenmanagement Retail Retoure Retourenmanagement Return-in-Store ROPO-Effekt Self-Checkout SGTIN Ship-from-Store Showrooming Sicherheitsbestand Social Commerce Software Software-as-a-Service (SaaS) Space Management Stationärer Handel Streuverlust Stückgut Stückliste Supplier Relationship Management (SRM) Technische Sicherungs­einrichtung (TSE) Top-Down Planung Transportlogistik Transportmanagement TUL-Prozesse Umlagerung Umschlagslager Umschlagslogistik Unified Commerce Unternehmenslogistik Virtuelles Lager Voice Commerce Vor- und nachverlegte Inventur Vorratslager Warehouse Management System Warenausgang Warendisposition Wareneingang Warenwirtschaftssystem Wiederbeschaffungszeit Zeitfenster­management Zentrallager Zulieferer Zwischenlager