Was ist Big Data?
NachrichtenWährend die Ursprünge des Begriffs schwer zu fassen sind und sogar debattiert werden, ist Big Data eines der Konzepte, über die viele Bescheid wissen, und widerspricht einer einfachen Definition. Im Zentrum von Big Data steht, wie der Begriff direkt vermuten lässt, eine extrem große Datenmenge. Dies wird häufig aus verschiedenen Quellen und sogar aus verschiedenen Datentypen gezogen, die dann durch fortschrittliche Analysetechniken zusammengestellt werden, die hoffentlich Muster herausgreifen, die zu nützlichen Schlussfolgerungen führen können.
Big Data umfasst auch die drei Vs: Volume, Variety und Velocity. Das Volumen bezieht sich auf die Größe der Daten, die Vielfalt gibt an, dass die Datensätze nicht homogen sind, und die Geschwindigkeit ist die Geschwindigkeit, mit der die Analyse stattfindet, häufig mit dem Ziel einer Echtzeitanalyse.
Die betroffenen Datensätze sind in der Tat sehr groß - wir sprechen von Terabytes bis Zettabytes (1ZB entspricht 909.494.701 TB für Neugierige). Zusätzlich zur Größe dieser Datensätze können die Daten unterschiedlichen Typs sein: strukturiert, halbstrukturiert und unstrukturiert sowie aus mehreren Quellen stammen.
Dies wirft die Frage auf, woher all diese Daten generiert werden. Es kommt aus allen Bereichen, einschließlich dem Internet, sozialen Netzwerken, Netzwerken, Protokolldateien, Videodateien, Sensoren und mobilen Geräten.
Letztere sind besonders wichtig, da die meisten von uns unsere Telefone rund um die Uhr bei uns haben und über eine Reihe von Sensoren verfügen, darunter GPS, Kameras, ein Mikrofon und einen Bewegungssensor. Darüber hinaus besteht der Großteil der Smartphone-Nutzung nicht aus der Sprachkommunikation, sondern aus anderen Aktivitäten, darunter E-Mails, Spielen, Web-Browsing und Social Apps. Dies führt letztendlich dazu, dass 90% der Nutzung mobile Apps sind. Ein großer Treiber für Big Data sind diese mobilen Daten, die mit rasendem Tempo generiert werden.
Data Mining
Daten ohne Analyse sind jedoch kaum viel wert, und dies ist der andere Teil des Big-Data-Prozesses. Diese Analyse wird als Data Mining bezeichnet und versucht, nach Mustern und Anomalien in diesen großen Datensätzen zu suchen. Diese Muster erzeugen dann Informationen, die zu verschiedenen Zwecken verwendet werden, beispielsweise zur Verbesserung von Marketingkampagnen, zur Steigerung des Umsatzes oder zur Kostensenkung. Der Big-Data- und Data-Mining-Ansatz kann nicht nur ganze Branchen verändern, sondern hat dies bereits getan.
Trainline ist beispielsweise ein führender europäischer Einzelhändler für Zugtickets, der in 173 Ländern Inlands- und grenzüberschreitende Tickets verkauft und täglich etwa 127.000 Fahrten von Kunden durchgeführt wird. Das Unternehmen nutzte Big Data, um seinen Reiseansatz zu modernisieren, wobei der Fokus darauf lag, das Kundenerlebnis durch Innovation durch seine App zu verbessern.
Das Ergebnis ist, dass Kunden jetzt über die App erweiterte Benachrichtigungen über Unterbrechungen erhalten. Diese erweiterten Benachrichtigungen sind mehr als nur Verzögerungen, sie sind spezifisch für die Reise jedes Reisenden, eine Premiere für die britische Eisenbahnindustrie. Das Unternehmen hat auch in Bezug auf die vorausschauende Preisgestaltung Neuerungen eingeführt, die vorhersagen können, wann Vorabflugtarife gegenüber dem ursprünglich ermäßigten Tarif steigen werden, so dass Fluggäste Flugpreise zu niedrigeren Preisen erwerben können.
Big Data wurde auch in Restaurants und insbesondere in der Fast-Food-Industrie eingesetzt. McDonald's ist nach Umsatz die weltweit größte Restaurantkette und bedient täglich über 69 Millionen Kunden an über 36.900 Standorten in über 100 Ländern.
Allein aufgrund des scharen Volumens werden Tonnen von Daten generiert. Daher hat McDonald's eine datengetriebene Kultur mit dem Ziel angenommen, sein Verständnis auf Ebene jedes einzelnen Standorts zu verbessern, mit dem übergeordneten Ziel einer besseren Kette von Restaurants.
Durch Big Data hat McDonald's seine Durchfahrtserfahrung optimiert, indem er beispielsweise die Größe der durchfahrenden Autos zur Kenntnis nahm und sich auf einen Nachfrageschub vorbereitete, wenn größere Autos in die Warteschlange eintreten.
Eine weitere Innovation von Big Data sind die digitalen Menüanzeigen, die Menüpunkte basierend auf einer Echtzeitanalyse der Daten flexibel anzeigen können. Die Menüs verschieben die hervorgehobenen Elemente basierend auf Daten, einschließlich der Tageszeit und des Wetters, und fördern insbesondere kalte Getränke, wenn es draußen heiß ist, und an kühleren Tagen mehr Komfort. Dieser Ansatz hat den Umsatz an kanadischen Standorten um 3% bis 3,5% gesteigert..
Gesundheitsfragen
Dieser Big Data-Ansatz wurde auch im Gesundheitswesen angewandt. Ein offensichtliches Beispiel ist die große Verschiebung von der „Stift-auf-Papier“ -Darstellung, bei der die Daten Ihres Arztes in einem Aktenschrank im Büro aufbewahrt werden, zu Electronic Health Records (EHR), bei der nun alle Patienteninformationen sauber in eine Computerdatenbank eingegeben werden bereit, abgebaut zu werden.
Dieser Ansatz verspricht störend zu sein, eine kürzlich im European Heart Journal veröffentlichte Publikation verspricht das “Potenzial zur Verbesserung unseres Verständnisses der für die frühe Übersetzung relevanten Krankheitsursachen und -klassifizierung sowie zur Bereitstellung von umsetzbaren Analysen zur Verbesserung von Gesundheit und Gesundheitsfürsorge”.
Die Vorteile von Big Data im Gesundheitswesen gehen über das Data Mining der EHR hinaus. Eine bedeutende Herausforderung für Krankenhäuser ist die Personalausstattung, die zu jeder Zeit ausreichend sein muss, wobei das Potenzial besteht, in Spitzenzeiten anzusteigen.
In einer Gruppe von vier Pariser Krankenhäusern, zu denen die Assistance Publique-Hôpitaux de Paris (AP-HP) gehört, möchten sie die Flexibilität bei der Personalbesetzung verbessern. Sie nutzten einen Datensatz von 10 Jahren Krankenhauseintrittslisten, bis hin zu einer detaillierten Anzahl von Einweisungen pro Tag sowie Tageszeit und kombinierten diese Daten mit Wetterdaten, Grippemustern und Feiertagen.
Mit maschinellem Lernen verfeinerten sie ihre Algorithmen für zukünftige Trends, um die Anzahl der anstehenden Tage für verschiedene Tage und Zeiten vorherzusagen. Das Ergebnis ist, dass sie jetzt eine einfach zu bedienende, browserbasierte Benutzeroberfläche für die Krankenhausverwaltung sowie klinisches Personal haben, das in der Lage ist, die Eintrittsraten für die nächsten 15 Tage zu prognostizieren, was dazu dient, zusätzliches Personal zu erhalten, wenn es größer wird Anzahl der Aufnahmen wird erwartet.
Da Daten und insbesondere mobile Daten mit einer unglaublich hohen Geschwindigkeit generiert werden, ist der Big-Data-Ansatz erforderlich, um diesen massiven Informationshaufen in verwertbare Informationen umzuwandeln. In den Beispielen, die wir oben zitiert haben, wurde die Herausforderung gemeistert. Je mehr Daten erhoben werden, desto mehr Möglichkeiten gibt es, die Qualität und Effizienz in einer Reihe verschiedener Branchen durch schnellere und bessere Analyse dieser unterschiedlich großen Datensätze zu erhöhen.
- Wir fragen auch: Ist Big Data ein großer Misserfolg??