Ein Zitat von Kate Crawford

Man denkt, dass „Big Data“ das Problem der Diskriminierung vermeidet, weil man es mit großen Datensätzen zu tun hat, aber in Wirklichkeit wird Big Data für immer präzisere Formen der Diskriminierung verwendet – eine Form des Data Redlining.
Wir erhalten mehr Daten über Menschen als jedes andere Datenunternehmen über Menschen, über irgendetwas – und das ist nicht einmal annähernd der Fall. Wir schauen uns an, was Sie wissen, was Sie nicht wissen und wie Sie am besten lernen. Der große Unterschied zwischen uns und anderen Big-Data-Unternehmen besteht darin, dass wir Ihre Daten aus keinem Grund an Dritte vermarkten.
Ich werde etwas ziemlich Kontroverses sagen. Big Data, wie die Menschen es heute verstehen, ist nur eine größere Version von Small Data. Grundsätzlich hat sich nichts an der Art und Weise geändert, wie wir mit Daten umgehen; es gibt einfach mehr davon.
Big Data ist großartig, wenn Sie kleine Daten verifizieren und quantifizieren möchten – denn bei Big Data geht es um die Suche nach einer Korrelation, bei Small Data um die Suche nach der Ursache.
Big Data wird von Menschen schon seit langem genutzt – nur in stationären Anwendungen. Versicherungen und standardisierte Tests sind Beispiele für Big Data aus der Zeit vor dem Internet.
Vorurteile und blinde Flecken gibt es bei Big Data ebenso wie bei individuellen Wahrnehmungen und Erfahrungen. Dennoch besteht die problematische Überzeugung, dass größere Daten immer bessere Daten sind und dass Korrelation genauso gut ist wie Kausalität.
MapReduce ist zur Assemblersprache für die Big-Data-Verarbeitung geworden, und SnapReduce verwendet ausgefeilte Techniken, um SnapLogic-Datenintegrationspipelines in diese neue Big-Data-Zielsprache zu kompilieren. Unter Anwendung unseres gesamten Wissens über die beiden Welten der Integration und Hadoop haben wir unsere Technologie so entwickelt, dass sie direkt zu MapReduce passt und den Prozess der Konnektivität und Datenintegration im großen Maßstab nahtlos und einfach macht.
Während viele Big-Data-Anbieter ihr Bestes tun, um Personen aus Datensätzen von Menschen zu deidentifizieren, ist das Risiko einer erneuten Identifizierung sehr real.
Mit zu wenigen Daten können Sie keine vertrauenswürdigen Schlussfolgerungen ziehen. Bei einer Menge Daten werden Sie auf Beziehungen stoßen, die nicht real sind ... Bei Big Data geht es nicht um Bits, sondern um Talent.
Eine [Big Data]-Herausforderung besteht darin, wie wir Big Data verstehen und nutzen können, wenn es in einem unstrukturierten Format vorliegt.
Die meisten „Big Data“ sind Betrug, weil es sich in Wirklichkeit um „dumme Daten“ handelt.
Während wir in eine Ära eintreten, in der persönliche Geräte als Stellvertreter für öffentliche Bedürfnisse angesehen werden, laufen wir Gefahr, dass sich bereits bestehende Ungleichheiten noch weiter verschärfen. Daher müssen wir bei jedem großen Datensatz fragen, welche Personen ausgeschlossen sind. Welche Orte sind weniger sichtbar? Was passiert, wenn Sie im Schatten großer Datenmengen leben?
Beim Umgang mit Daten fällt es Wissenschaftlern oft schwer, die Risiken und Schäden einzuschätzen, die ihre Nutzung mit sich bringen könnte. Ein Hauptanliegen war der Datenschutz – die Offenlegung sensibler Daten über Einzelpersonen, entweder direkt an die Öffentlichkeit oder indirekt aus anonymisierten Datensätzen durch rechnerische Prozesse zur Neuidentifizierung.
Wir alle sagen, dass Daten das nächste weiße Öl sind. [Der Besitz des Ölfeldes ist nicht so wichtig wie der Besitz der Raffinerie, denn das große Geld lässt sich mit der Raffinierung des Öls verdienen. Das Gleiche gilt für Daten und dafür, dass Sie den wahren Wert aus den Daten extrahieren.]
Big Data wird Ihnen niemals große Ideen bescheren ... Big Data ermöglicht keine großen Sprünge in der Fantasie. Es wird niemals eine PC-Revolution oder irgendeinen Paradigmenwechsel heraufbeschwören. Und obwohl es Ihnen vielleicht sagt, was Sie anstreben sollen, kann es Ihnen nicht sagen, wie Sie dorthin gelangen
Wenn Wissenschaftler anderer Meinung sind, liegt das daran, dass wir nicht über ausreichende Daten verfügen. Dann können wir uns darauf einigen, welche Art von Daten wir erhalten; wir bekommen die Daten; und die Daten lösen das Problem. Entweder habe ich recht, oder du hast recht, oder wir liegen beide falsch. Und wir machen weiter. Eine solche Konfliktlösung gibt es weder in der Politik noch in der Religion.
Schauen wir uns die Kreditvergabe an, wo Big Data für die Kreditwürdigkeit genutzt wird. Und es handelt sich übrigens nur um die Anreicherung von Kreditdaten, was wir auch tun. Es ist nichts Mystisches. Aber sie sind sehr gut darin, die Schmerzpunkte zu reduzieren. Sie können es schneller absichern, indem sie – ich nenne es einfach Big Data, weil es keinen besseren Begriff gibt: „Warum dauert es zwei Wochen? Warum schafft man es nicht in 15 Minuten?“
Diese Website verwendet Cookies, um Ihnen das bestmögliche Erlebnis zu bieten. Mehr Info...
Habe es!