Ein Zitat von Peter Thiel

Die meisten „Big Data“ sind Betrug, weil es sich in Wirklichkeit um „dumme Daten“ handelt. — © Peter Thiel
Die meisten „Big Data“ sind Betrug, weil es sich in Wirklichkeit um „dumme Daten“ handelt.
Man denkt, dass „Big Data“ das Problem der Diskriminierung vermeidet, weil man es mit großen Datensätzen zu tun hat, aber in Wirklichkeit wird Big Data für immer präzisere Formen der Diskriminierung verwendet – eine Form des Data Redlining.
Vorurteile und blinde Flecken gibt es bei Big Data ebenso wie bei individuellen Wahrnehmungen und Erfahrungen. Dennoch besteht die problematische Überzeugung, dass größere Daten immer bessere Daten sind und dass Korrelation genauso gut ist wie Kausalität.
Big Data ist großartig, wenn Sie kleine Daten verifizieren und quantifizieren möchten – denn bei Big Data geht es um die Suche nach einer Korrelation, bei Small Data um die Suche nach der Ursache.
Wir alle sagen, dass Daten das nächste weiße Öl sind. [Der Besitz des Ölfeldes ist nicht so wichtig wie der Besitz der Raffinerie, denn das große Geld lässt sich mit der Raffinierung des Öls verdienen. Das Gleiche gilt für Daten und dafür, dass Sie den wahren Wert aus den Daten extrahieren.]
MapReduce ist zur Assemblersprache für die Big-Data-Verarbeitung geworden, und SnapReduce verwendet ausgefeilte Techniken, um SnapLogic-Datenintegrationspipelines in diese neue Big-Data-Zielsprache zu kompilieren. Unter Anwendung unseres gesamten Wissens über die beiden Welten der Integration und Hadoop haben wir unsere Technologie so entwickelt, dass sie direkt zu MapReduce passt und den Prozess der Konnektivität und Datenintegration im großen Maßstab nahtlos und einfach macht.
Mit zu wenigen Daten können Sie keine vertrauenswürdigen Schlussfolgerungen ziehen. Bei einer Menge Daten werden Sie auf Beziehungen stoßen, die nicht real sind ... Bei Big Data geht es nicht um Bits, sondern um Talent.
Ich werde etwas ziemlich Kontroverses sagen. Big Data, wie die Menschen es heute verstehen, ist nur eine größere Version von Small Data. Grundsätzlich hat sich nichts an der Art und Weise geändert, wie wir mit Daten umgehen; es gibt einfach mehr davon.
„The Human Face of Big Data“ enthält eine Reihe faszinierender Geschichten, die einige der innovativsten Datenanwendungen darstellen, die unsere Zukunft prägen.
Wir erhalten mehr Daten über Menschen als jedes andere Datenunternehmen über Menschen, über irgendetwas – und das ist nicht einmal annähernd der Fall. Wir schauen uns an, was Sie wissen, was Sie nicht wissen und wie Sie am besten lernen. Der große Unterschied zwischen uns und anderen Big-Data-Unternehmen besteht darin, dass wir Ihre Daten aus keinem Grund an Dritte vermarkten.
Die Leute glauben, der beste Weg, aus den Daten zu lernen, sei, eine Hypothese aufzustellen und sie dann zu überprüfen, aber die Daten sind so komplex, dass jemand, der mit einem Datensatz arbeitet, nicht weiß, was die wichtigsten Fragen sind. Das ist ein riesiges Problem.
Wenn Wissenschaftler anderer Meinung sind, liegt das daran, dass wir nicht über ausreichende Daten verfügen. Dann können wir uns darauf einigen, welche Art von Daten wir erhalten; wir bekommen die Daten; und die Daten lösen das Problem. Entweder habe ich recht, oder du hast recht, oder wir liegen beide falsch. Und wir machen weiter. Eine solche Konfliktlösung gibt es weder in der Politik noch in der Religion.
Eine [Big Data]-Herausforderung besteht darin, wie wir Big Data verstehen und nutzen können, wenn es in einem unstrukturierten Format vorliegt.
Der größte Fehler ist die übermäßige Abhängigkeit von Daten. Manager werden sagen, wenn keine Daten vorliegen, können sie keine Maßnahmen ergreifen. Es liegen jedoch nur Daten über die Vergangenheit vor. Wenn die Daten schlüssig sind, ist es zu spät, auf der Grundlage dieser Schlussfolgerungen Maßnahmen zu ergreifen.
Ich interessierte mich für Data Mining, was bedeutet, große Datenmengen zu analysieren und Muster und Trends zu entdecken. Zur gleichen Zeit begann Larry, das Internet herunterzuladen, was sich als die interessantesten Daten herausstellte, die man überhaupt abbauen kann.
Einer der Mythen über das Internet der Dinge besagt, dass Unternehmen über alle Daten verfügen, die sie benötigen, ihre eigentliche Herausforderung jedoch darin besteht, sie zu verstehen. Tatsächlich sind die Kosten für die Erhebung einiger Datenarten nach wie vor zu hoch, die Qualität der Daten ist nicht immer gut genug und es bleibt schwierig, mehrere Datenquellen zu integrieren.
Ein Datenwissenschaftler ist die einzigartige Kombination von Fähigkeiten, die sowohl die Erkenntnisse aus Daten erschließen als auch mithilfe der Daten eine fantastische Geschichte erzählen kann.
Diese Website verwendet Cookies, um Ihnen das bestmögliche Erlebnis zu bieten. Mehr Info...
Habe es!