Ein Zitat von Oren Etzioni

Ich möchte sagen, dass ich mich schon so lange mit Big Data beschäftige, dass es sich früher um Small Data handelte, als ich anfing, damit zu arbeiten. — © Oren Etzioni
Ich möchte sagen, dass ich mich schon so lange mit Big Data beschäftige, dass es sich früher um Small Data handelte, als ich anfing, damit zu arbeiten.
TIA wurde von echten Benutzern verwendet und arbeitete mit echten Daten – fremden Daten. Daten, bei denen Datenschutz kein Problem darstellt.
Big Data wird von Menschen schon seit langem genutzt – nur in stationären Anwendungen. Versicherungen und standardisierte Tests sind Beispiele für Big Data aus der Zeit vor dem Internet.
Man denkt, dass „Big Data“ das Problem der Diskriminierung vermeidet, weil man es mit großen Datensätzen zu tun hat, aber in Wirklichkeit wird Big Data für immer präzisere Formen der Diskriminierung verwendet – eine Form des Data Redlining.
Ich werde etwas ziemlich Kontroverses sagen. Big Data, wie die Menschen es heute verstehen, ist nur eine größere Version von Small Data. Grundsätzlich hat sich nichts an der Art und Weise geändert, wie wir mit Daten umgehen; es gibt einfach mehr davon.
Big Data ist großartig, wenn Sie kleine Daten verifizieren und quantifizieren möchten – denn bei Big Data geht es um die Suche nach einer Korrelation, bei Small Data um die Suche nach der Ursache.
Die Leute glauben, der beste Weg, aus den Daten zu lernen, sei, eine Hypothese aufzustellen und sie dann zu überprüfen, aber die Daten sind so komplex, dass jemand, der mit einem Datensatz arbeitet, nicht weiß, was die wichtigsten Fragen sind. Das ist ein riesiges Problem.
KIs sind nur so gut wie die Daten, auf denen sie trainiert werden. Und während viele der Technologiegiganten, die an KI arbeiten, wie Google und Facebook, einige ihrer Algorithmen als Open-Source-Lösungen bereitgestellt haben, halten sie die meisten ihrer Daten zurück.
Während ich dort war, flog die Voyager am Saturn vorbei. Ich habe mich mit einer Person zusammengetan, die Mitglied des Bildgebungsteams war, und mit der Arbeit an Daten vom Saturn begonnen. Da so viele Daten eingingen, hatte das Bildgebungsteam nicht genug Hände oder Wissenschaftler, um alles zu bearbeiten.
Hier geht die Welt hin: Direkter Zugriff von überall auf jede Art von Daten, egal ob es sich um ein kleines Datenstück oder eine kleine Antwort, aber einen langen Algorithmus zum Erstellen dieser Antwort handelt. Dem Benutzer ist das egal.
Der größte Fehler ist die übermäßige Abhängigkeit von Daten. Manager werden sagen, wenn keine Daten vorliegen, können sie keine Maßnahmen ergreifen. Es liegen jedoch nur Daten über die Vergangenheit vor. Wenn die Daten schlüssig sind, ist es zu spät, auf der Grundlage dieser Schlussfolgerungen Maßnahmen zu ergreifen.
Ich stamme nicht aus einer politischen Familie und bin nicht mit dem Traum aufgewachsen, George Washington zu sein. Ich habe in der 8. Klasse angefangen zu arbeiten und habe jeden möglichen Gelegenheitsjob ausgeübt – Arbeit in einer Kiesgrube, Wiegen von Großrädern, Ticketverkauf, Datenbankverwaltung – aber ich wusste, wenn ich hart arbeiten und Erfahrung sammeln würde, könnte ich diese Erfahrung bei meinem nächsten anwenden bemühen.
Vorurteile und blinde Flecken gibt es bei Big Data ebenso wie bei individuellen Wahrnehmungen und Erfahrungen. Dennoch besteht die problematische Überzeugung, dass größere Daten immer bessere Daten sind und dass Korrelation genauso gut ist wie Kausalität.
Wir alle sagen, dass Daten das nächste weiße Öl sind. [Der Besitz des Ölfeldes ist nicht so wichtig wie der Besitz der Raffinerie, denn das große Geld lässt sich mit der Raffinierung des Öls verdienen. Das Gleiche gilt für Daten und dafür, dass Sie den wahren Wert aus den Daten extrahieren.]
Band mit LTFS hat mehrere Vorteile gegenüber den anderen externen Speichergeräten, mit denen es normalerweise verglichen wird. Erstens wurde das Band vom ersten Tag an so konzipiert, dass es ein Offline-Gerät ist und in einem Regal Platz findet. Ein LTFS-formatiertes LTO-6-Band kann 2,5 TB unkomprimierte Daten und fast 6 TB mit Komprimierung speichern. Das bedeutet, dass viele Rechenzentren ihren gesamten Datensatz in einer kleinen FedEx-Box unterbringen könnten. Mit LTFS müssen die sendenden und empfangenden Rechenzentren nicht mehr dieselbe Anwendung ausführen, um auf die Daten auf dem Band zuzugreifen.
Als Einzelpersonen haben wir kaum Einfluss darauf, wie unsere Daten verwendet werden. Ich mache mir keine großen Sorgen über die Auswirkungen auf die Privatsphäre. Aber es scheint mir, dass ich als Einzelperson, wenn ich derjenige bin, der die Daten generiert, ein gewisses Mitspracherecht darüber haben sollte, wie sie verwendet werden.
Als ich in Japan arbeitete, habe ich ein System entwickelt, um sicherzustellen, dass Geheimdienstdaten im Katastrophenfall weltweit wiederhergestellt werden können. Mir war das Ausmaß der Massenüberwachung nicht bewusst. Als ich es erstellte, stieß ich auf einige rechtliche Fragen. Meine Vorgesetzten wehrten sich und meinten: „Wie sollen wir mit diesen Daten umgehen?“ Und ich dachte: „Ich wusste nicht einmal, dass es existiert.“
Diese Website verwendet Cookies, um Ihnen das bestmögliche Erlebnis zu bieten. Mehr Info...
Habe es!