Ein Zitat von Oren Etzioni

Wenn Sie über große Datenmengen verfügen, die so gekennzeichnet sind, dass ein Computer weiß, was sie bedeuten, Sie über eine große Rechenleistung verfügen und versuchen, Muster in diesen Daten zu finden, haben wir festgestellt, dass Deep Learning unschlagbar ist .
Ich interessierte mich für Data Mining, was bedeutet, große Datenmengen zu analysieren und Muster und Trends zu entdecken. Zur gleichen Zeit begann Larry, das Internet herunterzuladen, was sich als die interessantesten Daten herausstellte, die man überhaupt abbauen kann.
Ich denke, die erste Welle des Deep-Learning-Fortschritts waren hauptsächlich große Unternehmen mit einer Menge Daten, die sehr große neuronale Netze trainierten, oder? Wenn Sie also ein Spracherkennungssystem aufbauen möchten, trainieren Sie es anhand von 100.000 Stunden Daten.
Man kann sich jedes gegebene Axiomensystem wie einen Computer mit einer begrenzten Menge an Speicher oder Rechenleistung vorstellen. Man könnte zu einem Computer mit noch mehr Speicher wechseln, aber egal wie viel Speicherplatz der Computer hat, es werden immer noch einige Aufgaben anfallen, die seine Fähigkeiten übersteigen.
Bei der Erfassung großer Datenmengen kann etwas passieren, wenn diese in eine Excel-Tabelle oder in ein Kreisdiagramm eingefügt werden. Sie laufen Gefahr, völlig zu verpassen, worum es geht.
[Der] Umfang der Suche ist kein Maß für die Menge der zur Schau gestellten Intelligenz. Was ein Problem zu einem Problem macht, ist nicht, dass für seine Lösung ein großer Suchaufwand erforderlich ist, sondern dass ein großer Suchaufwand erforderlich wäre, wenn nicht das erforderliche Maß an Intelligenz angewendet würde.
Ich bin ein Datenfresser und deshalb arbeite ich normalerweise an den Dingen, zu denen ich gute Daten finden kann. Der Aufstieg des Internethandels veränderte die Menge an Informationen, die man über das Verhalten von Unternehmen sammeln konnte, völlig, sodass ich mich natürlich darauf einließ.
Dieser Vorteil besteht nun eindeutig darin, dass die Daten auf dem Band gefunden wurden und nur noch zurückübertragen werden müssen. Sie müssen etwa eine Minute Suchzeit hinzufügen, um die Daten zu finden. Bei großen Übertragungen sollte Band jedoch den meisten Festplattensystemen überlegen sein. Aus der Ingest-Perspektive sind LTO-6 und andere Enterprise-Bandformate möglicherweise konkurrenzlos, wenn man sie auf Einzeleinheitsbasis vergleicht.
Die Personalisierung basiert auf einem Schnäppchen. Als Gegenleistung für die Filterdienstleistung übergeben Sie großen Unternehmen eine enorme Menge an Daten über Ihr tägliches Leben – viele davon würden Sie Ihren Freunden möglicherweise nicht anvertrauen.
Maschinelles Lernen sucht nach Mustern in Daten. Wenn Sie mit rassistischen Daten beginnen, werden Sie am Ende noch mehr rassistische Modelle erhalten. Das ist ein echtes Problem.
MapReduce ist zur Assemblersprache für die Big-Data-Verarbeitung geworden, und SnapReduce verwendet ausgefeilte Techniken, um SnapLogic-Datenintegrationspipelines in diese neue Big-Data-Zielsprache zu kompilieren. Unter Anwendung unseres gesamten Wissens über die beiden Welten der Integration und Hadoop haben wir unsere Technologie so entwickelt, dass sie direkt zu MapReduce passt und den Prozess der Konnektivität und Datenintegration im großen Maßstab nahtlos und einfach macht.
Moderne Statistiker sind mit der Vorstellung vertraut, dass jede endliche Datenmenge nur eine begrenzte Menge an Informationen zu jedem untersuchten Punkt enthält; dass diese Grenze durch die Art der Daten selbst festgelegt wird und nicht durch den Aufwand an Einfallsreichtum erhöht werden kann, der bei ihrer statistischen Untersuchung aufgewendet wird; dass die Aufgabe des Statistikers tatsächlich auf die Extraktion aller verfügbaren Informationen über beliebige Daten beschränkt ist ein spezifisches Problem.
In jeder Branche gibt es eine weit verbreitete Tendenz, dass jemand versucht, etwas mit einer Menge Daten zu verkaufen, wo er sich ein wenig herauspickt ... ein wenig Voreingenommenheit. Dies wird ganz einfach, wenn es eine riesige Datenmenge gibt, aus der man Rosinen auswählen kann.
Haben Sie keine Angst vor großen Mustern, wenn sie richtig gestaltet sind, sind sie für das Auge erholsamer als kleine: Im Großen und Ganzen ist ein Muster, bei dem die Struktur groß und die Details stark aufgelöst sind, am nützlichsten ... sehr kleine Räume, sowie sehr große, mit großen Mustern verzierte Muster sehen besser aus.
Keine Musik wird den Krieg stoppen. Was den Krieg stoppen wird, ist eine große Menge Leichensäcke oder eine große Menge Menschen auf der Straße, die dagegen protestieren, bevor er beginnt.
! möchten die Kreativität von Forschern in den Bereichen Mathematik, Statistik, Data Mining, Informatik, Biologie, Medizin und der breiten Öffentlichkeit nutzen.
Cloud Computing bedeutet, dass Sie Ihre Daten auf dem Computer eines anderen Computers ausführen. Wenn ich ein wenig in die Zukunft blicke, bin ich fest davon überzeugt, dass Cloud – früher Grid Computing genannt – eine weite Verbreitung finden wird. Es ist viel günstiger als der Kauf einer eigenen Computerinfrastruktur, oder vielleicht haben Sie nicht die Möglichkeit, auf Ihrem eigenen Computer das zu tun, was Sie wollen.
Diese Website verwendet Cookies, um Ihnen das bestmögliche Erlebnis zu bieten. Mehr Info...
Habe es!