Ein Zitat von Peter Norvig

Einfache Modelle und viele Daten übertrumpfen ausgefeiltere Modelle, die auf weniger Daten basieren. — © Peter Norvig
Einfache Modelle und viele Daten übertrumpfen ausgefeiltere Modelle, die auf weniger Daten basieren.
Der Paradigmenwechsel der ImageNet-Denkweise besteht darin, dass, während viele Menschen auf Modelle achten, wir uns auf Daten konzentrieren sollten. Daten werden die Art und Weise, wie wir über Modelle denken, neu definieren.
Je größer Ihr Datensatz ist, je mehr Umfragen Sie haben, je mehr Umfragen Sie durchführen lassen, desto genauer werden Ihre Modelle sein. Das ist einfach eine Tatsache der Datenwissenschaft.
Maschinelles Lernen sucht nach Mustern in Daten. Wenn Sie mit rassistischen Daten beginnen, werden Sie am Ende noch mehr rassistische Modelle erhalten. Das ist ein echtes Problem.
Der größte Fehler ist die übermäßige Abhängigkeit von Daten. Manager werden sagen, wenn keine Daten vorliegen, können sie keine Maßnahmen ergreifen. Es liegen jedoch nur Daten über die Vergangenheit vor. Wenn die Daten schlüssig sind, ist es zu spät, auf der Grundlage dieser Schlussfolgerungen Maßnahmen zu ergreifen.
So sind selbst vermeintlich unverfälschte Beobachtungstatbestände bereits mit allerlei Vorstellungsbildern, Modellvorstellungen, Theorien oder wie auch immer man sich ausdrückt, durchsetzt. Die Wahl besteht nicht darin, ob man im Bereich der Daten bleibt oder theoretisiert; Die Wahl besteht nur zwischen Modellen, die mehr oder weniger abstrakt, verallgemeinert, der direkten Beobachtung nahe oder weiter entfernt und mehr oder weniger geeignet sind, beobachtete Phänomene darzustellen.
Apple kennt viele Daten. Facebook kennt viele Daten. Amazon kennt viele Daten. Microsoft hat das früher getan und tut es immer noch bei manchen Leuten, aber in der neueren Welt weiß Microsoft immer weniger über mich. Xbox weiß immer noch viel über Leute, die Spiele spielen. Aber das sind wohl die großen Fünf.
Es gibt tolle schlanke Models, tolle große Models, Amazonas-Models, tolle vollbusige Models – mein Punkt ist, dass Models aller Formen und Größen, Altersgruppen und ethnischen Hintergründe angenommen und gefeiert werden sollten.
Die einzige Grundlage, um überhaupt über die globale Erwärmung zu sprechen, sind die Vorhersagen von Computermodellen. Der einzige „Beweis“ für die globale Erwärmung ist, was die Modelle für das Klima und das Wetter in den nächsten 50 bis 100 Jahren vorhersagen. Nun ist das, was diese Modelle ausspucken, nur so gut wie die eingegebenen Daten, und das ist ein absoluter Witz. Aus wissenschaftlicher Sicht ist das ein totaler Witz. Es gibt keine globale oder sonstige Erwärmung!
Damit die Theorie-Praxis-Iteration funktioniert, muss der Wissenschaftler sozusagen geistig beidhändig sein; Sie sind einerseits gleichermaßen fasziniert von möglichen Bedeutungen, Theorien und vorläufigen Modellen, die aus Daten und der praktischen Realität der realen Welt abgeleitet werden können, und andererseits von den faktischen Implikationen, die sich aus vorläufigen Theorien, Modellen und Hypothesen ableiten lassen.
Die Klimaforscher, die mit Modellen arbeiten, neigen immer dazu, ihre Modelle zu überschätzen. Sie glauben, dass Modelle real sind und vergessen, dass sie nur Modelle sind.
Der Zweck von Modellen besteht nicht darin, die Daten anzupassen, sondern die Frage zu schärfen.
Es gibt viele tolle Frauen da draußen. Es gibt viele heiße Models. Aber Models sind die Schlimmsten, denn sie sind Models, man muss sich immer hervorheben und immer gut aussehen.
Es erstaunt mich, dass Menschen oft eher bereit sind, auf der Grundlage weniger oder gar keiner Daten zu handeln, als Daten zu verwenden, deren Zusammenstellung eine Herausforderung darstellt.
Wie zuverlässig sind die Computer-[Klima-]Modelle, auf denen mögliche zukünftige Klimaverhältnisse basieren? Nicht sehr. Alle sind sich einig, dass die Aufgabe der Klimamodellierung aufgrund der Schätzungen, die vorgenommen werden müssen, und der gummiartigen Qualität vieler Daten umfangreich ist.
Man denkt, dass „Big Data“ das Problem der Diskriminierung vermeidet, weil man es mit großen Datensätzen zu tun hat, aber in Wirklichkeit wird Big Data für immer präzisere Formen der Diskriminierung verwendet – eine Form des Data Redlining.
Es stellt sich heraus, dass es wichtig ist, ein Produkt zu entwickeln und nicht nur eine Reihe von Datenmodellen.
Diese Website verwendet Cookies, um Ihnen das bestmögliche Erlebnis zu bieten. Mehr Info...
Habe es!