Цитата Питера Норвига

Простые модели и большое количество данных превосходят более сложные модели, основанные на меньшем количестве данных. — © Питер Норвиг
Простые модели и большое количество данных превосходят более сложные модели, основанные на меньшем количестве данных.
Смена парадигмы мышления ImageNet заключается в том, что, хотя многие люди обращают внимание на модели, давайте обращать внимание на данные. Данные изменят наше представление о моделях.
Чем больше у вас набор данных, чем больше опросов, чем больше у вас есть опросов, которые люди проводят, тем точнее будут ваши модели. Это просто факт науки о данных.
Машинное обучение ищет закономерности в данных. Если вы начнете с расистских данных, вы получите еще больше расистских моделей. Это настоящая проблема.
Самая большая ошибка — это чрезмерная зависимость от данных. Менеджеры скажут, что если нет данных, они не могут предпринимать никаких действий. Однако данные существуют только о прошлом. К тому времени, когда данные станут окончательными, будет уже слишком поздно предпринимать действия, основанные на этих выводах.
Таким образом, даже якобы неподдельные факты наблюдения уже смешаны со всевозможными концептуальными картинками, модельными понятиями, теориями или любым другим выражением, которое вы выберете. Выбор заключается не в том, оставаться ли в поле данных или теоретизировать; выбор только между моделями более или менее абстрактными, обобщенными, близкими или более удаленными от непосредственного наблюдения, более или менее подходящими для представления наблюдаемых явлений.
Apple знает много данных. Facebook знает много данных. Amazon знает много данных. Microsoft использовала и до сих пор делает с некоторыми людьми, но в новом мире Microsoft знает обо мне все меньше и меньше. Xbox по-прежнему много знает о людях, которые играют в игры. Но это большая пятерка, я думаю.
Есть отличные стройные модели, отличные высокие модели, модели-амазонки, отличные грудастые модели - я считаю, что модели всех форм и размеров, возраста, этнического происхождения должны быть приняты и прославлены.
Единственным основанием даже для разговоров о глобальном потеплении являются прогнозы, выдаваемые компьютерными моделями. Единственное «доказательство» глобального потепления в кавычках и без кавычек — это то, что модели предсказывают климат и погоду в следующие 50–100 лет. То, что выдают эти модели, настолько хорошо, насколько хороши введенные данные, и это абсолютная шутка. С точки зрения науки это полная ерунда. Нет никакого потепления, глобального или иного!
Чтобы итерация теории и практики работала, ученый должен быть, так сказать, ментально амбидекстральным; одинаково увлечены, с одной стороны, возможными значениями, теориями и предварительными моделями, которые можно вывести из данных и практической реальности реального мира, а с другой — фактическими последствиями, выводимыми из предварительных теорий, моделей и гипотез.
Климатологи, работающие с моделями, всегда склонны переоценивать свои модели. Они начинают верить, что модели реальны, и забывают, что они всего лишь модели.
Цель моделей не в том, чтобы подогнать данные, а в том, чтобы уточнить вопрос.
Там много удивительных женщин. Есть много горячих моделей. Но хуже всего модели, потому что они модели, ты всегда должен идти вперед и всегда хорошо выглядеть.
Меня поражает, как люди часто более склонны действовать на основе небольшого количества данных или вообще без них, чем использовать данные, которые сложно собрать.
Насколько надежны компьютерные [климатические] модели, на которых основаны возможные будущие климаты? Не очень. Все согласятся с тем, что задача моделирования климата огромна из-за оценок, которые необходимо сделать, и расплывчатого качества большей части данных.
Люди думают, что «большие данные» позволяют избежать проблемы дискриминации, потому что вы имеете дело с наборами больших данных, но на самом деле большие данные используются для все более и более точных форм дискриминации — формы «красной черты» данных.
Оказывается, важно создавать продукт, а не просто кучу моделей данных.
Этот сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство. Больше информации...
Понятно!