Цитата Майкла Нильсена

Несмотря на ценность открытых данных, большинство лабораторий не предпринимают систематических усилий по обмену данными с другими учеными. — © Майкл Нильсен
Несмотря на ценность открытых данных, большинство лабораторий не предпринимают систематических усилий по обмену данными с другими учеными.
ученые... сопротивляются... делают из данных больше, чем сами данные.
Каждый раз, когда ученые не согласны, это происходит потому, что у нас недостаточно данных. Затем мы можем договориться о том, какие данные нужно получить; получаем данные; и данные решают проблему. Либо я прав, либо ты прав, либо мы оба не правы. И мы идем дальше. Такого разрешения конфликтов не существует ни в политике, ни в религии.
Ученые узнают о мире тремя способами: они анализируют статистические закономерности в данных, проводят эксперименты и учатся на данных и идеях других ученых. Недавние исследования показывают, что дети также учатся таким же образом.
Мы все говорим, что данные — это следующая белая нефть. [Владение нефтяным месторождением не так важно, как владение нефтеперерабатывающим заводом, потому что на переработке нефти можно заработать большие деньги. То же самое касается данных и того, что вы извлекаете реальную ценность из данных.]
Имея дело с данными, ученые часто пытались учесть риски и вред, которые может нанести их использование. Одной из основных проблем является конфиденциальность - раскрытие конфиденциальных данных о лицах либо непосредственно общественности, либо косвенно из наборов анонимных данных посредством вычислительных процессов повторной идентификации.
Данные! данные! данные! — нетерпеливо воскликнул он. — Я не могу делать кирпичи без глины.
ИИ хорош настолько, насколько хороши данные, на которых они обучаются. И хотя многие технологические гиганты, работающие над ИИ, такие как Google и Facebook, открыли исходный код некоторых своих алгоритмов, они скрывают большую часть своих данных.
Люди считают, что лучший способ извлечь уроки из данных — это выдвинуть гипотезу, а затем проверить ее, но данные настолько сложны, что тот, кто работает с набором данных, не будет знать, что нужно спросить. Это огромная проблема.
Имея слишком мало данных, вы не сможете сделать никаких выводов, которым вы доверяете. С большим количеством данных вы обнаружите отношения, которые не являются реальными... Большие данные — это не биты, это талант.
Если у вас много данных и вы хотите извлечь из них пользу, одна из вещей, которую вы можете рассмотреть, — это создание команды ИИ.
Мы получаем больше данных о людях, чем любая другая информационная компания получает о людях, о чем угодно — и это даже близко не близко. Мы смотрим на то, что вы знаете, что вы не знаете, как вы учитесь лучше всего. Большая разница между нами и другими компаниями, работающими с большими данными, заключается в том, что мы ни при каких обстоятельствах не продаем ваши данные третьим лицам.
Специалисты по данным — статистики, потому что быть статистиком — это круто, а любой, кто делает крутые вещи с данными, — статистик.
Ученые не собирают данные случайным образом и совершенно всесторонне. Данные, которые они собирают, — это только те данные, которые они считают * релевантными * для какой-либо гипотезы или теории.
Самая большая ошибка — это чрезмерная зависимость от данных. Менеджеры скажут, что если нет данных, они не могут предпринимать никаких действий. Однако данные существуют только о прошлом. К тому времени, когда данные станут окончательными, будет уже слишком поздно предпринимать действия, основанные на этих выводах.
Меня интересовал интеллектуальный анализ данных, что означает анализ больших объемов данных, обнаружение закономерностей и тенденций. В то же время Ларри начал скачивать из Интернета самые интересные данные, которые только можно добыть.
Один из мифов об Интернете вещей заключается в том, что у компаний есть все данные, которые им нужны, но их реальная проблема состоит в том, чтобы разобраться в них. В действительности стоимость сбора некоторых видов данных остается слишком высокой, качество данных не всегда достаточно хорошим, и по-прежнему сложно интегрировать несколько источников данных.
Этот сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство. Больше информации...
Понятно!