Цитата Вернера Фогельса

Мне нравится, что мир насыщен данными… к сожалению, это называется «большие данные». — © Вернер Фогельс
Мне нравится, что мир насыщен данными… к сожалению, это называется «большие данные».
Люди думают, что «большие данные» позволяют избежать проблемы дискриминации, потому что вы имеете дело с наборами больших данных, но на самом деле большие данные используются для все более и более точных форм дискриминации — формы «красной черты» данных.
Предубеждения и слепые пятна существуют в больших данных так же, как и в индивидуальном восприятии и опыте. Тем не менее, существует проблематичное убеждение, что большие данные всегда являются лучшими данными и что корреляция так же хороша, как и причинно-следственная связь.
Большие данные хороши, когда вы хотите проверить и количественно оценить небольшие данные, поскольку большие данные предназначены для поиска корреляции, а маленькие данные — для поиска причинно-следственной связи.
MapReduce стал языком ассемблера для обработки больших данных, а SnapReduce использует сложные методы для компиляции конвейеров интеграции данных SnapLogic в этот новый целевой язык больших данных. Применяя все, что мы знаем о двух мирах интеграции и Hadoop, мы создали нашу технологию, которая напрямую соответствует MapReduce, делая процесс подключения и крупномасштабной интеграции данных бесшовным и простым.
Имея слишком мало данных, вы не сможете сделать никаких выводов, которым вы доверяете. С большим количеством данных вы обнаружите отношения, которые не являются реальными... Большие данные — это не биты, это талант.
Я собираюсь сказать что-то довольно спорное. Большие данные, как их сегодня понимают люди, — это просто увеличенная версия малых данных. Принципиально то, что мы делаем с данными, не изменилось; там просто больше.
Мы получаем больше данных о людях, чем любая другая информационная компания получает о людях, о чем угодно — и это даже близко не близко. Мы смотрим на то, что вы знаете, что вы не знаете, как вы учитесь лучше всего. Большая разница между нами и другими компаниями, работающими с большими данными, заключается в том, что мы ни при каких обстоятельствах не продаем ваши данные третьим лицам.
Одна из проблем [больших данных] заключается в том, как мы можем понимать и использовать большие данные, когда они поступают в неструктурированном формате.
Самая большая ошибка — это чрезмерная зависимость от данных. Менеджеры скажут, что если нет данных, они не могут предпринимать никаких действий. Однако данные существуют только о прошлом. К тому времени, когда данные станут окончательными, будет уже слишком поздно предпринимать действия, основанные на этих выводах.
«Выхлоп данных», вероятно, моя наименее любимая фраза в мире больших данных, потому что она звучит как что-то, от чего вы пытаетесь избавиться, или что-то вредное, что исходит из задней части вашей машины.
Один из мифов об Интернете вещей заключается в том, что у компаний есть все данные, которые им нужны, но их реальная проблема состоит в том, чтобы разобраться в них. В действительности стоимость сбора некоторых видов данных остается слишком высокой, качество данных не всегда достаточно хорошим, и по-прежнему сложно интегрировать несколько источников данных.
Специалист по обработке и анализу данных — это уникальное сочетание навыков, которые могут как раскрыть понимание данных, так и рассказать фантастическую историю с помощью данных.
Мы все говорим, что данные — это следующая белая нефть. [Владение нефтяным месторождением не так важно, как владение нефтеперерабатывающим заводом, потому что на переработке нефти можно заработать большие деньги. То же самое касается данных и того, что вы извлекаете реальную ценность из данных.]
Большие данные уже давно используются людьми — только в обычных приложениях. Страхование и стандартизированные тесты — примеры больших данных, существовавших до появления Интернета.
В мире, который становится все более цифровым, данные являются ценной валютой, но мы, как потребители, контролируем и не владеем ими. Как потребители, мы должны спросить, что крупные компании делают с нашими данными, вопрос, адресованный как онлайн, так и традиционным.
Большая часть «больших данных» — это мошенничество, потому что на самом деле это «глупые данные».
Этот сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство. Больше информации...
Понятно!