Цитата Рика Смолана

В книгу «Человеческое лицо больших данных» включен ряд увлекательных историй, которые представляют собой одни из самых инновационных применений данных, формирующих наше будущее. — © Рик Смолан
В книгу «Человеческое лицо больших данных» включен ряд увлекательных историй, в которых представлены некоторые из самых инновационных приложений данных, формирующих наше будущее.
Большие данные уже давно используются людьми — только в обычных приложениях. Страхование и стандартизированные тесты — примеры больших данных, существовавших до появления Интернета.
Люди думают, что «большие данные» позволяют избежать проблемы дискриминации, потому что вы имеете дело с наборами больших данных, но на самом деле большие данные используются для все более и более точных форм дискриминации — формы «красной черты» данных.
Я думаю, что данные — один из самых мощных механизмов для рассказывания историй. Я беру огромную кучу данных и пытаюсь заставить их рассказывать истории.
Приложения машинного обучения и искусственного интеллекта оказываются особенно полезными в океане, где есть так много данных - большие поверхности, большие глубины - и недостаточно данных - слишком дорого и не всегда полезно собирать образцы любого вида из повсюду.
MapReduce стал языком ассемблера для обработки больших данных, а SnapReduce использует сложные методы для компиляции конвейеров интеграции данных SnapLogic в этот новый целевой язык больших данных. Применяя все, что мы знаем о двух мирах интеграции и Hadoop, мы создали нашу технологию, которая напрямую соответствует MapReduce, делая процесс подключения и крупномасштабной интеграции данных бесшовным и простым.
Самое важное, что произошло, это то, что за время, прошедшее после принятия Закона о доступном медицинском обслуживании, наша медицинская наука развивалась. Теперь у нас есть геномные данные. У нас есть сила больших данных о том, каковы ваши жизненные модели, что происходит в вашем теле. Даже ваш смартфон может собирать данные о вашей ходьбе, пульсе или других вещах, которые могут иметь невероятно важное значение для прогнозирования появления болезни в будущем и предотвращения этих проблем.
На мой взгляд, наш подход к глобальному потеплению иллюстрирует все недостатки нашего подхода к окружающей среде. Мы основываем наши решения на предположениях, а не на доказательствах. Сторонники настаивают на своих взглядах больше пиаром, чем научными данными. Действительно, мы позволили политизировать весь вопрос — красные против синих, республиканцы против демократов. Это на мой взгляд абсурд. Данные не являются политическими. Данные есть данные. Политика ведет вас в направлении веры. Данные, если вы будете следовать им, приведут вас к истине.
Большая часть «больших данных» — это мошенничество, потому что на самом деле это «глупые данные».
Способность собирать, анализировать, триангулировать и визуализировать огромные объемы данных в режиме реального времени — это то, чего человечество никогда раньше не имело. Этот новый набор инструментов, часто называемый возвышенным термином «большие данные», начал появляться как новый подход к решению некоторых из самых серьезных проблем, стоящих перед нашей планетой.
Предубеждения и слепые пятна существуют в больших данных так же, как и в индивидуальном восприятии и опыте. Тем не менее, существует проблематичное убеждение, что большие данные всегда являются лучшими данными и что корреляция так же хороша, как и причинно-следственная связь.
Большие данные хороши, когда вы хотите проверить и количественно оценить небольшие данные, поскольку большие данные предназначены для поиска корреляции, а маленькие данные — для поиска причинно-следственной связи.
Хотя многие поставщики больших данных делают все возможное, чтобы деидентифицировать людей из наборов данных о людях, риск повторной идентификации очень реален.
Один из мифов об Интернете вещей заключается в том, что у компаний есть все данные, которые им нужны, но их реальная проблема состоит в том, чтобы разобраться в них. В действительности стоимость сбора некоторых видов данных остается слишком высокой, качество данных не всегда достаточно хорошим, и по-прежнему сложно интегрировать несколько источников данных.
Данные — это просто резюме тысяч историй. Расскажите несколько таких историй, чтобы сделать данные значимыми.
Все знают или должны знать, что все, что мы печатаем на наших компьютерах или говорим в наши мобильные телефоны, распространяется по всей информационной сфере. И большая их часть записывается и анализируется серверами больших данных. Как вы думаете, почему Gmail и Facebook бесплатны? Вы думаете, это корпоративные подарки? Мы платим своими данными.
Мы считаем, что если сеть задействована, то мы должны ее защитить. Исходя из этого, будущие разработки будут вращаться вокруг обеспечения защиты данных, сетей и приложений.
Этот сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство. Больше информации...
Понятно!