Цитата Кейт Кроуфорд

Хотя многие поставщики больших данных делают все возможное, чтобы деидентифицировать людей из наборов данных о людях, риск повторной идентификации очень реален. — © Кейт Кроуфорд
Хотя многие поставщики больших данных делают все возможное, чтобы деидентифицировать людей из наборов данных о людях, риск повторной идентификации очень реален.
Имея дело с данными, ученые часто пытались учесть риски и вред, которые может нанести их использование. Одной из основных проблем является конфиденциальность - раскрытие конфиденциальных данных о лицах либо непосредственно общественности, либо косвенно из наборов анонимных данных посредством вычислительных процессов повторной идентификации.
Люди думают, что «большие данные» позволяют избежать проблемы дискриминации, потому что вы имеете дело с наборами больших данных, но на самом деле большие данные используются для все более и более точных форм дискриминации — формы «красной черты» данных.
По мере того, как мы вступаем в эпоху, когда персональные устройства рассматриваются как средства удовлетворения общественных потребностей, мы рискуем, что уже существующее неравенство еще больше укоренится. Таким образом, с каждым набором больших данных нам нужно спрашивать, какие люди исключены. Какие места менее заметны? Что произойдет, если вы живете в тени больших наборов данных?
Имея слишком мало данных, вы не сможете сделать никаких выводов, которым вы доверяете. С большим количеством данных вы обнаружите отношения, которые не являются реальными... Большие данные — это не биты, это талант.
Данные и наборы данных не являются объективными; они являются творениями человеческого дизайна. Мы придаем числам их голос, делаем из них выводы и определяем их значение посредством наших интерпретаций.
TIA использовали реальные пользователи, работающие с реальными данными — иностранными данными. Данные, конфиденциальность которых не является проблемой.
Мы получаем больше данных о людях, чем любая другая информационная компания получает о людях, о чем угодно — и это даже близко не близко. Мы смотрим на то, что вы знаете, что вы не знаете, как вы учитесь лучше всего. Большая разница между нами и другими компаниями, работающими с большими данными, заключается в том, что мы ни при каких обстоятельствах не продаем ваши данные третьим лицам.
Данные всегда будут нести следы своей истории. Это человеческая история, хранящаяся в этих наборах данных.
Я буду говорить о двух наборах вещей. Одна из них заключается в том, как производительность и сотрудничество меняют природу труда, и как это будет очень важно для мировой экономики. И второе, данные. Другими словами, глубокое влияние цифровых технологий, которое проистекает из данных и цикла обратной связи данных.
Большие данные уже давно используются людьми — только в обычных приложениях. Страхование и стандартизированные тесты — примеры больших данных, существовавших до появления Интернета.
Один из мифов об Интернете вещей заключается в том, что у компаний есть все данные, которые им нужны, но их реальная проблема состоит в том, чтобы разобраться в них. В действительности стоимость сбора некоторых видов данных остается слишком высокой, качество данных не всегда достаточно хорошим, и по-прежнему сложно интегрировать несколько источников данных.
Данные о погоде в США хранятся лучше всего и являются наиболее доступными в мире благодаря постоянной поддержке налогоплательщиков со стороны правительства и военных. Есть более длинные европейские наборы данных, но данных США достаточно для прогнозирования крупных экстремальных явлений.
Мы все говорим, что данные — это следующая белая нефть. [Владение нефтяным месторождением не так важно, как владение нефтеперерабатывающим заводом, потому что на переработке нефти можно заработать большие деньги. То же самое касается данных и того, что вы извлекаете реальную ценность из данных.]
Сторонники больших данных хотят, чтобы мы поверили, что за строками кода и огромными базами данных скрывается объективное и универсальное понимание моделей человеческого поведения, будь то потребительские расходы, преступные или террористические акты, здоровые привычки или производительность труда сотрудников. Но многие евангелисты больших данных избегают пристального взгляда на слабые стороны.
Предубеждения и слепые пятна существуют в больших данных так же, как и в индивидуальном восприятии и опыте. Тем не менее, существует проблематичное убеждение, что большие данные всегда являются лучшими данными и что корреляция так же хороша, как и причинно-следственная связь.
Я вновь принуждаю себя к человеческим ценностям. Как писатель-беллетрист, лучшие данные поступают через органы чувств, а затем обрабатываются с помощью многочисленных исправлений. Мы должны научиться быть разумными оценщиками данных, поступающих к нам, и того, как они влияют на наш мыслительный процесс.
Этот сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство. Больше информации...
Понятно!