TIA использовали реальные пользователи, работающие с реальными данными — иностранными данными. Данные, конфиденциальность которых не является проблемой.
Когда горстка технологических гигантов является привратниками мировых данных, неудивительно, что дебаты о балансировании прогресса и конфиденциальности оформлены как «за данные и, следовательно, инновации» против «застрявших в темных веках».
Имея дело с данными, ученые часто пытались учесть риски и вред, которые может нанести их использование. Одной из основных проблем является конфиденциальность - раскрытие конфиденциальных данных о лицах либо непосредственно общественности, либо косвенно из наборов анонимных данных посредством вычислительных процессов повторной идентификации.
Самая большая ошибка — это чрезмерная зависимость от данных. Менеджеры скажут, что если нет данных, они не могут предпринимать никаких действий. Однако данные существуют только о прошлом. К тому времени, когда данные станут окончательными, будет уже слишком поздно предпринимать действия, основанные на этих выводах.
Я не нацелен на правительство. Я не говорю "привет", я закрываю его, потому что не хочу давать вам никаких данных. Я говорю, что для защиты наших клиентов мы должны шифровать. И побочным эффектом этого является то, что у меня нет данных.
Люди считают, что лучший способ извлечь уроки из данных — это выдвинуть гипотезу, а затем проверить ее, но данные настолько сложны, что тот, кто работает с набором данных, не будет знать, что нужно спросить. Это огромная проблема.
Имея слишком мало данных, вы не сможете сделать никаких выводов, которым вы доверяете. С большим количеством данных вы обнаружите отношения, которые не являются реальными... Большие данные — это не биты, это талант.
Один из мифов об Интернете вещей заключается в том, что у компаний есть все данные, которые им нужны, но их реальная проблема состоит в том, чтобы разобраться в них. В действительности стоимость сбора некоторых видов данных остается слишком высокой, качество данных не всегда достаточно хорошим, и по-прежнему сложно интегрировать несколько источников данных.
Специалист по обработке и анализу данных — это уникальное сочетание навыков, которые могут как раскрыть понимание данных, так и рассказать фантастическую историю с помощью данных.
Данные преобладают. Если вы выбрали правильные структуры данных и хорошо все организовали, алгоритмы почти всегда будут очевидны. Структуры данных, а не алгоритмы, занимают центральное место в программировании.
Данные! данные! данные! — нетерпеливо воскликнул он. — Я не могу делать кирпичи без глины.
АНБ не слушает ничьих телефонных звонков. Они не читают электронные письма американцев. Они просто собирают данные, которые уже есть у вашей телефонной компании и в отношении которых у вас нет разумных ожиданий конфиденциальности, чтобы они могли быстро найти эти данные в случае террористического заговора.
Я буду говорить о двух наборах вещей. Одна из них заключается в том, как производительность и сотрудничество меняют природу труда, и как это будет очень важно для мировой экономики. И второе, данные. Другими словами, глубокое влияние цифровых технологий, которое проистекает из данных и цикла обратной связи данных.
Выйдите и соберите данные, и вместо того, чтобы получить ответ, просто посмотрите на данные и посмотрите, говорят ли они вам о чем-нибудь. Когда нам позволяют делать это с компаниями, это почти волшебство.
Я беспокоюсь о конфиденциальности — компании собирают данные о нас, о том, что мы делаем в Твиттере, о публично доступных материалах на Фейсбуке. Удивительно, сколько данных о нас существует. Я беспокоюсь, что этим могут злоупотреблять и будут злоупотреблять.
Предубеждения и слепые пятна существуют в больших данных так же, как и в индивидуальном восприятии и опыте. Тем не менее, существует проблематичное убеждение, что большие данные всегда являются лучшими данными и что корреляция так же хороша, как и причинно-следственная связь.