Цитата Бриттани Кайзер

Чем больше у вас набор данных, чем больше опросов, чем больше у вас есть опросов, которые люди проводят, тем точнее будут ваши модели. Это просто факт науки о данных.
Я собираюсь сказать что-то довольно спорное. Большие данные, как их сегодня понимают люди, — это просто увеличенная версия малых данных. Принципиально то, что мы делаем с данными, не изменилось; там просто больше.
Когда я смотрю на следующий набор технологий, которые нам нужно внедрить в Salesforce, я вижу, что все они основаны на технологиях, основанных на данных. Нам не нужно больше облака. Нам не нужно больше мобильных устройств. Нам не нужно больше соц. Нам нужно больше науки о данных.
Люди думают, что «большие данные» позволяют избежать проблемы дискриминации, потому что вы имеете дело с наборами больших данных, но на самом деле большие данные используются для все более и более точных форм дискриминации — формы «красной черты» данных.
Большие данные в основном связаны с получением чисел и использованием этих чисел для прогнозирования будущего. Чем больше у вас будет набор данных, тем точнее будут прогнозы на будущее.
Простые модели и большое количество данных превосходят более сложные модели, основанные на меньшем количестве данных.
Однако, если мы будем собирать все больше и больше данных и устанавливать все больше и больше ассоциаций, мы не обнаружим в конце концов, что что-то знаем. Мы просто получим все больше и больше данных и все больше наборов корреляций.
Подрывная технология — это теория. Он говорит, что это произойдет, и вот почему; это утверждение причины и следствия. В нашем обучении мы так превозносим достоинства принятия решений на основе данных, что во многих отношениях осуждаем менеджеров за то, что они способны действовать только после того, как данные станут ясными и игра окончена. Во многих отношениях хорошая теория точнее данных. Это позволяет более четко видеть будущее.
Машинное обучение ищет закономерности в данных. Если вы начнете с расистских данных, вы получите еще больше расистских моделей. Это настоящая проблема.
Мы получаем больше данных о людях, чем любая другая информационная компания получает о людях, о чем угодно — и это даже близко не близко. Мы смотрим на то, что вы знаете, что вы не знаете, как вы учитесь лучше всего. Большая разница между нами и другими компаниями, работающими с большими данными, заключается в том, что мы ни при каких обстоятельствах не продаем ваши данные третьим лицам.
Данные — это то, что имеет значение в экономике, и чем больше безжалостности проявит экономист, чтобы разобраться в данных, тем полезнее будут его выводы.
Научное знание по своей природе условно. Это связано с тем, что с течением времени, с изобретением лучших инструментов, большего количества данных и более качественных данных, наше понимание еще больше оттачивается. Социальный, культурный, экономический и политический контекст имеет отношение к нашему пониманию того, как работает наука.
Обмен данными позволяет нам исследовать, общаться, потреблять медиа, покупать и продавать, играть в игры и многое другое. В свою очередь, предприятия разрабатывают продукты, ученые проводят исследования, а правительства используют данные для проведения голосования, формирования политики, сбора налогов и предоставления более качественных государственных услуг.
Больше данных побеждает умные алгоритмы, но лучшие данные побеждают больше данных.
«Sleep» — это проект, о котором я думал много лет. Просто кажется, что общество все больше и больше движется в том направлении, в котором оно нам было нужно. Наше психологическое пространство все больше заполняется данными. И мы тратим огромное количество энергии на обработку данных.
Смена парадигмы мышления ImageNet заключается в том, что, хотя многие люди обращают внимание на модели, давайте обращать внимание на данные. Данные изменят наше представление о моделях.
Предубеждения и слепые пятна существуют в больших данных так же, как и в индивидуальном восприятии и опыте. Тем не менее, существует проблематичное убеждение, что большие данные всегда являются лучшими данными и что корреляция так же хороша, как и причинно-следственная связь.
Этот сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство. Больше информации...
Понятно!