Лента с LTFS имеет несколько преимуществ по сравнению с другими внешними устройствами хранения, с которыми ее обычно сравнивают. Во-первых, лента с самого начала разрабатывалась как автономное устройство и должна храниться на полке. Лента LTO-6 в формате LTFS может хранить 2,5 ТБ несжатых данных и почти 6 ТБ со сжатием. Это означает, что многие центры обработки данных могут поместить весь свой набор данных в небольшой ящик FedEx. Благодаря LTFS в отправляющем и принимающем центрах обработки данных больше не требуется запускать одно и то же приложение для доступа к данным на ленте.
Теперь ясно, что это преимущество, когда данные на ленте были найдены и их просто нужно передать обратно. Вам нужно добавить минуту или около того времени поиска, чтобы найти данные. Однако при больших передачах лента должна опережать большинство дисковых систем. С точки зрения загрузки LTO-6 и другие корпоративные ленточные форматы могут быть непревзойденными при сравнении отдельных устройств.
Как я отмечал в своей статье «Сравнение LTO-6 с масштабируемым хранилищем для долгосрочного хранения», в таких ситуациях лента является идеальным типом хранилища. Данные на ленте по-прежнему можно автоматически сканировать на предмет долговечности, и это, безусловно, соответствует требованиям экономической эффективности.
Облачное хранилище в центрах обработки данных будет использовать последние разработки в области виртуализации физических хранилищ, дедупликации и других методов для наиболее эффективного использования ресурсов физического хранилища. Программно-определяемое хранилище может обеспечить дополнительный уровень абстракции и экономической эффективности. Подавляющая часть контента, хранящегося «в облаке», будет храниться на больших жестких дисках с интерфейсом SATA, а часть — на магнитной (в основном LTO) ленте (особенно для «архивов»).
Лента позволяет полностью очистить данные, которые просто не обязательно должны быть на каком-либо диске, но все же должны быть сохранены. Стоимость и емкость ленты делают эти копии «на всякий случай» очень доступными.
Персональные компьютеры сегодня представляют собой богатую экосистему, включающую массивные центры обработки данных на базе ПК, ноутбуки и планшетные ПК, портативные устройства и мобильные телефоны. Он расширился от настольных компьютеров и центров обработки данных до тех мест, где он нужен людям — на их рабочих столах, на собраниях, в дороге или даже в воздухе.
Первая волна Интернета действительно была связана с передачей данных. И мы не слишком беспокоились о том, сколько энергии мы потребляем, какие потребности в охлаждении необходимы в центрах обработки данных, насколько большой центр обработки данных с точки зрения недвижимости. Это были почти запоздалые мысли.
Самая большая ошибка — это чрезмерная зависимость от данных. Менеджеры скажут, что если нет данных, они не могут предпринимать никаких действий. Однако данные существуют только о прошлом. К тому времени, когда данные станут окончательными, будет уже слишком поздно предпринимать действия, основанные на этих выводах.
Выйдите и соберите данные, и вместо того, чтобы получить ответ, просто посмотрите на данные и посмотрите, говорят ли они вам о чем-нибудь. Когда нам позволяют делать это с компаниями, это почти волшебство.
Один из мифов об Интернете вещей заключается в том, что у компаний есть все данные, которые им нужны, но их реальная проблема состоит в том, чтобы разобраться в них. В действительности стоимость сбора некоторых видов данных остается слишком высокой, качество данных не всегда достаточно хорошим, и по-прежнему сложно интегрировать несколько источников данных.
[Суверенитет] разрушил бы американскую монополию, но он также разрушил бы интернет-бизнес, потому что вам пришлось бы иметь центр обработки данных в каждой стране. А центры обработки данных чрезвычайно дороги, это большие капиталовложения.
Меня интересовал интеллектуальный анализ данных, что означает анализ больших объемов данных, обнаружение закономерностей и тенденций. В то же время Ларри начал скачивать из Интернета самые интересные данные, которые только можно добыть.
Пожалуй, я начну с первоначальной идеи, что побудило меня это сделать. В 1953 году у меня был доступ к магнитофону. Магнитофоны не были широко доступны. Кассеты тогда не было. Это был магнитофон Sears Roebuck. Я поставил микрофон в окно и записал атмосферу.
Люди считают, что лучший способ извлечь уроки из данных — это выдвинуть гипотезу, а затем проверить ее, но данные настолько сложны, что тот, кто работает с набором данных, не будет знать, что нужно спросить. Это огромная проблема.
Многие компании на выставке NAB 2013 демонстрировали технологию архивирования на магнитных лентах LTO. Консорциум LTO провел популярную выставку на NAB 2013, продвигая новый стандарт ленты LTO 6.
Большие данные хороши, когда вы хотите проверить и количественно оценить небольшие данные, поскольку большие данные предназначены для поиска корреляции, а маленькие данные — для поиска причинно-следственной связи.
Специалист по обработке и анализу данных — это уникальное сочетание навыков, которые могут как раскрыть понимание данных, так и рассказать фантастическую историю с помощью данных.