Книга: Интернет вещей: Будущее уже здесь
Большие данные – большие результаты
Большие данные – большие результаты
Неудивительно, что различные микрочипы и датчики, а также человек со смартфоном или планшетом генерируют огромное количество данных. Наряду с существующими источниками (у многих организаций есть унаследованные базы данных и регистрационные записи, хранящиеся десятилетиями) сейчас имеется множество новых способов их получения. В целом объемы данных ежегодно увеличиваются приблизительно на 50–60 %, а мобильный трафик растет примерно на 61 % в год, согласно данным сетевого гиганта Cisco Systems{11}. По прогнозам International Data Corporation, к 2020 г. в мире будет существовать 40 зеттабайт данных. (Для справки: 1000 терабайт = 1 петабайт, 1000 петабайт = 1 эксабайт, и 1000 эксабайт = 1 зеттабайт. В один зеттабайт поместится примерно 250 млрд DVD-дисков, то есть более 35 лет непрерывного просмотра видео в высоком качестве). Это приблизительно 6 терабайт на каждого живущего ныне человека – или 3 млн книг на душу населения{12}.
Неудивительно, что различные микрочипы и датчики, а также человек со смартфоном или планшетом генерируют огромное количество данных. Наряду с существующими источниками (у многих организаций есть унаследованные базы данных и регистрационные записи, хранящиеся десятилетиями) сейчас имеется множество новых способов их получения.
Несмотря на то что словосочетание «большие данные» представляет собой профессиональный жаргонизм, это разумная концепция, в основе которой лежит сбор, хранение и использование наборов данных, полученных как из структурированных, так и из неструктурированных источников (первые – это базы данных). Большие данные обычно существуют в виде потоков сообщений, текстовых файлов, фотографий, видео– и аудиозаписей, социальных медиа. Дуг Лейни, ныне аналитик в компании Gartner, еще в 2001 г. дал короткое и внятное определение больших данных. Он заявил, что большие данные включают три основные компонента: объем, скорость и разнообразие. Объем относится к количеству данных, скорость – к тому, на какой скорости данные генерируются и становятся доступными для использования, разнообразие означает множество различных типов существующих данных.
В некоторых дисциплинах – астрономии, метеорологии, геологоразведочных работах и техническом проектировании – для решения задач и построения моделей уже давно используются огромные массивы данных. С появлением Интернета вещей количество источников данных наряду с их объемом, скоростью и разнообразием растет в геометрической прогрессии. Теперь не только компьютеры собирают, генерируют и педантично хранят данные в своих базах. Интернет вещей охватывает спутники, паркоматы, торговые автоматы, телевизоры, кассовые терминалы, бензоколонки, упаковку пищевых продуктов, бытовую технику, выключатели освещения, общественные уборные и полки в супермаркетах. Любой объект, способный передавать потоковые данные в облако в реальном времени, становится частью Интернета вещей.
В перспективе главной задачей будет идентификация нужных данных и подготовка наборов данных к эффективному использованию. Время покажет, насколько хорошо подключенные устройства станут сортировать большие данные и использовать их. Конечно, по мере того как три компонента, названные Лейни, приобретают все большее значение (в основном благодаря цифровой конвергенции и Интернету вещей), мир бизнеса понимает, насколько важно повышать скорость анализа данных и темпы своих действий. Он будет вынужден действовать быстрее и умнее.
В то время как волна новых технологий открывает все более комплексные и одновременно детальные способы постижения мира, сочетание сложных систем анализа общественного мнения в социальных медиа, моделей краудсорсинга и подключаемых датчиков и устройств делает анализ более подробным. В будущем станет возможным повысить точность прогноза погоды, создать более гибкую производственную модель на основе развития инноваций, использовать данные для выпуска более качественной продукции, эффективнее выводить эту продукцию на рынок, в короткие сроки выпускать новые линии одежды или блюда для ресторанов, радикально менять способы взаимодействия производителей и потребителей.
- Большие целые типы
- Большие индексы
- Достигнутые результаты
- Где можно делать небольшие заметки или набирать текст?
- В Microsoft Word не всегда удобно выделять большие фрагменты текста мышью. Есть ли другие способы?
- Удивительные результаты
- Небольшие непросохшие работы
- Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим
- Небольшие версии
- Методы и их результаты
- ПРИЛОЖЕНИЕ В Результаты измерения производительности
- Отзывы и результаты