Создано ли 90% мировых данных за последние два года?

«Большие данные» — популярный термин в Интернете (особенно на веб-сайтах крупных компаний, продающих услуги по управлению данными). Например, я наткнулся на эту статью , когда читал Irish Times в аэропорту. В нем содержалось недавнее заявление IBM , которое часто повторялось в других местах (курсив мой):

Каждый день мы создаем 2,5 квинтиллиона байтов данных — столько, что 90% данных в современном мире были созданы только за последние два года .

Это просто маркетинговый ход или заявление заслуживает доверия?

NB, возможно, также стоит спросить, соответствует ли утверждение чему-то другому, кроме расплывчатого определения «данных».

Это действительно зависит от того, как вы определяете «данные», но, поскольку они от IBM, они, вероятно, означают «извлекаемую, пригодную для использования информацию, записанную на постоянном носителе».
Я не уверен, как будут выглядеть доказательства этого, но в качестве частичного ответа это более или менее верно для биоинформатики (обратите внимание, что данные устарели, с тех пор рост ускорился), которая в последнее время является одним из крупнейших производителей данных. Это почти наверняка верно и в физике (вспомните БАК). Но я подозреваю, что большая часть данных легко поступает из других источников, а именно от людей, создающих контент.
Педагоги-грамматики, возможно, захотят сказать мне, следует ли начинать заголовок со слов « У вас есть 90% мировых данных…».
@matt_black Согласно викисловарю, посвященному данным: «Это слово чаще используется как неисчисляемое существительное с глаголом в единственном числе, чем как существительное во множественном числе с данным в единственном числе». В таком случае и при отсутствии каких-либо указаний на то, что вопрос конкретно относится к набору отдельных фактов, «имеет» кажется мне правильным.
Видео в разрешении 1080p60 — это огромный объем данных. 15-24 Мбит/с — типичный битрейт большинства видеокамер. Большинство смартфонов не могут воспроизводить видео в формате 1080p60, но обычно они поддерживают разрешение 1080p30 или 720p60. Производство видео со скоростью 100 МБ за минуту записи. Для сравнения, несколько лет назад большинство смартфонов могли записывать видео только QVGA или VGA со скоростью 30 кадров в секунду, а иногда и 15 кадров в секунду. Или даже совсем не (например, iPhone 3G).
«Недавний иск от IBM» датирован 2013 годом. Первоначально «последние два года» означали 2011–2012 годы. Но в 2015 году сегодня «последние два года» могут означать 2013-2014 годы. Так что любой заданный ответ на этот вопрос устаревает каждые два года... Как ответить на такой каверзный вопрос?

Ответы (1)

У меня нет строгих источников исследований, которые можно было бы сослаться, но, основываясь на таких отчетах , я бы оценил базовую правдоподобность этого утверждения как приличную, если следующее выдержит проверку:

  1. Устройства с камерами значительно расширились за последние 4-6 лет с появлением так называемых «смартфонов».
  2. Эти камеры имеют все большее количество мегапикселей в каждом поколении.
  3. Видео также все чаще и чаще является функцией этих устройств.
  4. Облачные сервисы и онлайн-сайты социальных сетей позволяют хранить (и подсчитывать) все эти данные более надежно.
  5. HD-видео также распространилось в Интернете на многих популярных видеосайтах - фильмы и даже потоковое HD-видео (которое записывается) видеоигр (киберспорт) и других событий.

Я бы сказал, что 1-4 имеют своего рода мультипликативный эффект друг на друга ... еще десятки миллионов устройств (2 года назад Apple и Google активировали 9 миллионов телефонов в месяц ), делающих 8-мегапиксельные фотографии и HD-видео, очень быстро складываются. .

Значит, фотографии на пленку не считаются данными?
@matt_black Я думаю, разумно предположить, что для целей подсчета IBM, пока это не будет в цифровой форме, это не так.
@matt_black Я слышал, что фильм о трансформерах был очень тяжелым в этом аспекте :)
кстати. Я бы сказал, что 8-мегапиксельная фотография неуместно мала по сравнению с видео в формате Full HD.
@Mathieu 2MP на кадр. 60 кадров в секунду. 3600 кадров в минуту. 216000 кадров в час.
Да, это значительный объем данных.
(Мой предыдущий комментарий, который я удалил — извините: «Full HD = 1080 * (16/9 * 1080) = 1080 * 1920 = 2073600 = 2,1 МП».)