Статья в The Independent , посвященная последним разработкам в области больших данных, содержит следующее подозрительно точное утверждение:
К 2020 году считается, что количество байтов будет в 57 раз больше, чем количество песчинок на мировых пляжах.
Является ли это утверждение хотя бы отдаленно правдоподобным? Есть ли хотя бы отдаленно правдоподобный способ проверить это?
Примечание. В этом вопросе есть связанное утверждение: было ли 90% мировых данных создано за последние два года? . И, поскольку часть вопроса касается песка , я использовал тег геологии . ;-) Любые лучшие предложения?
Уточнение Я не хочу, чтобы в центре внимания была наша неспособность предсказывать будущее или экстраполяция (если только нет веских доказательств, которые возражают против прогнозирования тенденций данных на 6 лет вперед). Внимание должно быть сосредоточено на том, достаточно ли хорошо наше знание текущих тенденций, чтобы дать нам правдоподобную оценку со стороны данных, и достаточно ли хорошо наше знание мира, чтобы дать правдоподобную оценку со стороны «песчинки».
Утверждение, по крайней мере, возможно, хотя существует большая неопределенность как в оценке количества песчинок на мировых пляжах, так и в общем количестве хранимых байтов. Что сразу очевидно, так это то, что текст в новостной статье, на которую вы ссылаетесь, указывает на корреляцию между ежедневным количеством создаваемых байтов и количеством фактически сохраненных байтов. Я даже не буду угадывать соотношение, но я бы предположил, что большая часть «созданных байтов» предназначена для немедленного использования и на самом деле нигде не хранится постоянно.
Ответ, упомянутый фанатом рэчера в своем комментарии, уже связан с оценками количества песчинок на Земле. Источники чисел (от 7,5 * 10 ^ 18 для пляжей мира до 10 ^ 20-10 ^ 24 для общего количества песчинок), очевидно, являются лишь приблизительными оценками. Я не могу найти более надежные цифры и сомневаюсь, что они вообще существуют.
« Международная корпорация данных» регулярно публикует отчеты о предполагаемом глобальном хранении данных и прогнозируемом развитии. В их последнем отчете « Цифровая вселенная в 2020 году» глобальное количество байтов, хранящихся в 2012 году, оценивается как 2,9x10^21, а в 2020 году оно увеличится до 4x10^22. имеет по крайней мере некоторые подробности о том, как производятся числа.
Поскольку в статье указано только ожидаемое соотношение между количеством песчинок и количеством хранимых байтов (57), а не абсолютное число для любого из сравниваемых значений, конечно, трудно сказать, правильно ли они выполнили свои расчеты. Оценки количества песчинок различаются более чем в 100 000 раз, а оценки количества хранимых байтов (как для 2012, так и для 2020 года) находятся где-то посередине.
матовый черный
храповик урод
Майк Данлави