Программное обеспечение для хранения и удобной визуализации многомерных срезов данных

У меня есть несколько сотен значений, каждое из которых соответствует набору функций из разных измерений. Например, значение — это цена , размеры — это:

  • Фрукты: яблоки, апельсины, бананы (перечисленное измерение)
  • Происхождение: США, Аргентина, Марокко, ...
  • Месяц: Фев 2014, Янв 2014, Декабрь 2013, ...
  • Минимальный объем закупки: 1 кг, 10 кг, 1000 кг (псевдомера)

Я ищу кроссплатформенное программное обеспечение для хранения таких данных и удобной визуализации срезов данных: рисование различных диаграмм (3D, с накоплением, площадь, процент, гистограмма), выбор нескольких функций для осей.

Примеры:

  • Линейный график с ценами на яблоки из Аргентины за 1 кг (месяц по оси X).
  • Гистограмма с ценами на апельсины, расположенная по оси X и сгруппированная по минимальному объему покупки.
  • Трехмерная диаграмма с ценами на бананы, месяц по оси X, минимальный объем по оси Y, цены усреднены по происхождению.
Время тоже было бы неплохо, со сжатием за этот месяц/последний месяц или за апрель для данных за каждый год.

Ответы (2)

Я бы порекомендовал Pentaho для этого.
Это не совсем легко, но и не слишком сложно, как только вы поймете концепцию.

У вас есть много вариантов для вставки ваших данных (например, CSV).
Затем вы можете сгенерировать детализацию по нужным вам измерениям и создать красивые графики.

Вы также можете определить автоматически обновляемые информационные панели и отчеты.

Community Edition (CE) имеет открытый исходный код (лицензия Apache 2) и его можно найти здесь .
Я использовал его в Linux и Windows, но он также работает и в Mac OS X.

введите описание изображения здесь

Бесплатную версию сообщества нелегко найти на веб-сайте — вам нужно зайти на сайт community.pentaho.com , чтобы найти ее. Также я не думаю, что «соглашение об участии» будет соответствовать требованиям ЛЮБОЙ лицензии с открытым исходным кодом.
В Википедии указано, что Community Edition находится под лицензией Apache 2, что означает открытый исходный код. Я не видел никакого «соглашения об участии» при загрузке с sourceforge.net/projects/pentaho/files

Я настоятельно рекомендую взглянуть на python +, если ваши данные действительно большие pyTables и MatPlotLib , или для средних размеров данных Pandas - в любом случае вы получите бесплатное, кросс-платформенное, полностью настраиваемое представление ваших данных.

Есть только сотни, максимум несколько тысяч значений. Панды выглядят интересно. Мне не нужно анализировать данные (средние значения, распределения и т. д.), нужно только визуализировать. У меня есть небольшой опыт работы с Matplotlib, и этого я бы хотел избежать. Matplotlib мощный, но не простой.
Взгляните на примеры по адресу: pandas.pydata.org/pandas-docs/stable/rplot.html .
Все это звучит красиво, и я лично использую их для всего, но в основном это требует от него написания собственного программного обеспечения. Хотя OP может это сделать, это не поможет тому, кто, например, хочет отказаться от Excel.