Я использую компьютеры около 16 лет, никогда не использовал Excel или подобное программное обеспечение, может быть, один раз. Итак, мои знания Excel равны 0. Может быть, то, о чем я собираюсь спросить, легко, а может и нет. Первая часть вопроса:
У меня есть большой файл excel, который я редактирую в Gnumeric, а также есть офис kingsoft, который выглядит так
Меня интересует cloumn D, E, F, G, H, I
. Каждый ранг представляет собой последовательность.
3,4,6,12,16,19
является последовательностью. 1,6,21,24,38,42
другая последовательность.
Я хочу сравнить эти последовательности и посмотреть, повторяется ли последовательность более одного раза. Порядок не имеет значения. например 3,4,6,12,16,19
, это та же последовательность, что и 19,4,6,12,16,3
, это дубликат.
Я хочу представить их в диаграмме, которая выделяет дубликаты и, если возможно, даты создания повторяющейся последовательности. Даты указаны в столбце B
и C
.
Я использую Xubuntu 14.04 64 бит.
Поскольку вы все равно окажетесь на python, почему бы просто не прочитать файл Excel напрямую, используя python, и не выполнить там любую обработку, которую вы хотите? Я все время использую xlrd для python, и он отлично работает.
http://installion.co.uk/ubuntu/saucy/universe/p/python-xlrd/install.html
Не специфично для xubuntu, но должно быть достаточно близко
Определенно, это больше о программировании.
Когда вам нужно из программы - экспортировать данные (таблицу) в CSV (в общем, это просто строки, разделенные запятыми).
Большинство табличных процессоров могут экспортировать в CSV и импортировать CSV.
Согласно документам Gnumeric (ниже таблицы примечание)
Files in the file formats marked as Save/Open can be opened or saved with the
Open, Save, and Save As menu items in the File menu. Files in the file formats
marked as Import/Export can be imported or exported with the items on the Import
Data and Export Data submenus of the Data menu.
После экспорта в CSV данные можно обработать скриптом – сгенерировать еще один CSV-файл, который можно импортировать обратно в программу.
Вы можете работать с Excel без навыков программирования!
Сделайте 6 новых столбцов, напримерAA1...AF1
Отсортируйте шесть значений D, E, F, G, H, I
: сделайте AA1
минимум с помощью =SMALL(D1:I1,1)
, AB1
второй минимум с =SMALL(D1:I1,2)
и так далее.
Затем сделайте AG1
конкатенированную последовательность с= AA1 & "-" & AB1 & "-" & ...
После этого вы можете отсортировать лист Excel по значениюAG1
Найти дубликаты легко с помощью формулы в столбце AH
, например. для AH40
:=IF(AG39<>AG40;"";"duplicate")
Надеюсь, ты понял. Веселиться!
Линоб
Мартин Тома
Линоб
Мартин Тома