Лучшие модели для «исследовательского» кода?

Question

Лучшие модели для «исследовательского» кода?

Бен

Я был профессиональным разработчиком программного обеспечения в течение ряда лет, я также являюсь академическим исследователем, и мои исследования включали множество разработок программного обеспечения.

Иногда мне кажется, что мой промышленный опыт мешает моим исследованиям, поскольку цели написания программного обеспечения в исследовательском контексте кажутся противоречащими целям в промышленности.

В промышленности код должен быть (в идеале): пригодным для сопровождения, без ошибок, реорганизованным, хорошо документированным, тщательно протестированным — хорошего качества — лучшие практики говорят, что эти вещи стоят времени (я согласен).

В научных кругах цель состоит в том, чтобы написать как можно больше качественных исследовательских работ в кратчайшие сроки. В этом контексте код пишется для запуска эксперимента, и его, возможно, никогда больше не будут рассматривать (о нас судят по нашим документам, а не по нашему коду). Кажется, нет никакой мотивации писать проверенный, поддерживаемый, документированный код — мне просто нужно запустить его и получить результат в моей статье или что-то в этом роде как можно скорее. Следовательно, «академический» код, который я написал, имеет низкое качество — с точки зрения разработки программного обеспечения.

Проблема в том, что я либо трачу слишком много времени (без необходимости) на доведение своего «исследовательского» кода до отраслевого качества, либо публикую работу, основанную на «плохом качестве» кода, и чувствую себя мошенником.

Мой карьерный рост зависит от того, напишу ли я «плохой» код!?

«Ремесло» разработки программного обеспечения — обширная тема, но где лучшая практика для академических исследований? Никто не пишет модульные тесты для кода конференции!

Кто-нибудь встречал их в похожей ситуации? Кто-нибудь знает о формальных методологиях для «исследовательского» кода?

ff524

По теме: Почему многие талантливые ученые пишут ужасные программы?

Петр Мигдаль

@Ben Вы сами отвечаете на свой вопрос (когда речь идет о качестве кода и стимулах), не так ли?

ff524

Есть также связанный с этим вопрос по SO: как я могу написать хороший «исследовательский код»?

ff524

И (также на SO): хорошие стратегии для разработки одноразового кода?

Бен

Я предполагаю, что мое настоящее разочарование заключается в том, что без небольшой формализации подхода к «исследовательскому» коду трудно учиться у других дисциплине написания «исследовательского кода» и более широкому ремеслу в этом контексте. Нет ни блогов, ни книг, ни передового опыта, ни возможности учиться и совершенствоваться!

Петр Мигдаль

Хороший код в академических кругах — это то же самое, что и хороший код в промышленности. Так что, по сути, одни и те же книги, блоги, лучшие практики и места для обучения должны работать. Во многих местах исследователи изучают его, начинают использовать языки общего назначения и совместно работают над кодом в рамках VCS. Но пока им платят и продвигают за документы (даже с закрытым доступом), а не за код (даже с открытым исходным кодом), код будет инструментом, а не приоритетом (к сожалению).

хЛейтикс

@PiotrMigdal Хороший код делает то, что требуется. Не меньше, но уж точно не больше. Если вы создаете одноразовый демонстратор для конференции, используя TDD со 100-процентным покрытием тестами, непрерывной интеграцией, строгим отслеживанием проблем и управлением выпусками, вы переусердствуете. Не весь код должен быть ремонтопригодным, и многие исследовательские прототипы, безусловно, в этом не нуждаются.

Бен

Здесь возникает этический вопрос. Если я представлю результаты в статье и не получу полного покрытия тестами (кто это делает в этом контексте?), код, скорее всего, будет содержать ошибки, а это значит, что результаты, которые я представляю, могут быть неверными, и я знаю, что они ошибаются, но я все еще публикую статью. Я думаю, это часть неписаной культуры. Я не имею в виду претензию на то, чтобы превзойти современное состояние, я говорю о небольших несоответствиях в производительности, в более общем плане - тестовое покрытие не считается необходимым для «добросовестных» экспериментов в CS? Я полагаю, это зависит от заявленного вклада.

хЛейтикс

@ Бен Да, это зависит от того, что вы утверждаете и как будут выглядеть ваши тесты. Если вы создадите, скажем, алгоритм машинного обучения и сможете получить лучшие результаты классификации на стандартном наборе данных, чем на современном уровне техники, я верю вам, даже если у вас нет ни одного модульного теста (потому что ошибка очень маловероятна). классифицировать лучше , чем ожидалось).

Петр Мигдаль

@xLeitix Не так много статей с числовыми результатами ссылаются на их код. И для численного моделирования вы не всегда заявляете, что делаете лучше, чем ожидалось, но, например, обнаруживаете, что в такой-то модели параметр X выше, чем для другой модели.

Бен

@xLeitix - действительно хороший момент, полностью согласен. Окончательный отказ или убедительное доказательство того, что техника X не подходит для решения проблемы Y, — это более слабая почва.

ИЛИ картограф

@Ben: Это определенно зависит от заявленного вклада. Во многих случаях исследования CS не прототип дает результаты в эксперименте, а пользователь, который использует этот прототип. Баги, скорее всего, будут, но я вряд ли могу себе представить ситуацию, когда они могли бы несправедливо повлиять на результат (а не четко фиксироваться в эксперименте как "задача не решаемая из-за внешних факторов и не должна учитываться"), тем более положительным образом.

Стефан Коласса

(a) Если вы следуете Agile-парадигме, ваш «отраслевой» код может быть намного ближе к «исследовательскому» коду. Отсутствие ошибок и документация, кхм, не очень важны. (b) Исследовательский код с открытым исходным кодом (я специально имею в виду R-пакеты в CRAN), по крайней мере, должен пройти некоторые тесты, и я больше доверяю «основным» пакетам CRAN, чем какому-то ( кхе-кхе ) «промышленному» коду. . Итог: не все черно-белое.

Петерис

В довольно многих областях, если код является вашим фактическим исследованием (в отличие от доказательства/расчетов для какой-либо гипотезы), то он не может быть неправильным — оценочная часть кода крошечная и тривиальная по сравнению с остальной его частью. , и могут быть правильно протестированы; а если остальной код глючит, ну, тогда хороших результатов не получишь; и если это дает измеримо хорошие результаты оптимизации, то даже если это вызвано какими-то странными и неожиданными вещами в коде, то это фичи, а не баги.

ДжеффЭ

В научных кругах цель состоит в том, чтобы написать как можно больше качественных исследовательских работ в кратчайшие сроки. - [нужна цитата]

Дэвид Ричерби

Существует сильная мотивация для написания проверенного кода — вы не хотите получить репутацию автора ненужных статей, потому что ваш код с ошибками дал фиктивные результаты!

cbeleites недовольны SX

@xLeitix: есть важный (и, по моему опыту, не такой уж редкий) тип «ошибки», который приводит к красивым ложным результатам для алгоритмов машинного обучения: утечка данных между обучением и тестовыми примерами. Например, из-за путаницы с индексацией

суперлучший

На статью по этой самой теме мне посоветовал коллега: plosbiology.org/article/…

Дэвид ЛеБауэр

@superbest +1 это первое обязательное чтение для всех новых членов моей группы. Был с момента первого проекта в 2012 году. Образец цитирования: Wilson G, Aruliah DA, Brown CT, Chue Hong NP, Davis M, et al. (2014) Передовой опыт научных вычислений. PLoS Биол 12(1): e1001745. doi: 10.1371/journal.pbio.1001745

Петр Мигдаль

@ Дэвид и суперлучший: ты должен сделать это ответом.

Джошуа Тейлор

«Кажется, нет никакой мотивации писать проверенный, поддерживаемый и документированный код — мне просто нужно запустить его и получить результат в моей статье или где-то еще как можно скорее». Есть мотивация — исследование должно быть воспроизводимым. Если бы вы сообщили, что вода испаряется быстрее, чем это происходит, потому что в вашем ведре есть дырка, ваши выводы нельзя было бы воспроизвести. То же самое верно и для кода. Если кто-то повторно реализует описанные вами алгоритмы и получает другие результаты, то по крайней мере у одного из вас есть неработающий код, и результат недостаточно воспроизводим.

Лететь в

Вас может заинтересовать организация Software Carpentry — их цель — обучить ученых передовой практике разработки программного обеспечения (а также поощрять использование кода как цитируемого объекта для улучшения воспроизводимости в науке) software-carpentry.org

Дикран Сумчатый

«В научных кругах цель состоит в том, чтобы написать как можно больше качественных исследовательских работ в кратчайшие сроки». это не цель цитаты, цель должна состоять в том, чтобы написать статьи, которые окажут наибольшее влияние на область исследований, насколько это возможно, учитывая доступные ресурсы. Написание кода, побуждающего других использовать ваши методы, — ценный способ побудить других использовать ваши исследования. Нет смысла писать качественные статьи, на которые никто не ссылается.

Фабио Диас

Если вы пишете хороший код и делаете его доступным, это увеличивает вероятность того, что другие люди будут его использовать (например, для сравнения), таким образом, это потенциально увеличит количество ваших цитирований. И, конечно же, повышает воспроизводимость вашей работы. Все веские причины сделать это правильно....

сетхолополус

В качестве забавного контрпримера можно привести несколько проектов по исследованию программного обеспечения, которые не только промышленно сильны, но и широко используются в промышленности, например, LLVM, Scala, Haskell. Конечно, в этих случаях можно утверждать, что качество программного обеспечения было частью самой исследовательской проблемы.

Ответы (10)

Лучшие модели для «исследовательского» кода?

По теме: Почему многие талантливые ученые пишут ужасные программы?
@Ben Вы сами отвечаете на свой вопрос (когда речь идет о качестве кода и стимулах), не так ли?
Есть также связанный с этим вопрос по SO: как я могу написать хороший «исследовательский код»?
И (также на SO): хорошие стратегии для разработки одноразового кода?
Я предполагаю, что мое настоящее разочарование заключается в том, что без небольшой формализации подхода к «исследовательскому» коду трудно учиться у других дисциплине написания «исследовательского кода» и более широкому ремеслу в этом контексте. Нет ни блогов, ни книг, ни передового опыта, ни возможности учиться и совершенствоваться!
Хороший код в академических кругах — это то же самое, что и хороший код в промышленности. Так что, по сути, одни и те же книги, блоги, лучшие практики и места для обучения должны работать. Во многих местах исследователи изучают его, начинают использовать языки общего назначения и совместно работают над кодом в рамках VCS. Но пока им платят и продвигают за документы (даже с закрытым доступом), а не за код (даже с открытым исходным кодом), код будет инструментом, а не приоритетом (к сожалению).
@PiotrMigdal Хороший код делает то, что требуется. Не меньше, но уж точно не больше. Если вы создаете одноразовый демонстратор для конференции, используя TDD со 100-процентным покрытием тестами, непрерывной интеграцией, строгим отслеживанием проблем и управлением выпусками, вы переусердствуете. Не весь код должен быть ремонтопригодным, и многие исследовательские прототипы, безусловно, в этом не нуждаются.
Здесь возникает этический вопрос. Если я представлю результаты в статье и не получу полного покрытия тестами (кто это делает в этом контексте?), код, скорее всего, будет содержать ошибки, а это значит, что результаты, которые я представляю, могут быть неверными, и я знаю, что они ошибаются, но я все еще публикую статью. Я думаю, это часть неписаной культуры. Я не имею в виду претензию на то, чтобы превзойти современное состояние, я говорю о небольших несоответствиях в производительности, в более общем плане - тестовое покрытие не считается необходимым для «добросовестных» экспериментов в CS? Я полагаю, это зависит от заявленного вклада.
@ Бен Да, это зависит от того, что вы утверждаете и как будут выглядеть ваши тесты. Если вы создадите, скажем, алгоритм машинного обучения и сможете получить лучшие результаты классификации на стандартном наборе данных, чем на современном уровне техники, я верю вам, даже если у вас нет ни одного модульного теста (потому что ошибка очень маловероятна). классифицировать лучше , чем ожидалось).
@xLeitix Не так много статей с числовыми результатами ссылаются на их код. И для численного моделирования вы не всегда заявляете, что делаете лучше, чем ожидалось, но, например, обнаруживаете, что в такой-то модели параметр X выше, чем для другой модели.
@xLeitix - действительно хороший момент, полностью согласен. Окончательный отказ или убедительное доказательство того, что техника X не подходит для решения проблемы Y, — это более слабая почва.
@Ben: Это определенно зависит от заявленного вклада. Во многих случаях исследования CS не прототип дает результаты в эксперименте, а пользователь, который использует этот прототип. Баги, скорее всего, будут, но я вряд ли могу себе представить ситуацию, когда они могли бы несправедливо повлиять на результат (а не четко фиксироваться в эксперименте как "задача не решаемая из-за внешних факторов и не должна учитываться"), тем более положительным образом.
(a) Если вы следуете Agile-парадигме, ваш «отраслевой» код может быть намного ближе к «исследовательскому» коду. Отсутствие ошибок и документация, кхм, не очень важны. (b) Исследовательский код с открытым исходным кодом (я специально имею в виду R-пакеты в CRAN), по крайней мере, должен пройти некоторые тесты, и я больше доверяю «основным» пакетам CRAN, чем какому-то ( кхе-кхе ) «промышленному» коду. . Итог: не все черно-белое.
В довольно многих областях, если код является вашим фактическим исследованием (в отличие от доказательства/расчетов для какой-либо гипотезы), то он не может быть неправильным — оценочная часть кода крошечная и тривиальная по сравнению с остальной его частью. , и могут быть правильно протестированы; а если остальной код глючит, ну, тогда хороших результатов не получишь; и если это дает измеримо хорошие результаты оптимизации, то даже если это вызвано какими-то странными и неожиданными вещами в коде, то это фичи, а не баги.
В научных кругах цель состоит в том, чтобы написать как можно больше качественных исследовательских работ в кратчайшие сроки. - [нужна цитата]
Существует сильная мотивация для написания проверенного кода — вы не хотите получить репутацию автора ненужных статей, потому что ваш код с ошибками дал фиктивные результаты!
@xLeitix: есть важный (и, по моему опыту, не такой уж редкий) тип «ошибки», который приводит к красивым ложным результатам для алгоритмов машинного обучения: утечка данных между обучением и тестовыми примерами. Например, из-за путаницы с индексацией
На статью по этой самой теме мне посоветовал коллега: plosbiology.org/article/…
@superbest +1 это первое обязательное чтение для всех новых членов моей группы. Был с момента первого проекта в 2012 году. Образец цитирования: Wilson G, Aruliah DA, Brown CT, Chue Hong NP, Davis M, et al. (2014) Передовой опыт научных вычислений. PLoS Биол 12(1): e1001745. doi: 10.1371/journal.pbio.1001745
@ Дэвид и суперлучший: ты должен сделать это ответом.
«Кажется, нет никакой мотивации писать проверенный, поддерживаемый и документированный код — мне просто нужно запустить его и получить результат в моей статье или где-то еще как можно скорее». Есть мотивация — исследование должно быть воспроизводимым. Если бы вы сообщили, что вода испаряется быстрее, чем это происходит, потому что в вашем ведре есть дырка, ваши выводы нельзя было бы воспроизвести. То же самое верно и для кода. Если кто-то повторно реализует описанные вами алгоритмы и получает другие результаты, то по крайней мере у одного из вас есть неработающий код, и результат недостаточно воспроизводим.
Вас может заинтересовать организация Software Carpentry — их цель — обучить ученых передовой практике разработки программного обеспечения (а также поощрять использование кода как цитируемого объекта для улучшения воспроизводимости в науке) software-carpentry.org
«В научных кругах цель состоит в том, чтобы написать как можно больше качественных исследовательских работ в кратчайшие сроки». это не цель цитаты, цель должна состоять в том, чтобы написать статьи, которые окажут наибольшее влияние на область исследований, насколько это возможно, учитывая доступные ресурсы. Написание кода, побуждающего других использовать ваши методы, — ценный способ побудить других использовать ваши исследования. Нет смысла писать качественные статьи, на которые никто не ссылается.
Если вы пишете хороший код и делаете его доступным, это увеличивает вероятность того, что другие люди будут его использовать (например, для сравнения), таким образом, это потенциально увеличит количество ваших цитирований. И, конечно же, повышает воспроизводимость вашей работы. Все веские причины сделать это правильно....
В качестве забавного контрпримера можно привести несколько проектов по исследованию программного обеспечения, которые не только промышленно сильны, но и широко используются в промышленности, например, LLVM, Scala, Haskell. Конечно, в этих случаях можно утверждать, что качество программного обеспечения было частью самой исследовательской проблемы.

хЛейтикс · Answer 1

Я думаю, что ключом к пониманию исследовательского кода для разработчиков промышленного программного обеспечения является признание того, что обычно вы не создаете продукт . У вас нет клиентов как таковых. Вы создаете программное обеспечение, чтобы доказать свою точку зрения.

Таким образом, большая часть кода, который вы пишете как исследователь, больше похожа на одноразовые прототипы и мокапы, которые вы (в промышленности) часто пишете на ранних этапах проекта. Как вы, конечно, знаете, даже в промышленности эти макеты имеют совсем другие свойства, чем окончательное программное обеспечение. В первую очередь им необходимо:

Имейте именно те функции, которые вы хотите показать клиенту. Не больше, не меньше. Как правило, все скучные стандартные функции для домена опускаются.
Нужно сделать быстро . И вы, и заказчик знаете, что прототип все равно выбросят, поэтому неважно, ремонтопригоден ли код.
Необходимо, чтобы его было легко расширять и адаптировать, оптимально использовать во время демонстрации.

По сути, те же свойства также полезны для большинства одноразовых исследовательских программ. Вы не хотите создавать функции, которые вам не нужны. Вы не хотите тратить время на написание, например, поддерживаемого кода, если знаете, что он не будет поддерживаться. Вы хотите использовать среду, которая уменьшает объем шаблонного кода и настройки и которая, возможно, автоматически генерирует для вас много кода, который «достаточно хорош» для вашего демонстрационного примера (на ум приходит Ruby on Rails и его функции создания шаблонов).

Мой карьерный рост зависит от того, напишу ли я «плохой» код!?

Нет, это зависит от того, пишете ли вы код, подходящий для этой цели. Как и в промышленности. В промышленности и академических кругах никто не аплодирует вам за ненужные качества программного обеспечения. Попробуйте пересмотреть смысл кода , который вы пишете. Если вы планируете выпустить свой код как программное обеспечение с открытым исходным кодом и ожидаете, что его подхватят другие люди по всему миру, тогда сходите с ума — используйте все инженерные методы, которые вы также использовали в отрасли, чтобы создать лучший продукт, какой только сможете. Если ваша цель — оценить этот один алгоритм или принцип для вашей конференции, а затем выбросить код, то вы также можете жить счастливо, не написав ни единого модульного теста, нисколько не чувствуя себя мошенником.

РЕДАКТИРОВАТЬ: конечно, это не означает, что допустимо писать код, в котором вы не уверены, правильно ли вы реализовали указанный алгоритм . Обеспечение того, что вы действительно показали то, что, как вы утверждаете, показали, является обязательным , особенно в исследовательском коде.

Для исследовательского кода он может быть настолько небрежным и плохо спроектированным, насколько вы хотите, если вы не собираетесь использовать его позже, публиковать его как открытый исходный код или поддерживать его в будущем. Но особенно для исследований я бы сказал, что юнит-тесты , вероятно, одни из ваших лучших друзей — потому что в случае, если кто-то захочет проверить валидность самого кода, действительно работающего по назначению (даже если результаты исследования верны), то модульные тесты будут там, чтобы поддержать вас. Они также полезны для разработки через тестирование, что, я считаю, очень хорошо подходит для области исследований.
Ключевая фраза: «написание кода, подходящего для цели». Отличный ответ.
re: «Если вы планируете выпустить свой код с открытым исходным кодом [...]». Слишком часто это решается после построения «прототипа» на песке. Когда такие системы развертываются и закрепляются (а они это делают!), они создают столько же проблем, сколько и решают.

суперлучший · Answer 2

Я исследователь и разработчик-самоучка. Я сделал существенные проекты, которые были в основном основаны на программном обеспечении. Хотя моя работа далека от самых «хардкорных» вещей с точки зрения сложности и масштаба, проекты были достаточно большими, чтобы наивные ошибки (например, отсутствие контроля версий или плохое документирование кода) были очень болезненными. В итоге я изучил немало «лучших практик» методом проб и ошибок.

Я также был получателем «необслуживаемого кода, переданного коллеге-исследователю»:

введите описание изображения здесь

мой промышленный опыт мешал моему исследованию

Нет, вы в основном пришли из цивилизованной среды, которая решала эти проблемы десятилетия назад, в среду, которая застряла в каменном веке с точки зрения гигиены разработки программного обеспечения. Ученые до сих пор пишут код так, как будто сейчас 60-е. Конечно, вы чувствуете конфликт, но вина не на вас.

В промышленности код должен быть (в идеале): удобным для сопровождения, без ошибок, рефакторингом, хорошо документированным, тщательно протестированным.

Допустим, спикер на научной конференции, описывая вычислительную часть своего исследования, сказал одно из следующего:

" Код, который я написал для этого исследования, по общему признанию... "

... неподдерживаемый (и удачи в моих исследованиях!)
... полный ошибок (и я понятия не имею, правильный ли вывод!)
... нечитаемые спагетти (и я даже не знаю, как это работает, не говоря уже о том, правильно ли оно работает!)
...недокументировано (и все ошибки скрыты от рецензентов!)
... не проверено (так что бог знает, делает ли он то, что я говорю / думаю, что он делает!)

Вы ожидаете, что аудитория отреагирует чем-либо, кроме презрения и возмущения? Если бы я услышал такое, я бы больше никогда не поверил ничему, что опубликовал этот человек.

В академических кругах цель состоит в том, чтобы (...) в кратчайшие сроки.

Да, но " не короче ". Вы не пропускаете жизненно важные контрольные эксперименты, потому что «контроль требует времени». Вы не можете экономить на качестве кода по очень похожим причинам.

Кажется, что нет мотивации писать [хороший код]

Потому что это эндемическая проблема академических кругов. Хотя компьютеры использовались в науке на протяжении десятилетий, кажется, что алгоритмы стали важной частью исследований только в последнее десятилетие или около того (возможно, из-за «больших данных»). Когда вы основываете свое исследование на коде, этот код должен быть хорошего качества. Недостаточно просто запустить какой-нибудь глючный скрипт только для записи и покончить с этим. Сообщество разработчиков программного обеспечения давно во всем этом разобралось, но научное сообщество еще не прижилось — я думаю, причина в том, что большинство ученых не имеют формального бэкграунда в разработке программного обеспечения, и не было достаточно громких скандалов в исследованиях, вызванных из-за плохой практики программирования (например, ключевые результаты высококлассной статьи оказываются артефактами, вызванными ошибками).

Учтите, что во многих дисциплинах рецензенты даже не будут спрашивать об исходном коде вашей статьи, требующей большого объема вычислений. Как же тогда они могут оценить достоверность ваших результатов? Они не могут, и это провал существующей в настоящее время модели экспертной оценки.

Извините за разглагольствования, но в основном это так: Как вы знаете, есть очень веские причины для написания качественного кода, даже если никто не наблюдает за вами через плечо. В науке сейчас так бывает, что никого не волнует, хорош твой код или нет. Но это не должно быть причиной для того, чтобы вы не писали хороший код — причины написания хорошего кода в отрасли по-прежнему в значительной степени относятся к науке.

К сожалению, вы можете не получить вознаграждение за дополнительную работу. Вас могут даже наказать, потому что, как вы говорите, хороший код занимает больше времени, и другие могут не видеть дальше этого. Ваш PI или коллеги могут не понять, почему вы так медленнее. Лучшее, что вы можете сделать, это объяснить им необходимость хороших практик.

Очевидно, что есть исключения. Например, вам не нужно беспокоиться о переносимости или обратной совместимости со старыми версиями ОС для кода, предназначенного для работы на выделенном лабораторном компьютере (хотя нежелательно писать свой код таким образом, чтобы он работал только в очень экзотическом среду, которую другие ученые не смогут легко реконструировать). Но в целом я считаю, что отраслевые практики все еще применимы, и исключения можно легко обнаружить, приложив немного критического мышления. Тем не менее, есть также полезная публикация под названием " Best Practices for Scientific Computing ", в которой подробно рассматривается этот вопрос.

В конечном счете, это этическое решение, которое вы должны принять. Вы заботитесь о том, чтобы заниматься наукой превыше всего? Следуйте рекомендациям. Вы хотите срезать углы, которых не должны (в этическом смысле), сэкономить время или избежать трений с коллегами? Я не мог бы рекомендовать вам сделать это, в принципе. Но очевидно, что многие люди это делают, и, возможно, на практике некоторые ученые вынуждены это делать — хотя, опять же, разве неспособность заниматься хорошей наукой в силу обстоятельств оправдывает плохую науку?

Кроме того, как я уже сказал, я думаю, что часть проблемы в том, что не было больших скандалов. Если вы экономите на качестве кода, есть шанс, что он вас настигнет. Возможно, вы даже станете одним из тех больших скандалов. По общему признанию, риск, вероятно, невелик... Но, я думаю, вы понимаете мою точку зрения.

«Если бы я услышал такое, я бы больше никогда не поверил ничему, что этот человек опубликовал» — следовательно, никто не публикует действительно код.
Отсутствие формальных тестов не означает, что я не знаю, работает ли это. Обычно, когда я пишу функцию, я проверяю ее правильность, но не трачу время на написание полной структуры модульного теста. Это означает, что я вполне уверен, что он будет работать, пока я не проведу его рефакторинг. Кроме того, добавление в код нескольких утверждений помогает корректности.
@Davidmh Вы правы в том, что непроверенная функция не обязательно неверна. Но я думаю, что тесты являются доказательством того, что это так.
«Учтите, что во многих дисциплинах рецензенты даже не спросят об исходном коде вашей статьи с большим объемом вычислений. Как же они могут тогда оценить достоверность ваших результатов? Они не могут, и это провал модели рецензирования. в том виде, в каком он существует в настоящее время». Это проблема всех академических исследований: исследователь продвигает свою карьеру, высказывая точку зрения, и его методы редко проверяются дважды (почти никогда до следующего решения о гранте или сроке пребывания в должности). Существует огромный стимул срезать углы и заполнять пробелы чушью.
@adam.r Но есть большая разница. Для лабораторных экспериментов вы должны очень подробно указать, где были получены реагенты и как проводились эксперименты, до такой степени, что кто-то может повторить эксперимент, прочитав вашу статью. Конечно, некоторые рецензенты плохо справляются со своей работой, и, как следствие, есть статьи с очень расплывчатыми разделами методов, но написание методологии считается обязанностью рецензента/автора. Но публикация или рецензирование исходного кода во многих случаях не рассматривается как такая ответственность.
+1 хороший, честный ответ. Некоторые другие ответы просто говорят: «Примите это и напишите код низкого качества - это академическое сообщество, а не промышленность».

Александрос · Answer 3

Я либо трачу слишком много времени (без необходимости) на доведение моего «исследовательского» кода до отраслевого качества

Не. Сделайте это как можно лучше в течение предложенного периода времени. Стремление к 100% совершенству, которое потребует вдвое больше времени, не стоит того. В этом смысле исследования точно такие же, как и промышленность.

Следовательно, «академический» код, который я написал, имеет низкое качество.

Это не означает, что весь академический код имеет низкое качество. Если вы посмотрите статьи на конференциях по алгоритмам или системах параллельной обработки, вы увидите, что разработчики продумали даже мучительные детали, такие как переупорядочение данных для уменьшения количества промахов кэша, SIMD, программирование графического процессора, хранилище SSD и т. д. Обычно передовые исследования алгоритмов CS занимают несколько лет. впереди в принятии новых методов, аппаратных технологий, прежде чем любой из этих методов действительно попадет в отрасль. С другой стороны, на более теоретических конференциях по CS код в основном является инструментом, и поэтому он не обязательно должен быть передовым. Итак, качество связано с аудиторией вашего продуктового кода (точно так же, как и индустрия).

Кто-нибудь знает о формальных методологиях для «исследовательского» кода?

Я никогда не слышал о каких-либо методах, специально предназначенных для исследования кода. Тем не менее, вы можете использовать практики из вашей отрасли (когда они действительно ускоряют процесс написания программного обеспечения). Например, система управления версиями ускоряет разработку и минимизирует ошибки/потери данных. С другой стороны, UNIT-тесты занимают много времени, которого у вас может и не быть. Неформальная вики для ошибок, документации, функций может стоить дополнительного времени, поскольку она также ускоряет написание фактической исследовательской работы. И наоборот, полноценная база данных ошибок (bugzilla) может не стоить дополнительного времени и усилий.

Итак, придерживайтесь тех отраслевых методов, методов, которые, как вы знаете, сэкономят ваше время в долгосрочной перспективе и улучшат ваше программное обеспечение, но не отнимут у вас все время. Найти золотую середину всегда лучшее решение.

С другой стороны, на более теоретических конференциях по CS код в основном является инструментом . Точнее, на более теоретических конференциях по CS кода вообще не существует.
«С другой стороны, UNIT-тесты занимают много времени, которого у вас может и не быть». Не обязательно. Кроме того, время, затрачиваемое на формулировку модульных тестов, часто помогает при проектировании (обеспечивает модульность, создает частичное техническое задание), сокращает время, затрачиваемое на отладку, и может быть использовано для подтверждения точности результатов исследования. Возможно, нет необходимости проводить модульное тестирование всего, но в случаях, когда модульное тестирование не слишком сложно, преимущества стоят вложений.
@JeffE: Вы имеете в виду, что компьютерный код не используется или просто не обсуждается на конференциях? Я нахожу первое неправдоподобным; например, кто-то, изучающий геометрическую теорию сложности, вполне может использовать компьютерный код для вычисления коэффициентов Литтлвуда-Ричардсона и других инвариантов, связанных с теорией представлений.
Я имею в виду, что код даже не написан, а тем более не используется. За 20 с лишним лет работы теоретиком-компьютерщиком я написал только одну статью, которая требовала какого-либо кода. (Некоторые из моих коллег считают, что мне должно быть стыдно за этого моллюска, но это не так.)
Ой. Информатика, да? Как насчет того, чтобы психолог написал код SAS? Как насчет того, чтобы социологи писали код SPSS (который даже не называется кодом, в SPSS он называется «синтаксисом»)? Сколько документов на этих конференциях будет иметь хороший код? Сколько психологов / социологов будут иметь только один курс компьютерных наук? Сколько из них будет знать о контроле версий, не говоря уже о модульных тестах? Это сайт академии, а не сайт информатики. Пожалуйста, будьте более инклюзивными в своем мышлении.

dmckee --- котенок экс-модератор · Answer 4

tl;dr Некоторые части отраслевых «лучших практик» хорошо вписываются, а другие части неэффективны в исследовательской среде. Сохраняйте то, что хорошо работает в этой среде.

Я физик-экспериментатор элементарных частиц, и мы пишем много кода, и большая его часть — большие проекты, написанные многими разрозненными программистами.

Некоторая часть обычного отраслевого набора инструментов, который мы используем с энтузиазмом

Контроль версий
Отслеживание ошибок
Автоматизированные системы сборки и тестирования

Другая часть либо медленнее завоевывает популярность, либо не так высоко ценится, в том числе

Формальный процесс (с большой буквы) с регулярными встречами по планированию и контрольным списком выпуска и так далее. Они появляются по мере того, как проекты становятся больше (обычно в ответ на полный сбой в контроле качества или длительные задержки выпуска). То есть мы используем их, когда они нам нужны .
Системы генерации документации довольно распространены, но используются редко, пока проект не станет большим, когда люди, которые вынуждены декодировать некоторые биты, часто добавляют немного больше документации.
Модульное тестирование разрежено и обычно концентрируется на нижних уровнях системы, но регрессионное тестирование встречается чаще.
У большинства проектов есть стандарты кодирования, но они, как правило, слабо определены и слабо соблюдаются.

Другие простые вещи не проявляются много.

Планирование функций довольно сложно, когда вы не знаете, какие умные идеи появятся у аспиранта на следующей неделе , чтобы решить проблему, которую вы еще даже не заметили.
Раньше было правдой, что строгий контроль регистрации мешал распространению экспериментальных сегментов кода, и мы просто время от времени замораживали новые проверки разработки, чтобы получить благословенный релиз (ситуация, которая отображала HEAD/trunk/что-то еще). предложение «используйте на свой страх и риск»). С появлением распределенного контроля версий все больше внимания уделяется контролю регистрации для официальной магистрали.
Рефакторинг обычно происходит только тогда, когда новый человек начинает работать с каким-то старым кодом и чувствует, что ему нужны изменения или расширения. То, что не сломано, достаточно хорошо оставлено в покое.

Из вашего вопроса я подозреваю, что вы занимаетесь кодированием либо в одиночку, либо в небольшой группе. В этой настройке детали меняются, но тон остается прежним. Просто сохраните те части вашей отраслевой практики, которые работают, и исключите или отложите те части, которые имеют наихудшее соотношение затраты/выгода с точки зрения времени/результатов.

Откажитесь от сложного рефакторинга до тех пор, пока вы не будете уверены в том, что определенная часть вашего кода будет использоваться повторно. Точно так же довольствуйтесь грубой документацией до тех пор, пока не будет показано, что код имеет постоянную жизнь. И так далее.

Re: Официальный отзыв. Я заметил одну вещь: во многих группах исследователь, разрабатывающий программное обеспечение, обладает гораздо большим опытом и знаниями, чем PI, поэтому PI трудно эффективно отслеживать прогресс; тогда как в отрасли всегда есть старший программист с соответствующим набором навыков.
Ну, в физике элементарных частиц есть старшие физики-программисты с обоими необходимыми навыками. Правда, обычно их немного на каждом проекте, но их можно найти.

Марк Клазен · Answer 5

Основная характеристика исследовательского кода (в большей степени, чем типичных программ) заключается в том, что его сложнее планировать. Исследования по определению достигают неизвестного, и это также выражается в структурах программ. Как у исследователя, у вас часто нет времени на рефакторинг, когда ваше исследование сползает в другое направление, которое должно трансформироваться в другую структуру программного обеспечения.

В типичной разработке программного обеспечения вы (должны) иметь довольно хорошее представление об окончательной функциональности, прежде чем писать одну строку кода. В исследованиях это часто не так. Программирование для исследовательских целей в основном связано с быстрым прототипированием, которое обычно выполняется иначе, чем программирование для долгосрочного использования (например, модульные тесты практически отсутствуют, использование разных языков и т. д.). Основная мантра — быстрое получение результатов, а не оптимальных с точки зрения разработки программного обеспечения.

Наконец, правильная разработка программного обеспечения — это прекрасное искусство, которым очень трудно овладеть. Даже в отраслевых условиях уродливое программное обеспечение встречается в изобилии (когда оно написано профессионалами!). Средний исследователь не имеет формального обучения написанию программного обеспечения.

Мой карьерный рост зависит от того, напишу ли я «плохой» код!?

Как исследователю, вам не платят за разработку программного обеспечения (к сожалению). Как идеалист, мне хочется верить, что со временем это изменится, но пока источники финансирования заботятся только о бумагах.

«Ремесло» разработки программного обеспечения — обширная тема, но где лучшая практика для академических исследований? Никто не пишет модульные тесты для кода конференции!

Модульные тесты служат двум основным целям: (i) подтверждают, что код работает правильно и (ii) быстро находят и устраняют проблемы, особенно после структурных изменений и рефакторинга (долгосрочное преимущество для крупных инфраструктур). Поскольку исследовательское программное обеспечение обычно довольно мало, первое преимущество является единственным, которое действительно имеет значение. Представляется, что это преимущество либо слишком мало, либо его недооценивают (опять же, напомним, что большинство исследователей не инженеры -программисты).

Кто-нибудь встречал их в похожей ситуации? Кто-нибудь знает о формальных методологиях для «исследовательского» кода?

Если вы хотите изменить мир, начните с себя. Я лично стараюсь предоставлять программное обеспечение вместе с рукописью всякий раз, когда это разумно. Я также постоянно прошу код в качестве рецензента, хотя это кажется необычным.

Это похоже на ответ на вопрос «Почему многие талантливые ученые пишут ужасные программы?» , а не к текущему вопросу о передовом опыте.

Рафаэль · Answer 6

Вместо того, чтобы говорить о различиях с отраслевой разработкой программного обеспечения (в которой у меня нет опыта), я хотел бы поговорить о том, что вы должны делать в академических кругах. Я буду предполагать, что ваш код существует не сам по себе, а связан с каким-то научным утверждением, таким как «E. coli разделяет геном foo с людьми» или «Алгоритм A превосходит алгоритм B в сценарии Z».

Лучшее усилие

Хотя вашей целью не является продуктивное использование с привязкой к нему дохода, вы должны иметь разумную степень уверенности в том, что ваш код делает то, что вы заявляете, и может быть понят (проверен экспертами!) заинтересованными сторонами. То есть писать понятный код, комментировать и документировать. И (юнит-) тест.

По крайней мере, помните, что через некоторое время вам , возможно, придется вернуться к своему собственному коду. Вы создаете прототип, но ваш следующий может повторно использовать его части. Или вы хотите, чтобы студенты расширили его.
Доступность

Чтобы поддержать научную оценку вашей работы (фальсифицируемость, воспроизводимость), другие исследователи должны иметь возможность компилировать и выполнять ваши программы.

Поэтому вы должны предоставить исходники, файлы сборки/инструкции и любые входные данные, которые вы использовали в своей работе. Имейте в виду, что кто-то может захотеть собрать вашу программу спустя годы после первоначальной публикации, поэтому убедитесь, что исходные коды все еще существуют, а процесс/инструкции сборки достаточно надежны во времени (упомяните версии библиотек). Пользовательский интерфейс не слишком важен, но здесь также применимо «максимальное усилие».

Рассмотрите возможность размещения своего кода на Github или аналогичной платформе (например, вашей собственной ). Таким образом, вы можете легко публиковать обновления и собирать ошибки. См. также здесь и здесь .
Лицензирование

Вы должны сказать что-то о том, что другие (в частности, коллеги-исследователи) могут или не могут делать с вашим кодом. Вы можете использовать любую лицензию (я бы сказал, что она должна разрешать, по крайней мере, свободы GPL). CRAPL стоит посмотреть .
Справедливая оценка

Если ваш алгоритм/код является артефактом, который вы предлагаете (как лучший), вы должны сравнить его с существующими решениями. Обязательно используйте сопоставимые входные данные, повторите эксперимент для альтернатив и следуйте основным экспериментальным методам (например, ознакомьтесь с работой МакГеока). Убедитесь, что ваше сравнение включает принятые стандарты в вашей области, если таковые имеются; если ваш подход дает другие результаты, вы должны объяснить, почему (это нормально/правильно/лучше).

Доступность, пожалуй, самый важный пункт. Код исследования должен быть общим. Я думаю, что это невозможно переоценить, и это одна из главных проблем во всей вычислительной науке. Помимо, скажем, физики, у нас есть возможность легко делиться и воспроизводить (большинство) экспериментальных установок — мы должны этим пользоваться.

Лично я не понимаю, почему любая статья, которая основывает свои утверждения на вычислениях, которые рецензенты (и другие стороны) не могут воспроизвести, имеет какое-либо право на публикацию.

Одно напоминание для всех типов теории:

Остерегайтесь ошибок в приведенном выше коде; Я только доказал, что это правильно, не пробовал.
_{Дональд Э. Кнут}

«Все возможное» означало, что если у вас нет опыта программирования, о котором можно было бы говорить, не делайте этого . Наймите человека, чтобы сделать это.
Надеюсь, вы не серьезно рекомендуете лицензию CRAPL, что является фарсом. Пример: «Прочитав это предложение, Вы согласились с условиями настоящей Лицензии». Если бы лицензии работали таким образом, у нас у всех были бы большие проблемы!
@wjl: я думаю, что стоит посмотреть, как я уже сказал. Есть интересные мысли, имхо.
Это единственный ответ, в котором говорилось о воспроизводимости . Разве это не должно быть краеугольным камнем науки? Если ваш код не работает или не может использоваться иначе, ваше так называемое «исследование» не может быть воспроизведено и не должно быть опубликовано в первую очередь.

Кейт · Answer 7

Я думаю, ваша проблема в том, что вы видите качество как бинарное.

Будь то в промышленности или в научных кругах, нам нужно делать выбор в отношении конкретных целей в области качества. «Промышленная» часть программного обеспечения может быть критически важной с точки зрения безопасности и требовать максимально достижимого уровня качества, или это может быть внутренний инструмент разработки.

Целями качества могут быть:

Время безотказной работы
- Вас наверное это не волнует
Надежность
- Вам нужно будет работать с большим количеством разных наборов данных или это будет один?
Возможность повторного использования
- Будет ли процессинг включен в следующую проблему, над которой вы будете работать?
Возможность проверки
- Работает ли он так, как должен? Что бы это значило, если бы вы опубликовали, а это неправда?
Возможность проверки
- Выдает ли он правильный ответ? [Надеюсь, это имеет значение. ]
- Другой способ проверки правильности ответа может означать, что не имеет значения, ошибочна ли логика.
Необходимо поддерживать
- Себя
- Другой эксперт
- Какой-то случайный студент
- Или обязательно выбросить.
Подходит для обнародования для использования другими для проверки или повторного использования вашей работы.
И т. д.

Сформулировав ваши цели в области качества, ваша система разработки и сборки должна быть достаточной для достижения этих целей и не более того. Обратите внимание, что это может варьироваться от проекта к проекту.

Тони Хопкинсон · Answer 8

Меня направил на этот вопрос парень в ответ на мой запрос на разъяснение «Почему они использовали тип с плавающей запятой в качестве ключа для хэша». Сейчас мне это не показалось хорошей идеей. Немного повозившись взад-вперед, спрашивающий направил меня сюда как причину, по которой они это сделали.

Это было интересно, как и сам вопрос.

Вас уговаривают писать плохой код для достижения определенных академических целей? Да еще на курсах CS могу добавить. По крайней мере плохо с точки зрения понятности. Однако, как мы все слишком хорошо знаем, нас «уговорили» писать такой же плохой код в коммерческой среде, или наших лордов и хозяев убедили написать для них плохой код....

Не говоря уже о тривиальных реализациях алгоритмов. Например, следует ли использовать i и j в качестве переменных цикла в алгоритме пузырьковой сортировки или вообще использовать пузырьковую сортировку. Мой ответ на ваш вопрос будет другим. Как хорошие принципы разработки программного обеспечения помогают вам в достижении ваших целей?

Могли бы, скажем, хорошее название, принципы SOLID, согласованность и взаимосвязь и т. д. помочь вам достичь цели более эффективно? Мой ответ был бы почти уверен. Они предназначены для этого в любом нетривиальном программном обеспечении. Для этого они и созданы, чтобы создать программное обеспечение, которое можно было бы изменить с меньшими затратами. Неважно, что вы не являетесь (или, по крайней мере, не можете предвидеть) второй версией, реализация не приходит вам в голову, поэтому она будет меняться.

Если вы не уверены, какой код вам нужно написать, то что-то вроде TDD также поможет, если у вас есть готовая среда модульного тестирования. Даже без этой «роскоши» писать тестируемый код не получится.

У вас есть огромное преимущество перед вашими товарищами, у которых нет опыта разработки программного обеспечения, вы должны быть в состоянии избавиться от этого раздражающего бинарного упражнения быстрее, добраться до сути своей цели с меньшими усилиями, а затем быть способен затрачивать больше усилий на достижение реальной цели.

Однажды у меня была дискуссия с академически квалифицированным типом, который сказал мне, что рефакторинг — это просто шутки эстетов программного обеспечения, и что я должен был написать программное обеспечение правильно в первую очередь. Излишне говорить, что мое уважение к этому человеку упало на одну-две ступени, что было очень неудачно для него, поскольку он не зарабатывал так много с самого начала.

Подводя итог, я бы сказал, что разумным вариантом было бы использовать передовые методы разработки программного обеспечения во всех своих усилиях. Просто для ясности, хотя писать хороший код, который вам не нужен, не является хорошей практикой разработки программного обеспечения...

Перефразируя Гэндальфа: «Будь проще, будь в безопасности».

Что касается того, следует ли вам использовать поплавок в качестве ключа для хеширования, чтобы сэкономить время. Если вы без малейших сомнений знаете, выбирая этот компромисс дизайна, что проблемы с этим не вызовут у вас проблем, тогда, возможно. Но количество усилий, необходимых для уклонения от этого компромисса, довольно тривиально, и вы только что потратили время на то, чтобы решить проблему с использованием числа с плавающей запятой в качестве ключа. я считаю так

В любой коммерческой или академической среде выбор более низкого качества является как преимуществом, так и затратами, изучите и то, и другое....

СеФ · Answer 9

Если бы я мог добавить краткую версию более точных ответов выше, я бы сказал:

Академия -> прототипы.
Промышленность -> продукты.

Продукты и прототипы не должны рассматриваться в соответствии с одними и теми же стандартами.

Прототипы могут иметь более короткую документацию и могут потребовать некоторых усилий для развертывания. Их также можно использовать в одной операционной системе с очень специфическими требованиями, например, в тех, где исходный код был разработан.

Тем не менее, прототипы хорошего качества должны быть протестированы, иметь контроль версий, иметь стабильную ветку и не должны иметь устаревшей документации. В противном случае это просто прототипы плохого качества.

---- Редактировать

Мой карьерный рост зависит от того, напишу ли я «плохой» код!?

Уход из академии напомнил мне, что существует нечто иное, чем бумажно-ориентированный метод работы, которому обучают аспирантов (и результаты которого часто имеют меньшее количество читателей, чем количество соавторов).

Это может иметь место не в каждой академической среде, хотя, по моему опыту, исследования с научными критериями проводятся в частном секторе.

Кроме того, это не только проблема, связанная с кодированием!

Некоторые исследователи, работающие в мокрых лабораториях, сказали мне, что у них точно такая же проблема. Выполнение экспериментов в лаборатории с документированием всей процедуры, калибровка инструментов в соответствии с высочайшими стандартами, оценка химического состава материала, купленного третьими сторонами, неизменны во времени, что делает каждый шаг полностью воспроизводимым другим исследователем... эти основные методы привели к слишком медленное производство научных статей.

Виктор Матаре · Answer 10

У меня проблема с постановкой вопроса:

В научных кругах цель состоит в том, чтобы написать как можно больше качественных исследовательских работ в кратчайшие сроки.

Кажется, нет никакой мотивации писать проверенный, поддерживаемый, документированный код — мне просто нужно запустить его и получить результат в моей статье или что-то в этом роде как можно скорее.

В настоящее время я имею дело с большой кодовой базой, написанной людьми, которые, по-видимому, тоже так думали. До этого я привык к другому стандарту академического кодирования — тому, где код прост, элегантен, современен, хорошо протестирован и хорошо поддерживается в течение многих лет.

И я верю, что люди, которые окажут влияние в наш информационный век, не обязательно будут теми, кто пользуется наибольшим научным авторитетом, но теми, кто действительно может сделать что-то из своих хороших научных идей.

Однако, если в вашей области крутые вещи, которые вы можете сделать, совсем не зависят от кода, который вы пишете (например, просто какая-то скучная фильтрация данных), то вам действительно не нужно беспокоиться о его качестве.

Лучшие модели для «исследовательского» кода?

Бен

ff524

Петр Мигдаль

ff524

ff524

Бен

Петр Мигдаль

хЛейтикс

Бен

хЛейтикс

Петр Мигдаль

Бен

ИЛИ картограф

Стефан Коласса

Петерис

ДжеффЭ

Дэвид Ричерби

cbeleites недовольны SX

суперлучший

Дэвид ЛеБауэр

Петр Мигдаль

Джошуа Тейлор

Лететь в

Дикран Сумчатый

Фабио Диас

сетхолополус

Ответы (10)

хЛейтикс

Крис Сайрефис

Флорис

Алекс Рейнкинг

суперлучший

Бен

Дэвидмх

суперлучший

адам.р

суперлучший

СтасК

Александрос

ДжеффЭ

Джефф Оксберри

Чарльз Стаатс

ДжеффЭ

СтасК

dmckee --- котенок экс-модератор

Некоторая часть обычного отраслевого набора инструментов, который мы используем с энтузиазмом

Другая часть либо медленнее завоевывает популярность, либо не так высоко ценится, в том числе

Другие простые вещи не проявляются много.

суперлучший

dmckee --- котенок экс-модератор

Марк Клазен

ff524

Марк Клазен

Рафаэль

Рафаэль

wjl

Рафаэль

СтасК

Кейт

Тони Хопкинсон

СеФ

Виктор Матаре