Почему внедрение научных библиотек в программное обеспечение не считается эквивалентом публикации?

В научных кругах исследователи живут по принципу «опубликуй или погибни». Это связано с тем, что вклад в общество, который вносит академия, заключается в расширении человеческих знаний.

Однако, учитывая важность программного обеспечения для проведения исследований, я не понимаю, почему реализация многих алгоритмов или создание API для исследовательских целей не одинаково важны при попытке получить финансирование.

Посмотрите, например, как мало статей по математике, информатике и программной инженерии содержат исходный код, несмотря на то, что все внимание статьи сосредоточено на реализации алгоритма и его производительности на реальном оборудовании.

Кроме того, посмотрите, как много исследований опирается на API. У нас есть API линейной алгебры, вычисления, компьютерное зрение, моделирование физики и т. д. Многие из них являются платными программами (например, Matlab).

Если кто-то готов потратить время на разработку API для данного предмета (библиотека компьютерного зрения, алгоритм рендеринга, квантовая физика / компьютерное моделирование), и это программное обеспечение предоставляет новые и полезные инструменты в открытом программном обеспечении и бесплатно, чтобы исследователи могли проводить свои исследования. исследования более эффективно, я не понимаю, как это не эквивалентно по полезности написанию статьи.

В таких областях, как статистика, многие наиболее цитируемые работы представляют собой программные реализации алгоритмов, виньетки по этим реализациям публикуются, как и любые другие статьи, и авторы самых популярных, вероятно, лучше всего известны благодаря этим вкладам. Профессор нейробиологии, которого я знал еще будучи студентом, сказал, что лучший карьерный шаг, который он сделал, — это распространение программного обеспечения для анализа данных, которое быстро распространилось в его области и привлекло к его работе гораздо больше внимания, чем любая другая публикация. Подводя итог, я немного не согласен с предпосылкой здесь.
Почему вы хотите быть академиком? Если вы хороши и увлечены реализацией, вам следует искать работу программиста, которая будет вознаграждать именно это.
Я люблю обе вещи. Но больше всего мне нравится изучать алгоритм и реализовывать его с нуля, чтобы полностью понять и проанализировать его. Я также люблю заниматься исследованиями. Но самое главное, я чувствую огромную нехватку открытых программных ресурсов для науки. И я считаю, что это проблема, которую необходимо решить.
Я написал более длинный ответ ниже, но предположение о том, что ученые не могут получить признание за свое программное обеспечение, сегодня неверно.
1) ко многим программам прилагаются публикации, которые могут быть одними из самых цитируемых статей; 2) публикации — о заслуживающих внимания результатах исследований, а кодирование уже существующих алгоритмов — совсем другое. Яблоки с апельсинами.

Ответы (4)

Программное обеспечение — это исследовательский продукт, который имеет ценность и рассматривается как ценный, но вы, как исследователь, должны убедиться, что извлекаете из него ценность. Чтобы извлечь пользу из любого исследовательского продукта, необходимо сделать формальную запись и распространить идеи среди соответствующей аудитории. Для программного обеспечения это часто бывает в форме публикации программного обеспечения. Многие традиционные научные компьютерные журналы публикуют статьи о программном обеспечении, и эти статьи могут быть довольно хорошими с точки зрения цитирования. Например, «The MATLAB ODE Suite» Шампина — одна из самых читаемых и цитируемых статей в SIAM Journal of Scientific Computing .

Взяв этот документ в качестве справочного материала, обратите внимание, что он определяет проблему, которую он решает, объясняет, как он должен был изменить алгоритмы для достижения своих целей, и каких результатов он может достичь. Затем это дает цитируемый ресурс, и многие люди, которые используют статью, будут цитировать этот источник. Программное обеспечение, как правило, мало цитируется, но, поскольку оно может получить столь широкое распространение, вы обнаружите, что успешное программное обеспечение имеет некоторые из наиболее цитируемых публикаций. Другой классический журнал, подобный этому, — ACM Transactions on Mathematical Software (ACM TOMS) . Более поздние журналы по программному обеспечению — это Journal of Open Research Software и SoftwareX .

В несколько ином направлении Журнал программного обеспечения с открытым исходным кодом снижает важность статьи, делая программное обеспечение и его документацию частью экспертной оценки. Например, у Optim.jl есть документ JOSS , который, как вы можете видеть, намного короче, чем традиционные академические статьи, но, по крайней мере, резюмирует ценность программного обеспечения в доступной для цитирования форме.

При подаче заявления о приеме на работу вы заметите, что люди, естественно, придают другое значение документам по программному обеспечению. Хотя это определенно меняется, некоторые профессора, которых я знаю, занимают жесткую позицию в отношении того, что программное обеспечение является просто реализацией и не расширяет знания, и будут ценить его меньше, чем другие статьи (именно поэтому эти точные пункты должны быть опровергнуты в публикации об указанном программном обеспечении). Напротив, некоторые люди больше заботятся о влиянии или цитировании, поэтому широко используемое программное обеспечение окажет на них очень большое влияние. В целом, по моему опыту, ценность программного обеспечения со временем возрастает: старшие профессора чаще придерживаются первой позиции, а новые профессора — второй.

Но я бы посоветовал просто делать то, что, по вашему мнению, имеет большое влияние на исследовательское сообщество. Если это окажет большое влияние, люди это заметят, а иногда просто быть замеченным — это то, что вам нужно.

Спасибо за совет, этот ответ кажется хорошо сбалансированным и округленным

Я не уверен, в какой области вы работаете, но для меня этот вопрос почти не имеет смысла.

Ничто не эквивалентно бумаге... кроме бумаги. С тем же успехом вы можете спросить, почему проведение исследования без его публикации не эквивалентно статье. Это просто не та модель, что у нас есть.

В моих областях, если вы публикуете библиотеку/инструментарий, вы пишете о ней статью. Если вы размещаете открытый набор данных, вы пишете на нем статью. Если вы проводите исследование, вы пишете об этом статью. Есть много людей, которые сосредоточены на разработке наборов инструментов, и много людей, которые могут вообще никогда не касаться разработки и будут когда-либо публиковать только «настоящую» науку.

Другими словами, он не проходит проверку и «засчитывается» до тех пор, пока не будет хотя бы частично рецензирован.

«Другими словами, это не подтверждено и «засчитывается» до тех пор, пока оно не будет хотя бы в некоторой степени рецензировано». - Я думаю, что это утверждение просто приводит к очевидному последующему вопросу, на который нет ответа в вашем ответе: почему у нас нет режима публикации, который включает рецензируемые библиотеки/наборы инструментов?
@orm Да? По крайней мере, мое поле. Они называются журналами
Звучит многообещающе. Итак, в вашей области есть журналы, которые принимают код (и, возможно, некоторую техническую документацию по API) библиотеки/набора инструментов без каких-либо дополнительных бумажных документов о библиотеке или наборе инструментов?
@ORMapper О, я понимаю, о чем ты спрашиваешь. Нет, я не думаю, что мы еще там. Я не знаю, насколько велики библиотеки/наборы инструментов в вашей области, но в моей они никогда не будут полностью рецензированы, потому что они слишком велики. Однако обычно они есть на GitHub.
Я вижу различные способы достижения этой цели (например, означает ли «обзор научной библиотеки» построчный обзор кода или, скорее, обзор общедоступного API-интерфейса в отношении цели библиотеки + например, полнота модульных тестов и отчет о тестировании установить качество). Я действительно думаю, что это затрагивает ваше замешательство, выраженное в первых двух абзацах: я понимаю вопрос как вопрос об артефактах, «эквивалентных бумаге» в статусе, не предполагая, что только бумажные текстовые документы могут быть просмотрены или опубликованы в обычном места.
@ORMapper «скорее обзор общедоступного API-интерфейса с точки зрения назначения библиотеки +, например, полнота модульных тестов и отчет о тестировании для установления качества». Да, но вы никогда не получите это вне CS или чего-то еще. Я даже не знаю, что это значит.
Конечно, любая подобная работа (включая обычные документы) полезна только на уровне детализации для ее целевой аудитории. Точно так же тот, кто даже удаленно не использует библиотеки, вероятно, не будет их проверять, по крайней мере, в отношении вышеупомянутых аспектов.
@ORMapper есть такие журналы. Журнал программного обеспечения с открытым исходным кодом (JOSS) является одним из ярких примеров, когда статья короткая, но код и документация считаются ее частью. Итак, это журнал, в котором проводится рецензирование программного обеспечения и наборов инструментов, и он получил широкое распространение среди ученых-разработчиков программного обеспечения с открытым исходным кодом.
@ChrisRackauckas: Вау, на первый взгляд, это очень похоже на то, что я себе представлял. Почему это не более известно?!

Вы ошибаетесь в своих предположениях. Научное программное обеспечение ценится, и в настоящее время на самом деле существует ряд журналов, посвященных именно этому — я знаю это среди других причин, потому что я являюсь главным редактором ACM Transactions on Mathematical Software (ACM TOMS). Есть (на самом деле: был) также журнал Computational Science and Discovery, а еще есть Computing in Science and Engineering (CiSE). Все они публикуют статьи, описывающие вычислительное программное обеспечение.

В более общем плане прилагаются значительные усилия для того, чтобы авторы научного программного обеспечения получали признание, сравнимое с другими видами публикаций, такими как журнальные статьи. Я бы посоветовал вам ознакомиться с серией семинаров WSSSPE, целевой группой Force11 и рядом других усилий, направленных на то, чтобы программное обеспечение можно было цитировать так же, как и документы (например, через службу Zenodo).

Я бы добавил в ваш список журналы Open Research Software (JORS) и Journal of Open Source Software (JOSS) . На данный момент это, наверное, самые модные журналы в этой области. Я бы сказал, что публикации по программному обеспечению не так ценятся, как «научные» или «математические» публикации за пределами CS прямо сейчас, но это определенно меняется.
@ChrisRackauckas - да, хорошие дополнения. Спасибо!

Существуют разные виды стоимости . И разные люди измеряют его по-разному.

Научные исследования, приводящие к традиционным публикациям, направлены на расширение знаний . Ценность в знаниях.

Реализация обычно связана с созданием какого-либо продукта, будь то коммерческий или нет. Но реализация чего-то, для чего знания уже имеются, не расширяет знания, поэтому не имеет той же ценности, что и исследования, результатом которых являются новые идеи. Это не менее ценно , просто иначе ценно. Реализация может позволить сделать что-то еще, не расширяя знания. Создание научных библиотек похоже на нечто подобное.

Но вы в чем-то не правы в своих предположениях. Некоторые люди получают, по крайней мере, повышение местной репутации, создавая вещи. Это, безусловно, верно для компаний, основанных на IP, таких как Google, а также для некоторых университетов. Это не или-или. Мне дали реквизит для некоторых вещей, которые я создал, независимо от того, было ли это, строго говоря, исследованием или нет. Мои материалы в основном позволяют студентам чему-то научиться, а не расширять знания как таковые.

Но кроме того, многие докторские исследования в области компьютерных наук на самом деле основаны на реализации. В одной известной докторской диссертации объясняется, как построить компилятор на основе семантики языка, а не (обычного) его синтаксиса. Это было большое дело. Но Питеру Ли пришлось построить его, чтобы продемонстрировать, что идея верна. Реализация была не диссертацией, а исследованием и расширением знаний, которые, как доказала реализация, были надежными. Также в области компиляторов, если у вас есть идея заставить сборщик мусора для нового языка работать на 3% быстрее и использовать на 3% меньше памяти, чем самое известное решение, вы можете получить докторскую степень. Но вы должны построить его и измерить (обширно), чтобы доказать идею.

Таким образом, реализация сама по себе может и не быть ценной, но она позволяет проверить новую идею — расширение знаний.

Однако такие вещи, как энциклопедии, обзорные статьи, книги... Все они построены на существующих знаниях, не расширяя их. И все они также исходят из академических кругов. Причем вне наук, например в литературе. На самом деле вы не расширяете знания, а добавляете новый анализ автора или жанра, который добавляет знания, но не расширяет их. Мне кажется, есть большая польза в том, чтобы поощрять ученых к разработке лучших исследовательских инструментов, а не только к расширению знаний.
@Makogan И никто не становится профессором, написав энциклопедию.
Но каждый профессор использует один. Вот почему у нас есть огромные базы данных, хранящиеся в университетах, полные данных, определений, статей, результатов...
@Makogan И (почти я думаю) каждый профессор использует стул, чтобы сидеть.
Один напрямую связан с их работой, другой нет. наиболее квалифицированным человеком для создания энциклопедии является университетский профессор. В то время как самый квалифицированный человек для изготовления стула - плотник.
@Makogan Я думаю, что мой стул — это тот предмет, который я использую чаще всего (вместе со своим столом). И я не согласен с тем, что профессора — лучшие люди для создания энциклопедий. Одни профессора да, другие не очень; и не-профессора могут быть такими же квалифицированными. Существует нетривиальный аспект вульгаризации при написании энциклопедий.
@makogan это не обязательно правда. Что-то может быть больше, чем сумма его частей
Это традиционная точка зрения на факультетах математики, и я считаю ее очень неправильной/неполной. Реализация обычно является источником собственных исследований и результатов. НО, исследователь должен предпринять шаги, чтобы продавать указанное программное обеспечение по этой цене. Много раз они могли написать первую реальную оптимизированную реализацию какого-либо метода: наличие контрольных показателей реализации производственного качества может стать прорывом в этой области и указать новые направления. Тем не менее, исследователь должен предпринять шаги, чтобы поделиться такого рода знаниями. Журналы, основанные на программном обеспечении, являются хорошим источником для таких исследований.