Разумно ли цитировать опубликованные результаты расчетов, а не воспроизводить их самостоятельно?

В компьютерных науках, когда мы пишем научную статью, нам часто приходится включать сравнительные результаты, согласно которым наш метод имеет какое-то количественное преимущество по сравнению с некоторыми другими современными результатами.

Хотя иногда легко воспроизвести результаты цитируемой статьи (например, классификацию небольших наборов данных), в других случаях это требует очень много времени, и вы можете потратить большую часть своего исследовательского времени просто на написание кода, тестирующего другие методы.

Однако иногда случается так, что при воспроизведении метода мы не получаем представленных результатов. Так что это тоже может быть сложно сделать.

  • Разумно ли просто цитировать результаты другой статьи за чистую монету?
  • Какие предложения вы могли бы дать для решения этой загадки?

Ответы (3)

  • Я отношусь к результатам вычислений как к экспериментам в силиконе . Они были опубликованы в рецензируемом журнале, поэтому я доверяю им по умолчанию, если только у меня нет причин не доверять. Я привожу их без необходимости их пересчета.
  • Иногда у меня есть причина сомневаться в них: они не соответствуют моей интуиции или не совпадают с моими собственными результатами в родственном случае; они кажутся бессвязными; они не соответствуют экспериментальным данным; и т. д. Затем я переделываю их, возможно, более чем одним способом (другое программное обеспечение, попробуйте проверить влияние некоторых допущений и т. д.). Если я узнаю что-то из этого, я рассмотрю возможность публикации этого исследования.
Что ж, если вам нужно сравнить производительность вашего алгоритма с производительностью упомянутого алгоритма, единственный честный способ сделать это — запустить оба эксперимента на одной и той же системе в контролируемых и как можно более похожих условиях.
@walkmany да, действительно. Но вопрос был не в том, чтобы алгоритм определял время для результатов вычислений.
our method has some kind of quantitative advantage against some other. Насколько я понимаю, вопрос действительно касается результатов производительности, это количественные преимущества.

Моя наиболее цитируемая работа возникла из-за того, что мы не могли воспроизвести ранее опубликованную статью в этой области. Мы провели гораздо более обширное исследование и убедительно продемонстрировали, почему предыдущие результаты были ненадежными.

Таким образом, хотя вам не нужно воспроизводить каждый отдельный результат, который был ранее опубликован, может быть полезно попытаться воспроизвести хотя бы некоторые из этих результатов, потому что тогда вы можете быть уверены, что ваша модель работает так, как вы хотите. можно было бы ожидать (при условии, что предыдущим данным можно доверять; как показал мой случай, это не всегда так!).

Разумно ли просто цитировать результаты другой статьи за чистую монету?

На мой взгляд, есть лишь несколько ограниченных случаев, когда это было бы приемлемо. Например, при сравнении систем промышленного масштаба или сравнении качественных характеристик работ. Кроме того, в случае, если существует установленный набор тестов и ваш алгоритм может решить некоторые из тех, которые не могут другие, вам действительно не нужно повторно реализовывать. Возможно также, что при тестировании алгоритма невозможно воспроизвести его (полевые испытания в промышленных масштабах). Однако когда дело доходит до экспериментальной эффективности, я думаю, что у вас обычно нет большого выбора, и вам следует воспроизвести другие результаты - если это вообще возможно.

Какие предложения вы могли бы дать для решения этой загадки?

Зависит от того, для чего вам нужна цитируемая работа. В случае, если вы разработали алгоритм, который должен быть более эффективным, чем процитированный, для подтверждения вашей точки зрения вам нужен контролируемый эксперимент, когда оба метода выполняются в одинаковых условиях (например, реализованы на одном языке программирования и выполняются на одном и том же языке программирования). та же система и т. д.) и с тем же набором тестов. В таком случае, если вы хотите должным образом продемонстрировать свою точку зрения, вам лучше всего переделать (или попросить авторов реализовать их и адаптировать к вашим условиям) и запустить лицом к лицу. В противном случае ваши кривые производительности будут несопоставимы. Хорошие примеры того, как это сделать, см., например, в разделе сравнения/оценки экспериментальной производительности алгоритмов планирования или решателей SAT.