Насколько точны опубликованные документы?

Я студент и пытаюсь опубликовать данные о точности потребительских датчиков движения для IEEE. Я искал существующую литературу по этой теме и нашел несколько интересных статей. Однако я не уверен, насколько точны эти документы.

Когда IEEE публикует статью в журнале или на конференции, считает ли IEEE выводы статьи точными?

То есть, прошла ли статья часто хваленую наукой «рецензирование» после того, как статья была опубликована?

Я понимаю, что этот вопрос относится к моему исследованию и любому другому исследованию, опубликованному уважаемой организацией, такой как IEEE или Nature.

Он, безусловно, прошел процесс рецензирования, но я не думаю, что это означает то, что вы думаете. «Рецензирование» означает именно это. Это не доказательство правильности или гарантия или что-то отдаленно похожее. Даже математики (многие из которых считают, что рецензенты должны очень тщательно проверять правильность, что может быть не так в других областях) не верят слепо в результаты только потому, что они опубликованы в авторитетном рецензируемом журнале.
@Yuichiro: Не гарантия, конечно, но сказать, что публикация в авторитетном генерале «не является доказательством правильности», кажется слишком. Кроме того, математики иногда слепо верят результатам, когда они публикуются в достаточно авторитетных журналах. Когда и сколько они делают - довольно сложный вопрос, я думаю...
@PeteL.Clark Хороший вопрос. Под «не доказательством» я имел в виду, что это не неопровержимое доказательство или дымящийся пистолет. Это может косвенно указывать на то, что результат правильный. Так что я согласен, что это можно назвать своего рода свидетельством, если вы скажете, что другие несколько надежные индикаторы, такие как солидный послужной список авторов, также являются «доказательством». Последнее замечание, о котором вы сказали, затрагивает слишком сложную проблему для этого раздела комментариев, я думаю. Но, скажем, каков был бы ваш ответ, если бы вас спросили, слепо ли вы верите статье только потому, что она опубликована в «Анналах»? Если не просто да, я думаю, что мы не расходимся во мнениях.
Профессора не получают должности, повторяя эксперименты другой группы для проверки их точности.

Ответы (8)

Нет. Издатель не гарантирует и не может гарантировать правильность статей. Кроме того, система рецензирования несовершенна.

При этом, даже несмотря на то, что в одной статье может быть некоторый шанс быть ошибочным, поскольку исследования повторяются, а последующие исследования подтверждают и расширяют выводы, научное сообщество может выдвигать более сильные утверждения.

...и не должен...
В зависимости от вашей области, среднее качество может быть ... сомнительным (особенно на конференциях), а последующая проверка почти не существует. В частности, в очень активных областях (т.е. таких, где много публикаций) обычно понимается (из того, что я слышал), что «рецензирование» означает немногим больше, чем «было прочитано дважды», если что.
Кроме того, научные статьи (пытаются) раздвигают границы знаний. Могут быть подводные камни/влияющие факторы, о которых не знают ни авторы, ни рецензенты, потому что они до сих пор неизвестны.

В одной статье специально рассматривался вопрос «Почему большинство опубликованных результатов исследований ложны» , что вызвало бурную дискуссию по этой теме.

РЕДАКТИРОВАТЬ, чтобы предоставить больше контекста, как указано в комментариях.
В статье (опубликованной в PLOS Medicine , что определяет ее объем) используются статистические методы для изучения вероятности того, что определенные типы исследований в области биомедицинских исследований дадут важные результаты, которые в конечном итоге будут опубликованы.

Некоторые цитаты:

высокий уровень невоспроизведения (отсутствие подтверждения) научных открытий является следствием удобной, но необоснованной стратегии заявления об окончательных результатах исследования исключительно на основе одного исследования, оцениваемого по формальной статистической значимости, как правило, для p-значения менее 0,05.


большинство исследовательских вопросов решается многими командами, и было бы неправильно подчеркивать статистически значимые результаты какой-либо отдельной группы. Важна совокупность доказательств. Уменьшение предвзятости за счет повышения стандартов исследований и сокращения предубеждений также может помочь. Однако для этого может потребоваться изменение научного мышления, чего может быть трудно достичь.

Несмотря на обширную статистическую литературу по многочисленным поправкам при тестировании [37], обычно невозможно расшифровать, сколько данных, извлеченных авторами отчета или другими исследовательскими группами, предшествовало опубликованному исследованию. Даже если бы определить это было возможно, это не информировало бы нас о шансах до исследования.

Хотя некоторые детали методологии оспаривались, суть статьи — то, что повторение исследований имеет решающее значение для установления фактов, и что нынешняя система публикаций во многих отношениях предвзято относится к воспроизводимым исследованиям — получила широкое признание далеко за пределами биомедицины, и документ вызвал волну исследований, посвященных этому кругу системных проблем, которые были отмечены в документе.

Не сказать, что это плохие ссылки, но не могли бы вы немного описать их в своем ответе? Некоторые люди могут получать доступ к этому сайту через канал, который по той или иной причине блокирует веб-сайты, с которых вы связаны, и, хотя они являются недавними и активными ссылками, вы должны защитить этот ответ от гниения ссылок.
@gnometorule Я верю в ответ, я просто говорю, что он будет улучшен с помощью поддерживающих кавычек.
@gnometorule Как правило, на сайтах SE ответы должны стоять сами по себе; ссылки являются дополнительными.
@Zibbobz Я отредактировал свой ответ, чтобы предоставить некоторые подробности о статье.

Публикация в рецензируемом журнале — это только начало пути к принятию идеи исследовательским сообществом, а не последнее. Экспертную оценку следует рассматривать только как базовую проверку статьи на вменяемость, и на нее нельзя полагаться. Как только выводы статьи воспроизведены или использованы в качестве основы для дальнейшего исследования, мы можем быть более уверены в том, что статья верна, но читатели по-прежнему несут ответственность за то, чтобы убедиться, что они сами оценивают статью. Если статья цитировалась большое количество раз (при этом цитаты не являются опровержениями! ;о), то это говорит о том, что работа, вероятно, надежна. Некритическое доверие к статье из-за того, что она была рецензирована, по сути, является примером «аргумента авторитета».заблуждение (в данном случае авторитетом являются анонимные рецензенты). Хотя рецензируемые статьи с большей вероятностью будут правильными, чем, скажем, блоги, это не может быть гарантировано, и лучше сохранять скептическое отношение.

Количество цитирований не является хорошим показателем надежности статьи. Статьи часто цитируются некритически — часто просто потому, что автору нужно конкретизировать повествование и сделать правдоподобной свою любимую теорию. Я видел это в своей области — в журнале Science была опубликована статья, которая не должна была пройти рецензирование. Тем не менее, эта статья получила большое количество ссылок — в основном от людей из другой области, которым просто понравился вывод. Есть только несколько цитат из этой области, и это были отказы от статьи. Большое количество цитирований просто демонстрирует причуду
@adam.r ни одна метрика не идеальна, однако подсчет цитирования имеет то преимущество, что он доступен. Хотя некоторые статьи цитируются некритически, свидетельства того, что они, по крайней мере, цитировались, свидетельствуют о том, что они подвергались более тщательному изучению, чем статьи, которые не цитировались. Сказать, что большое количество цитирований просто демонстрирует причуду, довольно оскорбительно по отношению к большинству хорошо цитируемых статей, которые хорошо цитируются, потому что их стоит цитировать.
Я не говорил, что цитирование обычно связано с причудами, просто некоторые статьи получают много ссылок благодаря причудам. (и я проголосовал за ваш ответ). Моя цель состояла в том, чтобы дать руководство по интерпретации этого числа. Например, авторитетные журналы, такие как Science, с большей вероятностью будут цитироваться причудливыми людьми, чем журналы-рабочие. Причудливые цитирования также появляются вскоре после публикации (без времени на тиражирование), но солидные статьи цитируются в течение многих лет. Ни одна статистика не идеальна, но единственный способ улучшить статистику — это понять пределы существующей статистики.
@adam.r достаточно честно, извините за недоразумение. Верно также и то, что в течение нескольких лет часто цитируются статьи с алгоритмами, которые на практике работают не очень хорошо. Я сказал, что высокая цитируемость только предполагает, что статья «вероятно, надежна». В конце концов, единственный способ выяснить это часто — это попробовать самому и посмотреть, работает ли это, и нам нужно сохранять скептицизм.
Марупиал: Нет проблем. Мой первоначальный комментарий («не очень хорошая метрика») был открыт для интерпретации.

Точность опубликованных статей резко различается и не может быть принята. В частности, в случае с IEEE, это огромная организация с множеством конференций и журналов. Некоторые из них, как правило, более строго относятся к тому, что они принимают, чем другие. Некоторые статьи, которые я читал в IEEE, заставили меня задаться вопросом, проходили ли они вообще какой-либо процесс рецензирования, поскольку язык был даже непонятен. Однако даже в самых уважаемых журналах и на конференциях результаты не следует считать точными. Вы должны использовать свое собственное суждение, чтобы оценить логику и представленные аргументы (т.е. убедиться, что их выводы действительно следуют из их предпосылок/экспериментальных результатов и что их экспериментальные планы кажутся разумными) и, где это возможно, повторить эксперименты, чтобы проверить их результаты.

В любом случае, процесс рецензирования, через который статьи проходят перед публикацией, непроверка результатов даже в самых уважаемых журналах. Процесс рецензирования состоит в том, что другие авторы просматривают документ и указывают на любые предполагаемые недостатки в представленных аргументах, заметно неверные результаты (например, математические ошибки и т.п.) и/или ошибки форматирования и языка. В некоторых случаях (особенно для более общих конференций) рецензент даже не находится в той же области исследований, что и статья (например, инженер по радиочастотам может рецензировать статью об энергосистемах, или исследователь ИИ может рецензировать статью о компьютерных сетях). .) IEEE, публикующая статью, в основном говорит: «После беглого обзора один или несколько членов IEEE считают, что эта статья не выглядит полным мусором и, вероятно, имеет для кого-то некоторую академическую ценность», а не «

Процесс, который вы, кажется, имеете в виду — другие исследователи повторяют эксперименты для проверки результатов — полностью отличается от процесса рецензирования, необходимого для публикации. Обычно этот процесс не начинается до тех пор, пока статья не будет опубликована. Как правило, это верно для всех научных публикаций, а не только для IEEE. Математика является чем-то вроде исключения, поскольку они пытаются представить в своих статьях фактические доказательства, а не научные результаты. Это также часто имеет место в области алгоритмов и логики компьютерных наук. Тем не менее, даже в этих областях вы должны проверять доказательства самостоятельно, а не считать их точными только потому, что они были опубликованы.

Особенно там, где невозможно воспроизвести результаты статьи самостоятельно, вполне допустимо цитировать результаты этой статьи в своей статье в качестве сравнения. Вам просто нужно убедиться, что вы ссылаетесь на что-то вроде «<авторы другой статьи> обнаружили, что их система достигла уровня производительности X, в то время как наши эксперименты показывают, что наша система достигает уровня производительности Y». Таким образом, становится ясно, что вы не утверждаете, что подтвердили их результаты, а просто сравниваете то, что вы видели в своей системе, с тем, что они утверждают, что видели в своей. Конечно, если у вас действительно есть возможность протестировать другую систему самостоятельно и представить для нее свои собственные экспериментальные результаты, это лучше.

Возможно, будет полезно отметить, что процесс проверки может быть лучше всего представлен в обзорных статьях, где автор приложил все усилия, чтобы поместить каждую публикацию в контекст и проиллюстрировать, какие выводы были основой для последующих исследований, и какие теории выдержали многочисленные испытания. независимые тесты. Тем не менее, некоторые обзорные статьи являются мусором и представляют собой не более чем ученого, размахивающего собственным флагом в качестве мероприятия по сбору средств.
@adam.r То, как именно работает процесс проверки, несколько различается в зависимости от области, поэтому я пропустил это обсуждение (кроме того, что оно, вероятно, заслуживает отдельного вопроса). IEEE (как следует из названия - Институт электротехники и электроники) Инженеры) больше ориентирован на инженерное дело, чем на чистую науку, поэтому процесс имеет тенденцию быть несколько иным, чем в физических науках.

В дополнение к другим хорошим ответам / баллам, есть также явление, когда результат может показаться приблизительно правильным, и его не рассматривают слишком критично, потому что это, казалось, не имеет большого значения ... но соответствует основным критериям профессиональной компетентности и т. д. Если это окажется основой для другой невинной/скучной работы, вещи могут накапливаться на предположениях о правильности, которые вообще не были «подчеркнуты». Потом, если возникнет какое-то более серьезное/интересное развитие, зависящее от всего этого, люди пересмотрят все гораздо серьезнее. Очевидно! Но и до тех пор, пока не возникнет эта последняя степень «заинтересованности», я бы беспокоился о том, что шансы «выше, чем нам хотелось бы», что в данном результате есть проблемы. Возможно поправимопроблемы, особенно в «обычных» историях, но ремонт часто может потребовать более экспертной оценки ситуации.

Резюме: если результат был "подчеркнут", а не просто процитирован , можно быть уверенным. Но даже если часто цитируется, но только неинтересными/несущественными статьями, кто знает?

И, как уже отмечалось, многие журналы (по математике) специально сообщают рецензенту, что они не несут ответственности за проверку правильности, а более / только на «пригодность». (Вопрос статуса, среди прочего, ...)

Многие статьи по медицине, биологии, психологии, социальным наукам и т. д. полагаются на статистические уровни достоверности и поэтому сопровождаются явным заявлением о том, что они не могут считаться точными на 100%.

Типичный уровень достоверности составляет 95%, что, к сожалению, означает, что вы можете ожидать, что примерно 1 из 20 выводов будет неверным. Так что это поля, где важны дублированные или подкрепляющие результаты.

То, что 1 из 20 предполагает, что они провели статистический анализ правильно...
И что не было предвзятости публикации в сторону положительных результатов.
Извращенность заключается в том, что подтверждающие результаты, несмотря на их важность, очень трудно опубликовать в ведущих журналах, поскольку затем эти результаты легко отбрасываются как не новые.
В более общем смысле почти вся наука делает это (используя доверительные интервалы, а не доказательства). Вот как работает наука. Наука не дает проверенных результатов; это дает вам статистические данные, подтверждающие вашу гипотезу. Однако в ненаучных областях (таких как математика и математическая часть CS) статьи часто содержат фактические доказательства.

По крайней мере, мы обычно делаем предположения и — бессознательно — ищем их. Одним из конкретных проявлений является P-взлом. См. объяснение доктора Дерека Мюллера по этому поводу:

Самое опубликованное исследование ошибочно? https://www.youtube.com/watch?v=42QuXLucH3Q

Кроме того, неточностям может способствовать неправильное использование методов уменьшения дисперсии, генераторов случайных чисел и построения сетки.


Естественно, что воспроизводимость становится проблемой.

Когда аспирантка Алисса Уорд проходила стажировку по научной политике, она рассчитывала узнать о политике, а не обнаружить пробелы в своей биомедицинской подготовке.

Она составляла библиографию о воспроизводимости экспериментов, и одна из статей, метаанализ, обнаружила, что ученые обычно не могут объяснить, как они выбирают количество образцов для использования в исследовании. «Мое удивление было не из-за упущения, а из-за того, что я понятия не имел, как и когда рассчитать размер выборки», — говорит Уорд. Ей никогда не рассказывали об основных категориях экспериментального дизайна или ограничениях значений P. (Хотя они могут помочь оценить силу научных доказательств, P-значения, как многие думают, не оценивают вероятность того, что гипотеза верна.)

Воспроизводимость: ищите более сильные научные данные

Значение AP, равное 0,05, не означает, что существует 95-процентная вероятность того, что данная гипотеза верна. Наоборот, это означает, что если нулевая гипотеза верна и все остальные сделанные предположения верны, существует 5%-ная вероятность получения результата, по крайней мере столь же экстремального, как и наблюдаемый. И значение P не может указывать на важность открытия; например, лекарство может оказывать статистически значимое влияние на уровень глюкозы в крови пациентов, не оказывая терапевтического эффекта.

Статистики предупреждают о неправильном использовании значений P

Скажем так:

  • Они, безусловно, недостаточно точны, чтобы быть действительными и точными, чтобы вы могли основывать свои парадигмы без большого количества дополнительных результатов и публикаций, но
  • Они, безусловно, достаточно точны , чтобы вы могли принять противоположное утверждение, не предъявляя железных аргументов и/или экспериментальных результатов, чтобы опровергнуть их.