Как обосновать выбор существующего алгоритма для новой области применения?

Итак, я нашел приложение, которое могло бы извлечь выгоду из алгоритма машинного обучения:

В моей области исследований есть довольно стандартный метод планирования экспериментов, и я обнаружил, что один шаг можно автоматизировать для экономии времени. Автоматизация может быть выполнена с помощью различных стандартных алгоритмов машинного обучения, и я выбрал тот, который:

  1. используется довольно часто, судя по литературе
  2. дает очень удовлетворительные результаты (высокая точность) на моих данных

В настоящее время я пишу статью о своих выводах. Мой вопрос в том, как я могу исключить альтернативы или, по крайней мере, обосновать свой выбор (например, в разделе «связанная работа») по сравнению с другими алгоритмами, которые, возможно, могли бы работать лучше/быть более подходящими ?

Учитывая, что машинное обучение не является моим самым сильным навыком, я пытался реализовать большинство других современных алгоритмов для сравнения, но для некоторых из них у меня просто не хватает знаний для этого.

*Мой вопрос похож на этот: как лучше всего обосновать свой выбор базовых методов для академической работы? , но разница в том, что новинка моей статьи касается новой области применения, а не нового алгоритма.

По моему мнению, сколько времени вы хотите посвятить изучению методов, зависит от того, как вы позиционируете свой вклад (в любом случае полезно проверить журнал, в котором вы хотите представить свое исследование, чтобы увидеть, как предложение новых методов делается в вашей прикладной области) Хотя я не думаю, что выбор конкретного метода машинного обучения может быть теоретически оправдан, поскольку применение машинного обучения — это больше искусство, существует множество различных факторов, которые могут повлиять на выбор конкретного метода и его параметры.
Какова область ваших исследований (например, информатика)? Лучший совет очень зависит от ожиданий публикаций в вашей конкретной области.
Для этого конкретного сценария я работаю с производством данных временных рядов и пытаюсь сделать какое-то автоматическое разделение сигнала. Так что есть много способов сделать это, и я нашел один, который работает удовлетворительно. Как мне действовать, не сравнивая каждую альтернативу? Я могу посвятить некоторое время изучению альтернатив, но у меня нет необходимого опыта, чтобы вдаваться в подробности (что означает, что мне трудно реализовать алгоритмы из статей с большим количеством математики).

Ответы (1)

В моей области исследований есть довольно стандартный метод планирования экспериментов, и я обнаружил, что один шаг можно автоматизировать для экономии времени. Автоматизация может быть выполнена с помощью различных стандартных алгоритмов машинного обучения, и я выбрал тот, который:

Похоже, вы решаете проблему в своей области, которая никогда ранее не решалась с помощью алгоритмов машинного обучения, и вы первый, кто попробовал этот подход.

используется довольно часто, по данным литературы дает очень удовлетворительные результаты (высокая точность) на моих данных

Применение такого алгоритма машинного обучения дало вам хорошие результаты, где я предполагаю, что хорошее означает, по крайней мере, достаточно хорошее, как современное состояние в этой области.

Мой вопрос в том, как я могу исключить альтернативы или, по крайней мере, обосновать свой выбор (например, в разделе «похожая работа») по сравнению с другими алгоритмами, которые, возможно, могли бы работать лучше/быть более подходящими?

Если мои предположения выше верны, то основной вклад вашей статьи состоит в том, чтобы решить известную проблему новым способом. Это достаточно хорошее достижение, которое не нуждается в оправдании. Похоже, ваша единственная проблема — убедить сообщество ученых, которые обычно не знакомятся с машинным обучением, в том, что ваш выбор разумен (НЕ оптимален) и ваши результаты надежны.

В машинном обучении — как в академических кругах, так и в промышленности — вы часто используете достаточно хорошую модель : она не обязательно должна быть лучшей или самой сложной; что нужно сделать, это сделать работу правильно и обеспечить интересные результаты. Все, что вам нужно сделать в своей статье, — это объяснить алгоритм и показать, почему результаты являются надежными.

Получив немного больше опыта в этой области в частности и в машинном обучении в целом с тех пор, как я опубликовал вопросы, я лично согласен с вашим ответом и выводом о том, что он достаточно хорош . Кроме того, я уже давно представил статью, следуя этому подходу, в конце концов, т.е. пытаясь доказать, почему результаты полезны, надежны и методология исследования, прежде чем перейти к этому выбору алгоритма. Я приму ваш ответ, так как думаю, что он бы мне очень помог, если бы он был опубликован год назад! :)
@DimP спасибо, к сожалению, я ответил, как только увидел это, зная, что для тебя уже слишком поздно, но надеясь, что это поможет другим. Я был в похожей ситуации несколько лет назад, и мне пришлось упорно бороться за то, чтобы такая статья была принята, но эта борьба была выгодна для области. Рад слышать, что вы преуспели в этом!