Какая задержка между двумя источниками звука кажется большинству людей «заметной»?

Я завершаю проект, который включает синхронизацию двух аудиоисточников по сети, и мне нужно найти некоторые цифры, которые представляют, какая задержка будет рассматриваться как «заметная».

Я пытался искать, но ничего не нашел; все, что я могу найти, это документы по локализации.

Кто-нибудь знает о каких-либо исследованиях или документах, посвященных этой области? Спасибо!

вероятно, порядка микросекунд... именно из-за локализации источника.
Хороший вопрос! Добро пожаловать на cogsci.SE!
Это не моя область, но я полагаю, что некоторая форма поиска по «теории обнаружения сигнала» и «аудиосинхронности» была бы хорошим началом (например, см. этот поиск ученых Google ).
Возможно, вы захотите выполнить поиск по слову «обнаружение слухового промежутка».
Еще один момент, который следует учитывать, — задержки в звуке влияют на фазирование, и если у вас есть звуки, поступающие в разное время к каждому уху, мозг в некоторых случаях будет интерпретировать это пространственно (например, при попытке локализовать источник звука).

Ответы (1)

Это во многом зависит от того, что вы подразумеваете под «заметным» - что / почему вы хотите синхронизировать и как это достигает ушей от физических динамиков.

Имейте в виду, что источник звука, находящийся на расстоянии 30 см/1 фута от уха, имеет примерно тот же эффект, что и миллисекундная задержка (скорость звука ~340 м/с). имеют и нуждаются в субмиллиметровой точности локализации. При этом небольшие задержки могут вызвать проблемы с компенсацией фазы, которые будут заметны, но будут зависеть от точного размещения источников звука.

Однако, если мы говорим о пределах разума - есть два общеизвестных явления; во-первых, это предел, при котором разум воспринимает звук как одновременный с визуальным стимулом (несмотря на то, что они действительно немного смещены), а во-вторых, когда разум воспринимает два близких, но отдельных звуковых всплеска как единое событие (причем самый громкий маскирует более слабый). Сейчас я не могу найти точные пределы, но оба они должны быть где-то между 1 миллисекундой и 5 миллисекундами, если я правильно помню.

Интересные тонкости к этому вопросу; Я бы не догадался. Добро пожаловать на cogsci.SE!
Я очень сомневаюсь, что восприятие одновременного звука и видео достигает 5 мс или меньше. Вы можете попробовать воспроизвести видео в (например) VLC и изменить смещение звука; вы увидите, что вы можете пройти через десятки мс, прежде чем станет ясно, что что-то не так. В этой статье упоминаются профессиональные видеоредакторы, способные замечать +/- 20 мс. Я сомневаюсь, что «нормальные» могут опускаться ниже. telosalliance.com/images/LA%20White%20Papers/…
С другой стороны, для задержек короче около 1 мс и короче можно не только потерять «2-близких-но-раздельных-события», но и превратить их в пространственное расположение звука.