Двойной интегратор: максимально быстрое согласование скорости и положения с ограниченным количеством доступной силы

Question

Двойной интегратор: максимально быстрое согласование скорости и положения с ограниченным количеством доступной силы

ДжейКупер

Если тело массой $m$ начинается с позиции $x_0$ со скоростью $v_0$ и испытывает силу, которая изменяется в зависимости от времени $f(t)$ (и мы игнорируем гравитацию, трение и все остальное, что может усложнить дело), то мы можем вычислить положение и скорость тела в любой момент времени:

в (т) "=" \int_{0}^{т} \frac{ф (т)}{м} г т + в_{0},

$v(t) ~= ~\int\limits_0^t \frac{f(t)}{m}\mathrm{d}t+v_0,$ и

Икс (т) "=" \int_{0}^{т} \int_{0}^{т} \frac{ф (т)}{м} г т + в_{0} г т + {Икс}_{0} .

$x(t) = \int\limits_0^t\int\limits_0^t \frac{f(t)}{m}\mathrm{d}t+v_0\mathrm{d}t+x_0.$

Теперь, если у нас есть другое тело той же массы, которое начинается в положении $\hat{x}_0$ со скоростью $\hat{v}_0$ и мы хотим применить силу, $\hat{f}(t)$ , чтобы как можно быстрее согласовать траекторию (положение и скорость) первого тела с учетом ограничения, которое $|\hat{f}(t)|\le \mathrm{fmax}$ .

Какие инструменты мне нужны, чтобы решить эту проблему?

Ответы (2)

Двойной интегратор: максимально быстрое согласование скорости и положения с ограниченным количеством доступной силы

Qмеханик · Answer 1

Давайте переформулируем вопрос (v1) как одномерную кинематическую задачу оптимального управления мышью и кошкой . Массы не имеют отношения к кинематической задаче и, следовательно,

м "=" 1.

$m~=~1.$

1) Рассмотрим сначала кота. Задача кота — как можно быстрее определить положение и скорость (!) мыши. Кот может ускориться

| а | \leq а_{0},

$|a|~\leq~ a_{0},$

где $a_{0}>0$ это максимальное ускорение. (Обновление: задача такого типа в теории оптимального управления известна как двойной интегратор . См. также учебник HP Geering, Optimal Control with Engineering Applications, Springer, 2007, Section 2.1.4.) Мы хотим показать, что в идеале , существует оптимальная стратегия, при которой ускорение кота всегда либо максимально допустимое, либо его нет,

а (т) е {- а_{0}, 0, а_{0}},

$a(t)~\in~\left\{ -a_0,0 , a_0 \right\},$

т. е. управляющий параметр $a$ обладает свойством взрыва .

Определим кинетическую энергию со знаком

К "=" \frac{м в | в |}{2} "=" \frac{в | в |}{2} "=" Т с г н (в), Т "=" \frac{м в^{2}}{2} "=" \frac{в^{2}}{2} "=" | К | .

$K~:=~\frac{mv|v|}{2}~=~\frac{v|v|}{2}~=~T ~{\rm sgn}(v), \qquad \qquad T~:=~\frac{mv^2}{2}~=~\frac{v^2}{2}~=~|K| .$

Удобно рассматривать а $(x,K)$ система координат. Его можно рассматривать как конфигурационное пространство (или фазовое пространство) системы, поскольку карта $v \leftrightarrow K$ является биекцией: $\mathbb{R}\to\mathbb{R}$ . В частности, можно построить траектории кошки и мыши в виде графика. $(x,K)$ диаграмма. Из теоремы о работе энергии наклон траектории равен (с точностью до знака) ускорению

а "=" м а "=" \frac{г Т}{г Икс} "=" \frac{г К}{г Икс} с г н (в) .

$a~=~ma~=~\frac{dT}{dx}~=~ \frac{dK}{dx} {\rm sgn}(v) .$

Таким образом, кошка в исходном состоянии $(x_0,K_0)$ должен двигаться внутри конуса $C(x_0,K_0)$ как показано красным на рисунках 1, 2 и 3. Кошка может выйти из конуса $C(x_0,K_0)$ сквозь $x$ -ось $K=0$ только, и повернуться, чтобы достичь конечного состояния $(x,K)$ вне конуса.

$\uparrow$ Рис. 1. Случай $K_0>0$ . Красная область обозначает конус $C(x_0,K_0)$ . Пути, ориентированные черным цветом, указывают оптимальные стратегии для достижения кошкой трех различных конечных состояний. $(x,K)$ .

$\uparrow$ Рисунок 2. Конус $C(x_0,K_0)$ отмечено красным на корпусе $K_0=0$ .

$\uparrow$ Рисунок 3. Конус $C(x_0,K_0)$ отмечено красным на корпусе $K_0<0$ .

В математических деталях конус $C(x_0,K_0)$ является

С ({Икс}_{0}, К_{0}) "=" {\begin{array}{lcc} С_{+} ({Икс}_{0}, К_{0}) & ф о р & К_{0} > 0, \\ С_{+} ({Икс}_{0}, К_{0}) \cup С_{-} ({Икс}_{0}, К_{0}) & ф о р & К_{0} "=" 0, \\ С_{-} ({Икс}_{0}, К_{0}) & ф о р & К_{0} < 0, \end{array}

$C(x_0,K_0)~:=~\left\{ \begin{array}{lcc} C_{+}(x_0,K_0)&{\rm for}& K_0>0, \cr\cr C_{+}(x_0,K_0)\cup C_{-}(x_0,K_0)&{\rm for}& K_0=0,\cr\cr C_{-}(x_0,K_0)&{\rm for}& K_0<0, \end{array} \right.$

где мы определили положительные и отрицательные конусы как

С_{\pm} ({Икс}_{0}, К_{0}) "=" {(Икс, К) е р^{2} ∣ \pm а_{0} (Икс - {Икс}_{0}) \geq | К - К_{0} | \land \pm К \geq 0} .

$C_{\pm}(x_0,K_0)~:=~ \left\{(x,K)\in\mathbb{R}^2 \mid \pm a_0 (x-x_0) \geq |K-K_0| \wedge \pm K\geq 0\right\} .$

Чтобы кошка вышла из состояния $(x_0,K_0)$ констатировать $(x,K)$ , существует оптимальная стратегия, которая приводит к минимальным затратам времени $\tau(x,K;x_0,K_0)$ , что мы и попытались обозначить на рисунке 1. Грубо говоря, кошка должна выбрать маршрут как можно $x$ -ось $K=0$ насколько это возможно, так как наиболее затратно по времени иметь малую скорость. Если конечное состояние $(x,K) \in C(x_0,K_0)$ находится в конусе, то необходимы два участка (один с максимальным ускорением и один с максимальным торможением). Несложно подсчитать, что минимальное время $\tau(x,K;x_0,K_0)$ для $(x,K) \in C(x_0,K_0)$ является

т (Икс, К; {Икс}_{0}, К_{0}) "=" \frac{2 \sqrt{| К | + | К_{0} | + а_{0} | Икс - {Икс}_{0} |} - \sqrt{2 | К |} - \sqrt{2 | К_{0} |}}{а_{0}} .

$\tau(x,K;x_0,K_0) ~=~ \frac{2\sqrt{|K|+|K_0|+a_0|x-x_0|} -\sqrt{2|K|}-\sqrt{2|K_0|}}{a_0} .$

Есть аналогичные выражения для $\tau(x,K;x_0,K_0)$ в различных случаях, когда $(x,K) \notin C(x_0,K_0)$ но с большим количеством ножек/терминов, которые мы оставим в качестве упражнения для определения.

2) Далее рассмотрим мышь. Предположим, что полная будущая траектория мыши $t\mapsto x_1(t)$ , $t\geq 0$ , известно всезнающему коту. (Есть и другие возможные правила игры, но эта установка кажется наиболее близкой к тому, что нужно OP.) Пусть скорость и кинетическая энергия мыши со знаком обозначены

в_{1} (т) "=" \frac{г {Икс}_{1}}{г т} а н г К_{1} (т) "=" \frac{в_{1} (т) | в_{1} (т) |}{2},

$v_1(t)~=~\frac{dx_1}{dt} \qquad {\rm and}\qquad K_1(t)~=~\frac{v_1(t)|v_1(t)|}{2},$

соответственно. Для каждого будущего времени $t\geq 0$ , определите разницу

Δ т (т) "=" т ({Икс}_{1} (т), К_{1} (т); {Икс}_{0}, К_{0}) - т

$\Delta\tau(t)~:=~ \tau\left(x_1(t),K_1(t);x_0,K_0\right) - t$

между моментами, когда кошка могла быть в состоянии мыши $(x_1(t),K_1(t))$ (если кошка убежала), а время $t$ мышь была бы там. Если два начальных состояния кошки и мыши различны,

({Икс}_{0}, К_{0}) \neq ({Икс}_{1} (т "=" 0), К_{1} (т "=" 0)),

$(x_0,K_0)~\neq~(x_1(t=0),K_1(t=0)),$

затем $\Delta\tau(t=0)>0$ . Первое мгновение $t_*$ что кошка может получить $(x,K)$ состояние мыши - это первый раз, когда $\Delta\tau(t)$ становится неположительным,

т_{*} "=" инф {т е р_{+} ∣ Δ т (т) \leq 0} .

$t_*~=~\inf \left\{ t\in \mathbb{R}_+ \mid \Delta\tau(t) \leq 0 \right\}.$

Это ответ на то, как быстро кошка может определить положение и скорость мыши.

Идеальный. Спасибо. Кажется неинтуитивным, что стратегия «взрыва» была бы оптимальной, но то, что вы проиллюстрировали, имеет смысл. Также интересно, как критический коэффициент демпфирования $\zeta=1$ встраивается в конфигурационное пространство в виде наклона $\pm 1$ .

Бернхард · Answer 2

На самом деле вы можете найти здесь две физические аналогии, которые могут объяснить мой ответ.

В пружине возвращающая сила пропорциональна отклонению от положения равновесия. С некоторым демпфированием по пути он в конечном итоге займет исходное положение.
В динамике частиц (рассмотрим сопротивление Стокса) сила сопротивления частицы в вязкой жидкости пропорциональна разнице скоростей между частицей и жидкостью. В конце концов, частица приспособится к скорости жидкости.

Если объединить обе идеи, то сила

$\hat{f}(t)=f(t)+\alpha\Big(\hat{x}(t)-x(t)\Big)+\beta\Big(\hat{v}(t)-v(t)\Big)$

в принципе должен делать то, что вы хотите (конечно, вы всегда можете добавить свое ограничение в качестве ограничителя). На самом деле член разности скоростей будет действовать как демпфирующий член для члена разности положений.

Ваш вопрос также включает в себя как можно быстрее . Это можно сделать, грамотно подобрав коэффициенты $\alpha$ и $\beta$ . Они могут выбираться динамически: например, быть функцией разницы скорости и положения. Для этого следует ознакомиться с такими терминами, как критические времена затухания и релаксации.

Двойной интегратор: максимально быстрое согласование скорости и положения с ограниченным количеством доступной силы

ДжейКупер

Ответы (2)

Qмеханик

ДжейКупер

Бернхард

Ускорение и круговое движение

круговое (выше) движение?

Скорость, возникающая в результате тангенциального приложения силы к твердым сферам с разным распределением массы.

Почему правило произведения не используется в определении механической работы?

Третий закон Ньютона для блока на столе [дубликат]

Почему кинетическая энергия является неподвижной точкой преобразования Лежандра?

Почему можно пренебречь внутренними силами при рассмотрении движения центра масс системы?

Несколько (основных) сомнений относительно концепций движения

Центростремительная сила и изменение тангенциальной скорости

Двигается ли тяжелое тело с малейшей силой по поверхности без трения?