Дифференциальные уравнения

Совместный бакалавриат ВШЭ-РЭШ, 2013-14 учебный год

И. В. Щуров, П. Ф. Соломатин, И. А. Хованская, А. Петрин, Н. Солодовников

Лекция 4. Дифференциальные уравнения в многомерных фазовых пространствах

Многомерные фазовые пространства

До сих пор мы рассматривали дифференциальные уравнения с одномерным фазовым пространством. (Искомая функция принимала значения во множестве вещественных чисел.) На практике нам зачастую нужны более сложные дифференциальные уравнения с многомерными фазовыми пространствами. Для простоты обозначений здесь и ниже мы будем рассматривать преимущественно двумерные фазовые пространства. Большинство определений мгновенно обобщаются на случай произвольной размерности.

Отступление 1. Что такое фазовое пространство?

Фазовое пространство — это пространство, точка в котором описывает состояние всей системы целиком. Сложные системы описываются большим количеством параметров и требуют рассмотрения многомерных фазовых пространств.

Пример 1. Зачастую просто использование понятия фазового пространства позволяет сильно продвинуться в понимании задачи. Приведем задачу Н.Н.Константинова из книги Арнольда (как оказалась, она разбиралась в курсе анализа-1, но с акцентом на понятие непрерывности; мы напомним эту задачу и сделаем несколько другой акцент):

Пусть есть два города — A и B — и между ними проведены две дороги. Из города А в какой-то момент вышли Ромео и Джульетта и направились в сторону города B. При этом они решили идти каждый по своей дороге, держась за веревочку длиной 5 метров — Ромео за один конец, Джульетта за другой. Веревочка может не быть натянтой (то есть расстояние между Ромео и Джульеттой может быть меньше 5 метров, но не может быть больше), они могут притормаживать, ускоряться, пропускать друг друга вперед, идти назад и т.д. — двигаться как угодно. Известно, что двигаясь таким образом им удалось попасть из города A в город B.

В другой день из города B в город A выехал воз, нагруженный товаром, а из города A в город B выехал другой воз, тоже нагруженные товаром, и ехали они по разным тропинкам. Возы круглые (если смотреть сверху), их радиус 3 метра.

Утверждение: Если два человека смогли пройти, держась за руки, то возы не смогут разъехаться.

Доказательство: Для решения мы нарисуем фазовое пространство — в данном случае, фазовую плоскость. По горизонтальной оси отложим расстояние до объекта (будь то человек или воз) до города А по одной дороге, а по вертикальной — расстояние до другого объекта по другой дороге. Таким образом, расположение обоих объектов будет задано одной точкой на плоскости. Движению обоих объектов будет соответствовать некоторая кривая на фазовом пространстве — фазовая кривая (или траектория).

In [1]:
%pylab inline
from nesode import *
Populating the interactive namespace from numpy and matplotlib

In [2]:
axis([-0.1,1.1,-0.1,1.1])
center_spines()
plot([1,1,0,0,1],[0,1,1,0,0], linewidth=2)
text(0.02,1.02,"B",fontsize=20)
text(1.02,0.02,"B",fontsize=20)
text(0.02,0.02,"A",fontsize=20)
mplot(linspace(0,1),lambda x: 1-((1-x)**2+sin(3*pi*(1-x))*0.3*(x-x**2)))
mplot(linspace(0,1),lambda x: (1-x**2)-cos(3*pi*x)*0.3*(x-x**2))

В начальный момент времени Ромео и Джульетта находились в городе A, что соответствует точке $(0,0)$ на картинке. В конечный момент времени они оказались в городе B, что соответствует точке $(1,1)$ на картинке. Таким образом, если смотреть на траектории, они «прошли» из левого нижнего угла в правй верхний. Наоборот, возы в фазовом пространстве двигались из левого верхнего угла в правый нижний. На картинке красным изображено движения возов, зеленым — движение людей. Очевидно, что траектория может быть не только графиком функции, но и произвольной кривой. Теперь заметим, что две кривые, соединяющие противоположные углы квадрата, в итоге пересекутся. (Строгое доказательство этого утверждение нетривиально, но интуитивно оно не вызвает сомнений.) Это означает, что как минимум в одном месте фазового пространства одновременно будет выполнены условия, что расстояние между возами не более пяти (люди держатся за веревочку), но и не менее шести (сумма радиусов возов). Противоречие.

Пример 2. В модели Солоу рассматривалось одномерное фазовое пространство — единственной переменной была капиталовооруженность $k$, потребление считалось постоянным. В более сложной модели Рамсея учитывается, что потребление $c$ может меняться со временем, и оно вступает в игру как одна из неизвестных функций. Фазовое пространство становится двумерными, фазовыми переменными являются капиталовооруженность $k$ и потребление $c$.

Пример 3. Когда мы обсуждали рост популяции (мальтузианскую модель), наше пространство было одномерным: нас интересовал только размер популяции в данный момент времени. Если бы мы рассмотрели более сложную модель, включающую, например, взаимодействующие популяции двух разных видов, нам потребовалось бы два числа для описания состояния системы — количество особей одного вида и другого вида.

Рассмотрим, скажем, простейшую модель взаимодействия двух видов, один из которых является хищником, а другой — жертвой — например, взаимодействие кроликов и лис, или щук и карасей.

Пусть $x$ — число лис, $y$ — число кроликов. Если ни одной лисы нет, скорость роста числа кроликов пропорциональна числу самих кроликов (как в мальтузианской модели — какая-то часть популяции воспроизводится за единицу времени). Наоборот, если нет кроликов, то лисы вымирают от голода — за единицу времени какая-то доля популяции погибает. Каждая встреча лисы с кроликом (которые происходят с частотой, пропорциональной произведению $xy$) вносит положительный вклад в динмику лис и отрицательный — в динамику кроликов. Запишем дифференциальное уравнение (систему из двух уравнений):

$$\begin{cases} \dot y = ky-\lambda \cdot xy\\ \dot x = - \beta x + \gamma \cdot xy, \end{cases}$$ где $k$, $\lambda$, $\beta$, $\gamma$ — некоторые положительные параметры.

Отступление 2. Немножко о кривых

Кривые на плоскости можно задавать тремя разными способами:

  1. В виде графиков функций $y=f(x)$ или $x=g(y)$, например $y=\sqrt{1-x^2}$.
  2. В параметрическом виде $x=x(t),\ y=y(t)$. Например, $x(t)=\cos t,\ y(t)=\sin t$.
  3. В неявном виде $F(x,y)=0$, например $x^2+y^2=1$

Репараметризация: В параметрическом виде кривые можно задавать с помощью разных параметризаций. Например, $x=t,\ y=t$; $x=3t,\ y=3t$; $x=t^3+t,\ y=t^3+t$ — три разные параметризации одной и той же кривой (какой?). Однако, как вектор-функции они разные.

Репараметризация соответствует замене независимой переменной. Если гладкая вектор-функция $f\colon [a,b] \to \mathbb R^n$ задаёт некоторую кривую, и функция $h\colon [c,d]\to[a,b]$ также гладкая, причём её производная не обращается в ноль и $h(c)=a$, $h(d)=b$, то сложная функция $f\circ h$ (то есть $\tilde f(s)=f(h(s))$) задаёт ту же кривую при $s\in [c,d]$.

Если представить себе, что на каждой точке кривой написано значение параметра, при котором мы проходим эту точку, то репараметризация — просто изменение «номеров» точек кривой.

Напомним, что касательные для $n$-мерных вектор функций — это вектор-функция, составленная из производных каждой координаты. Если $f(t)=(f_1(t),\dots,f_n(t))$, то $\dot f(t) = (\dot f_1 (t), \dot f_2 (t), \dots, \dot f_n (t))$

Утверждение 1: Вектор производной $f$ в точке $t_0$ касается кривой в этой точке.

Утверждение 2: При репараметризации вектор производной множается на число, но не меняет направления. Это следует из теоремы о производной сложной функции:

$$\frac d {ds} f(h(s))=\frac{df}{dt} \cdot \frac{dh}{ds} = \dot f \frac{dh}{ds}$$ При этом $f$ — это вектор, $\frac{dh}{ds}$ — число (причём мы потребовали, чтобы оно было ненулевым).

Неформально, можно сказать, что репараметризация кривой соответствует изменению скорости, с которой мы эту кривую обходим.

Системы дифференциальных уравнений

Рассмотрим систему из двух дифференциальных уравнений: $$\begin{cases} \dot x=f(x,y,t)\\ \dot y=g(x,y,t) \end{cases}$$

Эту систему можно представить как одно дифференциальное уравнение на одну вектор-функцию $X(t)=(x(t),y(t))$: $$\dot X=F(X,t),$$

В дальнейшем мы не будем различать понятия «система дифференциальных уравнений» и «дифференциальное уравнение с многомерным фазовым пространством».

Теорема существования и единственности решения задачи Коши

Теорема.

Рассмотрим уравнение

$$\begin{equation}\tag{*} \dot x=f(x,t),\quad x(t)\in\mathbb R^n, \end{equation}$$

где функция $f(x,t)$ непрерывно дифференцируема ($C^1$-гладкая, то есть дифференцируемая и все частные производные непрерывны) в окрестности точки $(t_0, x_0)$ расширенного фазового пространства.

Тогда найдётся такая окрестность $U=U_\delta(t_0)$, что на $U$ существует решение $x=\varphi(t)$ уравнения (*), удовлетворяющее условию $\varphi(t_0)=x_0$, и при этом любое другое решение уравнения (*), удовлетворяющее этому же условию, совпадает с $\varphi(t)$ на некоторой окрестности точки $t_0$.

Доказательство для желающих будет в доп. листочках.

Автономные системы дифференциальных уравнений

Если правая часть не зависит от $t$ явно, система из двух дифференциальных уравнений становится автономной и принимает вид:

$$\begin{equation}\tag{2} \begin{cases} \dot x=f(x,y)\\ \dot y=g(x,y) \end{cases} \end{equation}$$

Для автономных систем содержательными становятся картинки на фазовой плоскости:

Определение. Траекторией (или фазовой кривой) системы (2) называется кривая, параметрически задающаяся как $(x,y)=(x(t),y(t))$, где $(x(t), y(t))$ — некоторое решение системы (2).

Замечание. Из теоремы существования и единственности решения дифференциального уравнения следует, что для всякой точки определена локально единственная фазовая кривая, которая через неё проходит. Это следует из того факта, что множество интегральных кривых инвариантно относительно сдвигов времени.

Определение. Векторным полем, заданным системой (2), называется следующий объект: в каждой точке $(x_0, y_0)$ фазового пространства нарисован вектор, выходящей из точки $(x_0, y_0)$ и имеющий координаты $(f(x_0,y_0),g(x_0,y_0))$.

Замечание. Фазовые кривые системы касаются векторов соответствующего векторного поля. Это мгновенно следует из утверждения 1.

Примеры.

  1. Нулевое поле.
In [3]:
axis([-4,4,-4,4])
X = arange(-4,4,0.7)
x,y = meshgrid(X, X)
plot(x,y,'ro');
  1. Постоянное поле. $$\dot x=1,\quad \dot y=2$$
In [4]:
fs = lambda x,y:(1,2)
vectorfield(arange(-4,4,0.7),arange(-4,4,0.7),fs,color='red',edgecolors='red',linewidth=1,headwidth=3, headlength=4)
  1. $\dot x=x,\quad \dot y=y$.
In [5]:
fs = lambda x,y:(x,y)
vectorfield(arange(-4,4,0.5),arange(-4,4,0.5),fs,color='red',edgecolors='red',linewidth=1,headwidth=3, headlength=4)

Связь между автономными и неавтономными уравнениями

Обсуждалось на семинаре

Теорема. Рассмотрим систему

$$\begin{equation}\tag{3} \begin{cases} \dot x=f(x,y)\\ \dot y=g(x,y) \end{cases} \end{equation}$$

Для любой точки $P=(x_0, y_0)$, такой, что $f(x_0,y_0)≠0$, фазовая кривая системы (3), проходящая через $P$, совпадает с интегральной кривой для уравнения

$$\begin{equation}\tag{4} \frac{dy}{dx}=\frac{g(x,y)}{f(x,y)} \end{equation}$$

Доказательство. Каждый вектор векторного поля для (3) лежит на прямых, принадлежащих полю направлений для (4). Фазовая кривая касается этих векторов, и, значит, этих прямых. По теореме существования и единственности, единственная кривая, касающаяся этих прямых в каждой своей точке — это интегральная кривая (4). Доказательство завершено.

(Строго говоря, мы доказали только тот факт, что фазовая кривая (3) является интегральной кривой (4). Обратный факт сводится к утверждению, что заданную кривую можно параметризовать таким образом, чтобы вектор скорости в каждый момент времени имел заданную длину. Это утверждение эквивалентно утверждению о разрешимости автономного дифференциального уравнения на прямой, но мы опустим детали.)

Прямые произведения уравнений

Определение. Автономная система дифференциальных уравнений

$$\begin{equation}\tag{5} \begin{cases} \dot x=f(x)\\ \dot y=g(y) \end{cases} \end{equation}$$

называется прямым произведением уравнений $\dot x=f(x)$ и $\dot y=g(y)$. В нашей системе параметры $x$ и $y$ не взаимодействуют, каждый подчиняется своему дифференциальному уравнению.

In [5]: