математическая дисциплина, посвященная отысканию экстремальных (наибольших и наименьших) значений функционалов - переменных величин, зависящих от выбора одной или нескольких функций. В. и. является естественным развитием той главы математического анализа, которая посвящена задаче отыскания
Экстремумов функций. Возникновение и развитие В. и. тесно связано с задачами механики, физики и т.д.
Одной из первых задач В. и. была знаменитая задача о брахистохроне (См.
Брахистохрона)
(И. Бернулли, 1696): определить форму кривой, лежащей в вертикальной плоскости, по которой тяжёлая материальная точка, двигаясь под действием только одной силы тяжести и не имеющая начальной скорости, перейдёт из верхнего положения
А в нижнее положение
В за минимум времени. Эта задача сводится к отысканию функции
у (
х)
, доставляющей минимум функционалу
где а и b - абсциссы точек А и В.
Другой такой же "исторической" задачей является задача об отыскании пути, вдоль которого распространяется свет, идущий от источника света (точка
А)
к некоторой точке
В, в среде с переменной оптической плотностью (то есть в среде, где скорость распространения
v есть функция координат). Для решения этой задачи может быть использован, так называемый,
Ферма принцип, согласно которому из всех кривых, соединяющих точки
А и
В, луч света распространяется вдоль той, по которой свет приходит из
A в
B за кратчайшее время. В простейшем случае, когда свет распространяется в плоскости, задача сводится к отысканию кривой
y (
x)
, доставляющей минимум функционалу
Из разрозненных задач подобного рода постепенно в 18 в. начало формироваться В. и. Но и после оформления В. и. в самостоятельную дисциплину она продолжала оставаться связанной с различными проблемами механики и физики. На протяжении 2-й половины 18 в. и всего 19 в. делались интенсивные попытки построить здание механики, опираясь на некоторые общие вариационные принципы (см.
Вариационные принципы механики)
. Со 2-й половины 19 в. начинают разрабатываться различные вариационные принципы в механике сплошных сред, затем позднее в квантовой механике, электродинамике и т.д. Возникают вариационные принципы и в средах с диссипацией энергии. Исследования во всех подобных областях продолжают служить базой формирования новых задач В. и. и областью приложения её методов. Однако со временем появились и новые классы задач, далеко раздвинувших традиционные границы дисциплины и превративших В. и. в одну из наиболее обширных ветвей современной математики, включающей в себя, с одной стороны, самые абстрактные вопросы, относящиеся в равной степени к топологии и функциональному анализу, а с другой - разнообразные вычислительные методы решения технических или экономических задач.
Прямые методы. В. и. как самостоятельная научная дисциплина сформировалась в 18 в., главным образом благодаря работам Л.
Эйлера
.
Простейшей задачей В. и. называют задачу отыскания функции x (t), доставляющей экстремум функционалу
где F - непрерывная и дифференцируемая функция своих аргументов. При этом функция x (t) должна удовлетворять следующим условиям:
а) она должна быть кусочно дифференцируемой,
б) при t = to и t = T она должна принимать значения
х (to) = х0, х (Т) = хт. (2)
Обе задачи, рассмотренные в начале статьи, являются частными случаями простейшей задачи В. и.
Первые вариационные задачи были задачами механики. Они были поставлены в 18 в. и, следуя традициям того времени, первый вопрос, на который надо было ответить, был вопрос о способе фактического отыскания функции x (t), реализующей минимум функционала (1).
Эйлер создал численный метод решения задач В. и., который получил название Эйлера метода ломаных (См.
Эйлера метод ломаных)
. Этот метод был первым среди большого класса, так называемых, прямых методов (См.
Прямые методы)
; все они основаны на редукции задачи отыскания экстремума функционала к задаче отыскания экстремума функции многих переменных. Поскольку для получения решения с высокой точностью задачу приходится сводить к отысканию экстремума функции с большим числом переменных, она становится весьма сложной для ручного счёта. Поэтому долгое время прямые методы были вне основного русла, по которому направлялись усилия математиков, занимавшихся В. и.
В 20 в. интерес к прямым методам значительно усилился. Прежде всего были предложены новые способы редукции к задаче об экстремуме функции конечного числа переменных. Поясним эти идеи на простом примере. Рассмотрим снова задачу отыскания минимума функционала (1) при дополнит. условии
x (to) = x (T) = 0 (3)
и будем разыскивать решение задачи в форме
где φn (t) - некоторая система функций, удовлетворяющих условиям типа (3). Тогда функционал J (x) становится функцией коэффициентов ai:
J = J (ai,..., aN),
и задача сводится к отысканию минимума этой функции
N переменных. При известных условиях, наложенных на систему функций
{φn}, решение этой задачи стремится при N → ∞ к решению задачи (1) (см.
Ритца и Галёркина методы)
.
Другая причина усиления интереса к прямым методам - это систематическое изучение конечноразностных методов в задачах математической физики, начавшееся с 20-х гг. 20 в. Применение ЭВМ превращает постепенно прямые методы в основной инструмент решения вариационных задач.
Метод вариаций. Второе направление исследований - это изучение необходимых и достаточных условий, которым должна удовлетворять функция
x (
t)
, реализующая экстремум функционала
J (x). Его возникновение также связано с именем Эйлера. Предположим, что тем или иным способом построена функция
x (
t)
. Как проверить, является ли эта функция решением задачи. Первый вариант ответа на этот вопрос был дан Эйлером в 1744. В приведённой ниже формулировке этого ответа употребляется введённое в 60-х гг. 18 в. Ж.
Лагранжем
понятие вариации (отсюда название - В. и.), являющееся обобщением понятия дифференциала на случай функционалов.
Пусть x (t) - функция, удовлетворяющая условию (2), a h (t) - произвольная гладкая функция, удовлетворяющая условию h (to) = h (T) = 0. Тогда величина
J (x + εh) = J*(ε),
где ε - произвольное действительное число будет функцией ε. Вариацией δJ функционала J называют производную
(dJ*/dε)ε = 0.
Для простейшей задачи В. и.
Разлагая полученное выражение в ряд по степеням ε, получим
где о (ε) - члены более высокого порядка. Так как h (to) = h (T) = 0, то, проведя интегрирование по частям во втором интеграле, найдём
Пусть теперь x (t) реализует экстремум. Тогда функция J*(ε) имеет экстремум при ε = 0. Поэтому величина δJ должна обратиться в нуль. Отсюда следует: для того чтобы функция x (t) доставляла экстремум функционалу (1), необходимо, чтобы она удовлетворяла уравнению
называемому уравнением Эйлера.
Это - дифференциальное уравнение 2-го порядка относительно функции x (t). Необходимое условие δJ = 0 может быть применено в ряде случаев для эффективного отыскания решения вариационной задачи, поскольку функция x (t) необходимо должна быть решением краевой задачи x (to) = xo, x (T) = xT для уравнения (4). Если найдено это решение и оно единственно, то найдено тем самым и решение исходной вариационной задачи. Если краевая задача допускает несколько решений, то достаточно вычислить значение функционала для каждого из решений краевой задачи и выбрать из них то, которому отвечает наименьшее значение J (x). Однако указанный путь обладает одним существенным недостатком: не существует универсальных способов решения краевых задач для обыкновенных (нелинейных) дифференциальных уравнений.
Уже во 2-й половине 18 в. круг задач, изучаемых В. и., значительно расширился. Прежде всего основные результаты, относящиеся к простейшей задаче В. и., были перенесены на общий случай интегральных функционалов вида
где x (t) - вектор-функция произвольной размерности, и на функционалы ещё более общего вида.
Условный экстремум. Задача Лагранжа. В конце 18 в. был сформулирован ряд задач на условный экстремум. Этим термином принято называть задачи отыскания функции
x (
t)
, доставляющей экстремум функционалу
J (
x) при каких-либо дополнительных условиях, кроме условий на концах интервала
(t0, T). Простейшей задачей подобного вида является класс так называемых изопериметрических задач (См.
Изопериметрические задачи)
. Своим названием этот класс задач обязан следующей: среди всех замкнутых кривых данной длины найти ту, которая ограничивает максимальную площадь.
Значительно более сложной задачей является та, в которой ограничения носят характер дифференциальных уравнений. Эту задачу называют задачей Лагранжа; особое значение она приобрела в середине 20 в. в связи с созданием теории оптимального управления (См.
Оптимальное управление)
. Поэтому её формулировка даётся ниже на языке этой теории, возникшем после работ Л. С.
Понтрягина
и его учеников.
Пусть x (t) и u (t) - вектор-функции размерностей n и m соответственно, причём функция x (t), которую называют фазовым вектором, при t = to и t = T удовлетворяет граничным условиям:
x (t0) ∈ ε0, x (T) ∈ εT (5)
где ε0 и εT - некоторые множества. Простейшим примером условий типа (5) являются условия (2). Функция x (t) и функция u (t), которую называют управлением, связаны условием
dx/dt = f (x, u, t), (6)
где f - дифференцируемая вектор-функция своих аргументов. Рассматриваемая задача состоит в следующем: определить функции x (t) и u (t), доставляющие экстремум функционалу
Заметим, что и простейшая задача В. и. и изопериметрическая задача являются частным случаем задачи Лагранжа.
Задача Лагранжа имеет огромное прикладное значение. Пусть, например, уравнение (6) описывает движение какого-либо динамического объекта, например космического корабля. Управление u - это вектор тяги его двигателя. Множества ε0 и εT - это две орбиты разных радиусов. Функционал (7) описывает расход горючего на выполнение маневра. Следовательно, задачу Лагранжа, применительно к данной ситуации, можно сформулировать следующим образом: определить закон изменения тяги двигателя космического аппарата, совершающего переход с орбиты ε0 на орбиту εT за заданное время так, чтобы расход топлива на этот маневр был минимальным.
Важную роль в теории подобных задач играет функция Гамильтона H (x, ψ, u) = (f, ψ) - F.
Здесь
ψ - вектор, называется множителем Лагранжа (или импульсом),
(f, ψ) означает скалярное произведение векторов
f и
ψ. Необходимое условие в задаче Лагранжа формулируется следующим образом: для того чтобы функции
x̃(t) и
были решением задачи Лагранжа, необходимо, чтобы
ũ(t) была стационарной точкой функции Гамильтона
Н (х, ψ, u), то есть, чтобы при
было ∂H/∂u = 0, где ψ - не равное тождественно нулю решение уравнения
∂ψ/t = -∂H/∂x = φ(x, ψ, u, t). (8)
Эта теорема имеет важное прикладное значение, так как она открывает известные возможности для фактического нахождения векторов x (t) и u (t).
Развитие В. и. в 19 в. Основные усилия математиков в 19 в. были направлены на исследование условий, необходимых или достаточных для того, чтобы функция x (t) реализовала экстремум функционала J (x). уравнение Эйлера было первым из таких условий; оно аналогично необходимому условию
которое устанавливается в теории функций конечного числа переменных. Однако в этой теории известны ещё и другие условия. Например, для того, чтобы функция
f (
x) имела в точке
минимум, необходимо, чтобы в этой точке было
каков бы ни был произвольный вектор h. Естественно поставить вопрос: в какой степени эти результаты переносятся на случай функционалов. Для того чтобы представить себе сложность, которая здесь возникает, заметим, что функция x̃(t) может реализовать минимум среди функций одного класса и не давать минимум среди функций другого класса и т.д.
Подобные вопросы послужили источником разнообразных и глубоких исследований А.
Лежандра
, К.
Якоби, М. В. Остроградского (См.
Остроградский)
, У.
Гамильтона
, К.
Вейерштрасса и многих других. Эти исследования не только обогатили математический анализ, но и сыграли большую роль в формировании идей аналитической механики и оказали серьезное влияние на развитие разнообразных отделов теоретической физики.
Развитие В. и. в 20 в. В 20 в. возник целый ряд новых направлений В. и., связанных с интенсивным развитием техники, смежных вопросов математики и вычислительной техники. Одно из основных направлений развития В. и. в 20 в. - рассмотрение неклассических задач В. и., приведшее к открытию принципа максимума Л. С. Понтрягина.
Рассмотрим снова задачу Лагранжа: определить минимум функционала
при условии
фазовый вектор x (t) должен удовлетворять ещё некоторым граничным условиям.
В своей классической постановке условия задачи Лагранжа не предусматривают никаких ограничений на управление u (t). Выше (см. раздел Условный экстремум. Задача Лагранжа) подчёркивалась тесная связь между задачей Лагранжа и задачей управления. В рассмотренном там примере u (t) - тяга ракетного двигателя. Эта величина подчинена ограничениям: тяга двигателя не может превосходить некоторой величины, и угол поворота вектора тяги также ограничен. В данном конкретном примере компонента ui (i = 1,2,3) вектора тяги двигателя подчинена ограничениям
где а-i и a+i - некоторые заданные числа. Подобных примеров можно привести много.
Таким образом, в технике появилось много задач, которые сводятся к задаче Лагранжа, но при дополнительных ограничениях типа (10), записываемых в форме u ∈ Gu, где Gu - некоторое множество, которое, в частности, может быть замкнутым. Такие задачи получили название задач оптимального управления. В задаче Лагранжа можно исключить управление u (t) при помощи уравнения (8) и получить систему уравнений, которая содержит только фазовую переменную х и множитель Лагранжа φ. Для теории оптимального управления должен был быть разработан специальный аппарат. Эти исследования привели к открытию принципа максимума Л. С. Понтрягина. Он может быть сформулирован в форме следующей теоремы: для того чтобы функции x̃(t) и ũ(t) были решением задачи оптимального управления чтобы они доставляли минимум функционалу (9)], необходимо, чтобы u (t) доставляла максимум функции Гамильтона
где ψ - множитель Лагранжа (импульс), который является ненулевым решением векторного уравнения
Принцип максимума позволяет свести задачу оптимального управления к краевой задаче для системы обыкновенных дифференциальных уравнений порядка
2n (
n - размерность фазового вектора). Принцип максимума и в этом случае даёт более сильный результат, чем теорема Лагранжа, поскольку он требует, чтобы
было не стационарным значением функции Гамильтона
Н, а доставляло максимум
Н.
Возможен и другой подход к тем же проблемам теории оптимального управления. Пусть s (х, t) - значение функционала (9) вдоль оптимального решения. Тогда для того чтобы функция ũ(t) была оптимальным управлением, необходимо (а в некоторых случаях и достаточно), чтобы функция s (х, t) удовлетворяла следующему дифференциальному уравнению с частными производными:
Круг вопросов, которыми занимается В. и., непрерывно расширяется. В частности, всё большее и большее внимание уделяется изучению функционалов J (x) весьма общего вида, задаваемых на множествах Gx элементов из нормированных пространств. Для задач такого рода уже трудно использовать метод вариаций. Возникли новые методы, основанные на использовании понятия конуса в банаховых пространствах, опорных функционалов и т.д.
Уже в 19 в. была обнаружена глубокая связь между некоторыми проблемами теории уравнений с частными производными и вариационными задачами. П.
Дирихле показал, что решение краевых задач для уравнения Лапласа эквивалентно решению некоторой вариационной задачи. Эта проблема привлекает к себе всё больше и больше внимания. Рассмотрим один пример.
Предположим, что имеется некоторое линейное операторное уравнение
Ax = f, (11)
где х (ξ, η) - некоторая функция двух независимых переменных, обращающаяся в нуль на замкнутой кривой Г. При предположениях, естественных для некоторого класса задач физики, задача отыскания решения уравнения (11) эквивалентна отысканию минимума функционала
где Ω - область, ограниченная кривой Г.
уравнение (11) в этом случае является уравнением Эйлера для функционала (12). Редукция задачи (11) к (12) возможна, например, если А - самосопряжённый и положительно определённый оператор. Оператор Лапласа
удовлетворяет этим требованиям. Связь между проблемами для уравнений с частными производными и вариационными задачами имеет большое практическое значение. Она позволяет, в частности, устанавливать справедливость различных теорем существования и единственности и сыграла важную роль в кристаллизации понятия об обобщённом решении. Эта редукция очень важна также и для вычислит, математики, поскольку она позволяет использовать прямые методы вариационного исчисления.
В перечислении основных разделов современного В. и. нельзя не указать на глобальные задачи В. и., решение которых требует качественных методов. Искомое решение вариационной задачи удовлетворяет некоторому сложному нелинейному уравнению и краевым условиям. Естественно поставить вопрос о том, сколько решений допускает эта задача. Примером такой задачи является вопрос о количестве геодезических, которые можно провести между двумя точками на заданной поверхности. Проблема подобного рода относится уже к компетенции качественной теории дифференциальных уравнений и топологии. Последнее обстоятельство очень характерно. Методы, специфические для смежных дисциплин, топологии, функционального анализа и т.д., всё шире начинают применяться в В. и. В свою очередь, идеи В. и. проникают во всё новые области математики, и грань между В. и. и смежными областями математики теперь провести уже трудно.
Лит.: Лаврентьев М. А., Люстерник Л. А., Курс вариационного исчисления, 2 изд., М. - Л., 1950; Блисе Г. А., Лекции по вариационному исчислению, пер. с англ., М., 1950; Михлин С. Г., Вариационные методы в математической физике, М., 1957; Смирнов В. И., Курс высшей математики, 5 изд., т. 4, М., 1958; Гельфанд И. М., Фомин С. В., Вариационное исчисление, М., 1961; Математическая теория оптимальных процессов, М., 1969.
Н. Н. Моисеев.