Задача Лагранжа. Безусловный и условный экстремумы. Нелинейная оптимизация

Пусть решается задача поиска экстремума нелинейной функции f на всем пространстве n -мерных векторов . Обозначим Ñf (x ) = - градиент функции f в точке х = (х 1 ,…, х n ). Он задает направление скорейшего роста функции в этой точке. Точка, в которой градиент функции f равен нулю, т.е. для всех , называется стационарной или критической .

Необходимое условие экстремума в задаче без ограничений дает следующая теорема

Теорема 2 (необходимое условие локального экстремума). Пусть - точка локального экстремума дифференцируемой функции f . Тогда является ее стационарной точкой.

Однако стационарная точка не всегда является точкой экстремума функции. Например, х = 0 - стационарная точка функции z = х 3 , но в ней она не достигает ни минимума, ни максимума. Это точка перегиба функции.

Другим примером может служить функция z = . Точка (0, 0) является ее стационарной точкой, но в ней функция достигает минимума по переменной x и максимума по переменной y . Поэтому эта точка является не точкой экстремума, а седловой точкой этой функции.

Таким образом, стационарная точка будет точкой экстремума лишь при выполнении дополнительных условий, которые дает следующая теорема.

Теорема 3 (достаточные условия локального экстремума) . Пусть f - дважды непрерывно дифференцируемая функция и х * - ее стационарная точка, т.е. для всех . Тогда

1) если все главные миноры гессиана функции f в этой точке положительны, то х * - точка локального минимума;

2) если все главные миноры нечетного порядка гессиана функции f в этой точке отрицательны, а все главные миноры четного порядка положительны, то х

Для функции одной переменной (n = 1) условия теоремы 3 выглядят так.

Пусть х * - стационарная точка дважды непрерывно дифференцируемой функции f , т.е. = 0 . Тогда

1) если > 0, то х * - точка локального минимума функции f ;

2) если , то х * - точка локального максимума функции f .

Для случая n = 2 условия теоремы 3 приобретают такой вид.

Пусть х * = - стационарная точка дважды непрерывно дифференцируемой функции f , т.е. , , а также выполнено условие

.

Тогда х * - точка локального экстремума функции f , причем

1) если > 0, то х * - точка локального минимума,

2) если < 0, то х * - точка локального максимума.

Для выпуклой (вогнутой) функции необходимое условие оптимума является достаточным.

Если же нужно найти минимум выпуклой (максимум вогнутой) функции, то задача существенно упрощается. Достаточно найти любую стационарную точку этой функции. Она и будет точкой ее глобального оптимума.

При решении реальных задач оптимизации данный метод применяется редко, т.к. зачастую производную целевой функции определить сложно или невозможно.

Метод равномерного перебора

Пусть дана функция (см. рис 7.1).

Рис.7.1. Графическая иллюстрация метода равномерного перебора

В соответствии с данным методом алгоритм поиска заключается в следующем. Фиксируют величину шага . Вычисляют значения целевой функции в точках и и . Полученные значения сравнивают. Запоминают меньшее из этих двух значений. Далее выбирается точка и в ней вычисляется значения целевой функции . Сравнивается оставшееся на предыдущем шаге значение и значение . Наименьшее из них опять запоминают. Так поступают до тех пор, пока очередное значение не превысит . Последнее оставшееся значение является приближенным значением глобального минимума.

Трудности при использовании данного метода. Если целевая функция имеет узкую впадину, подобную приведенной на рисунке, то можно ее проскочить, и вместо точки глобального минимума определить точку локального минимума. Т.е. вместо можно найти . Эта проблема частично снимается, если выбрать очень маленький шаг, но при этом потребуется много времени (в том числе и машинного) для решения задачи.

Метод золотого сечения

Рассматриваемая в данном методе функция должна быть унимодальной . Функция является унимодальной на отрезке , если она на этом отрезке имеет единственную точку глобального минимума и слева от этой точки является строго убывающей, а справа строго возрастающей. Другимисловами, функция унимодальна, если выполняются следующие соотношения (рис.7.2):

Суть метода золотого сечения заключается в том, чтобы определить точку глобального минимума на отрезке за минимальное количество шагов, т.е. за минимальное количество вычислений целевой функции.

В соответствии с данным методом в каждый текущий момент времени рассматривается всегда две точки, например, в начальный момент точки и так, чтобы . При этом возможен один из двух случаев (рис.7.3):

Рис.7.3. Иллюстрация обоснования исключения отрезков

Согласно свойству унимодальной функции в первом случае искомая точка не может находиться на отрезке , во втором случае на отрезке (показаны штриховкой). Значит, область поиска сужается, и следующую точку необходимо брать на одном из укороченных отрезков: - случай 1 или - случай 2.

Теперь следует определиться, где на исходном отрезке необходимо выбирать точки и . Первоначально ничего не известно о положении точки (графиков нет, и они не строятся, здесь мы их приводим для наглядной иллюстрации сути метода, при реальной оптимизации есть только выражение для целевой функции). Поэтому любой из приведенных выше случаев возможен с одинаковой вероятностью. Это означает, что лишним может оказаться любой из отрезков: или . Отсюда ясно, что точки и следует выбирать симметрично относительно середины отрезка .



Далее для того, чтобы максимально сузить область поиска, эти точки должны быть поближе к середине исходного отрезка. Однако слишком близко к середине отрезка их тоже брать не следует, т.к. мы хотим построить алгоритм, для реализации которого необходимо общее минимальное количество вычислений целевой функции. Рассмотрим рис. 7.4.

Рис.7.4. Иллюстрация обоснования расположения точек на отрезке

Выбирая на первом шаге сравниваемые точки слишком близко к середине отрезка , мы исключим из рассмотрения большой отрезок для случая 1 или для случая 2. Но на втором шаге величина исключаемого отрезка значительно уменьшится (будет исключен отрезок для случая 1 или отрезок для случая 2).

Таким образом, с одной стороны, точки следует брать рядом с серединой отрезка, а, с другой стороны, слишком близко друг от друга их брать нельзя. Т.е. необходимо найти некую «золотую середину». Для этого рассмотрим для простоты вместо отрезка отрезок единичной длины – рис.7.5.

Рис.7.5. Обоснование «золотой середины» расположения точек на отрезке

На этом рисунке .

Для того, чтобы точка B была «выгодной» как на данном, так и на следующем этапе (шаге), она должна делить отрезок AD в таком же отношении, как и AC: AB/AD = BC/AC. При этом в силу симметрии аналогичным свойством будет обладать и точка C: CD/AD = BC/BD. В обозначениях координаты x эти пропорции принимают вид: x /1 = (1 – 2x )/(1 – x ). Решим эту пропорцию:

Корни этого уравнения равны:

не приемлем, т.е. уравнение имеет один корень.

О точке, которая расположена на расстоянии длины от одного из концов отрезка, говорят, что она осуществляет «золотое сечение» данного отрезка.

Очевидно, что каждый отрезок имеет две такие точки, расположенные симметрично относительно его середины.

Итак, алгоритм метода «золотого сечения» заключается в следующем (см. также рис.7.6). На исходном отрезке [a ,b ] выбираются две точки x 1 и x 2 , так, чтобы выполнялось приведенное выше соотношение «золотого сечения» этого отрезка. Вычисляются значения целевой функции в этих точках – и . Они сравниваются, и из дальнейшего рассмотрения исключается отрезок, прилегающий к точке, дающей большее значение целевой функции (здесь отрезок [x 2 ,b ]). Т.е. исходный отрезок [a ,b ] «стягивается» до отрезка [a ,b 1 ]. Для этого нового отрезка находится его середина, и по отношению к ней симметрично оставшейся точке x 1 ставится точка x 3 . Для нее рассчитывается значение целевой функции и сравнивается с . Из дальнейшего рассмотрения опять исключается отрезок, прилегающий к точке с большим значением целевой функции, здесь это отрезок [a ,x 3 ]. Текущий отрезок «стягивается» до нового отрезка, здесь это [a 1 ,b 1 ] и т.д.

Рис.7.6. Иллюстрация алгоритма метода «золотого сечения»

Метод «золотого сечения» прост, эффективен и широко применяется в практической оптимизации.

Численные методы решения задач нелинейного программирования (поиск экстремума функции n – переменных)

Метод линеаризации (приведения задачи нелинейного программирования к задаче линейного программирования)

Данный метод строго не относится к численным методам решения задач оптимизации. Но он эффективен и часто используется для решения практических задач. Рассмотрим суть данного метода на примере, который решался в лекции 5. Напомним формулировку задачи:

найти и . Целевая функция , ограничения:

1 этап . Приводим данную задачу к задаче линейного программирования. Для этого проводим логарифмирование ограничений и целевой функции:

После вычислений получим:

(8.1)
(8.2)
(8.3)

После логарифмирования целевой функции:

Далее задача решается с применением симплекс - алгоритма или графо – аналитически (см. рис.8.1 и вычисления, сопровождающие построения). Для построения области допустимых решений (ОДР) в логарифмических координатах работаем с ограничениями (8.1) – (8.3). Ограничения (8.1) и (8.2) – это ограничения, графически представляющие собой прямые линии, параллельные соответственно осям и . Причем, левая ограничительная линия в ограничении (8.1) совпадает с осью . Ограничение (8.3) представляет собой прямую линию, наклонную под углом 45 градусов к осям, имеющая координаты пересечения осей «0-1». Для нахождения точки касания линии, соответствующей целевой функции, сначала строим «произвольную» линию для целевой функции, приравнивая ее выражение к произвольному числу в данном масштабе. Приравняем выражение для целевой функции к числу «1,2»:

0,3
1,2 1,5

Если целевая функция стремится к минимуму, т.е. , то прямая линия, соответствующая ей, коснется границы ОДР в точке с координатами:

Рис.8.1. Графическая иллюстрация графо - аналитического решения задачи оптимизации методом линеаризации

Метод покоординатного спуска в задачах без ограничений

Это задача безусловной минимизации , т.е. задачи минимизации целевой функции на всем пространстве переменных (на всем евклидовом пространстве). Если требуется решить задачу максимизации, то выражение целевой функции умножают на (-1) и снова решается задача минимизации.

Суть данного метода заключается в построении последовательности точек, монотонно уменьшающих значение целевой функции .

Согласно этому методу направления спуска выбирается параллельно координатным осям, т.е. сначала спуск осуществляется вдоль первой оси ОХ 1 затем вдоль второй оси ОХ 2 и т.д. до последней оси ОХ n .

Пусть – начальная точка (см. рис. 8.2), a – некоторое положительное число. Вычисляют значение целевой функции в этой точке – . Далее вычисляют значение целевой функции при и проверяют выполнение неравенства

В случае выполнения этого неравенства полагают x (1) = x (0) - a. Если оба неравенства и (8.4), и (8.5) не выполняются, то x (1) = x (0) .

Рис.8.2. Графическая иллюстрация поиска точки минимума методом покоординатного спуска

Второй шаг производят вдоль координатной оси OX 2 . Вычисляют значение функции в точке (x (1) + a) и сравнивают его с предыдущим значением, т.е. проверяют выполнение неравенства

В случае выполнения неравенства (8.7) считают, что x (2) = x (1) – a. Если оба неравенства и (8.6), и (8.7) не выполняются, то принимают x (2) = x (1) .

Так перебирают все n – направлений координатных осей. На этом первая итерация закончена. На n - м шаге будет получена некоторая точка x (n) . Если , то аналогично, начиная с x (n) осуществляют вторую итерацию. Если же x (n) = x (0) (это имеет место, если на каждом шаге ни одно из пары неравенств не окажется выполненным), то величину шага нужно уменьшить, взяв, например, a n+1 = a n /2, и в следующей итерации использовать новое значение величины шага.

Последующие итерации выполняют аналогично. На практике вычисления прекращают при выполнении какого – либо условия окончания счета, например

,

где f (x ) (k+1) – значение целевой функции на (к+1) итерации;

f (x ) (k) – значение целевой функции на к –ой итерации;

Некоторое положительное число, характеризующее точность решения исходной задачи

минимизации целевой функции.

Метод покоординатного спуска в задачах с ограничениями

Данный метод распространяется на задачи, с простыми ограничениями типа:

(8.8)
(8.9)
(8.10)

Основные процедуры данного метода аналогичны предыдущему методу. Различие заключается в том, что наряду с проверкой выполнения неравенств f (x (0) + a) < f (x (0)) (f (x (0) – a) < f (x (0))), f (x (1) + a) < f (x (1)) (f (x (1) – a) < f (x (1))) и т.д. осуществляют проверку выполнения неравенств (8.8) – (8.10). Выполнение или невыполнение этих неравенств приводит к тем же последствиям, что и выполнение или невыполнение неравенств, приведенных выше.


Методы решения многокритериальных задач оптимизации

Эта задачи проектирования (оптимизации), в которых используется не один, а несколько критериев. На практике такие задачи возникают, когда проектируемый объект не может быть описан однокритериальной зависимостью, или объединить отдельные критерии в единый критерий не представляется возможным. Такое объединение критериев в единый критерий применяется, и оно будет рассмотрено ниже. Но это объединение, как правило, бывает формальным, искусственным. С математической точки зрения не существует идеального способа, метода решения таких задач. Каждый из них имеет преимущества и недостатки. Рассмотрим некоторые методы решения многокритериальных задач оптимизации.

Метод поиска Парето – эффективных решений

Рассмотрим его суть на примере использования двух критериев. Критерии при использовании данного метода являются равнозначными.

Пусть имеется множество вариантов решения. По каждому из вариантов определены значения всех критериев. Представим множество оценок вариантов решения в пространстве критериев (рис.9.1).

Рис.9.1. Иллюстрация поиска Парето – эффективных решений

На рис.9.1 приняты следующие обозначения:

К 1 и К 2 – критерии оценки вариантов решения;

Y = {y 1 , y 2 , …, y m }- множество оценок альтернативных вариантов решения;

К 11 , К 12 , … , К 1m - значения первого критерия для 1, 2, … , m - го варианта решения;

К 21 , К 22 , … , К 2m – значения второго критерия для 1, 2, … , m - го варианта решения;

P(Y) – множество Парето – эффективных оценок решений.

Правило . Множество Парето – эффективных оценок P(Y’) представляет собой «северо – восточную» границу множества Y без тех его частей, которые параллельны одной из координатных осей или лежат в «глубоких» провалах.

Для случая, изображенного на рис.9.1, Парето – эффективные оценки состоят из точек кривой (bc), исключая точку (c), и линии (de).

Преимущества метода: 1) Критерии равнозначны; 2) Метод математически объективен.

Недостаток метода: 1) Одно окончательное решение получается только в частном случае, т.е. количество Парето – эффективных решений, как правило, более одного.

Пример . Имеется 10 вариантов металлорежущих станков, среди которых для проектируемого участка необходимо выбрать наилучший. Станки оценены экспертами по двум показателям (критериям): производительности и надежности. Оценивание производилось по 11 - бальной шкале от 0 до 10. Результаты оценки станков приведены в таблице 9.1.

Таблица 9.1 Экспертные оценки станков по критериям производительности и надежности

Представим множество оценок вариантов металлорежущих станков в пространстве критериев (рис.9.2):

Парето – эффективными решениями здесь являются варианты станков С 5 , С 7 и С 9 .

Рис.9.2. Пример поиска Парето – эффективных решений

Метод решения многокритериальных задач оптимизации с использованием обобщенного (интегрального) критерия

Суть данного метода заключается в том, что частные критерии каким - либо образом объединяются в один интегральный критерий , а затем находится максимум или минимум данного критерия.

Если объединение частных критериев производится, исходя из объектной взаимосвязи частных критериев и критерия обобщенного, то тогда оптимальное решение будет корректно. Но такое объединение осуществить крайне сложно или невозможно, поэтому, как правило, обобщенный критерий есть результат чисто формального объединения частных критериев.

В зависимости от того, каким образом частные критерии объединяются в обобщенный критерий различают следующие виды обобщенных критериев:

Частные критерии имеют различную физическую природу и поэтому различную размерность. А значит просто суммировать их некорректно. В связи с этим в предыдущей формуле числовые значения частных критериев делятся на некоторые нормирующие делители, которые назначается следующим образом:

1. В качестве нормирующих делителей принимаются директивные значения параметров или критериев, заданные заказчиком. Считается, что значения параметров, заложенные в техническом задании, являются оптимальными или наилучшими.

2. В качестве нормирующих делителей принимаются максимальные (минимальные) значения критериев, достигаемые в области допустимых решений.

Размерности самих частных критериев и соответствующих нормирующих делителей одинаковы, поэтому в итоге обобщенный аддитивный критерий получается безразмерной величиной.

Пример . Определить оптимальный вариант машины с использованием обобщенного (интегрального) аддитивного критерия. Частными критериями, с помощью которых оценены варианты машины, являются ее производительность и надежность (наработка на отказ). Оба критерия «работают» на максимум, т.е. наилучшими вариантами машины являются те из них, которые обеспечивают наибольшую ее производительность и надежность. Исходные данные для решения задачи приведены в таблице 9.2.

Таблица 9.2. Исходные данные для определения оптимального варианта исполнения машины

Целевая функция на основе аддитивного критерия запишется следующим образом:

В качестве нормирующих делителей в данной задаче примем наилучшие (максимальные) значения частных критериев:

Значения обобщенного аддитивного критерия рассчитываются для каждого варианта машины:

Вариант 1.

F (X ) = 0,6(1000/4000) + 0,4(1500/1500) = 0,55.

Вариант 2

F (X ) = 0,6(2000/4000) + 0,4(1000/1500) = 0,558.

Вариант 3

F (X ) = 0,6(4000/4000) + 0,4(500/1500) = 0,732.

Оптимальным является 3 вариант машины , т.к. ему соответствует максимальное значение обобщенного аддитивного критерия.

Один из недостатков этого метода заключается в том, что весовые коэффициенты назначает проектировщик. Разные проектировщики могут назначать разные весовые коэффициенты. Пусть, например, C 1 = 0,4; C 2 = 0,6. Определим теперь значения аддитивных критериев для вариантов машины:

Вариант 1.

Вариант 2.

Вариант 3.

Т.е. при таком изменении значений весовых коэффициентов оптимальным уже будет 1 вариант машины.

Преимущество данного метода: как правило, всегда удается определить единственный оптимальный вариант решения.

Введение………………………..………………………………………………2

1.Построение модели……………………………………………………..6

2.Задача Лагранжа. Безусловный и условный экстремумы……………7

3.Задача Лагранжа с одним ограничением……………………………..11

4.Смысл множителей Лагранжа………………………………………...15

5.Простейшая модель управления запасами…………………………...18

6.Модель I. Модель Уилсона без ограничений……………………..….26

7.Модель II. Модель Уилсона с ограничениями на складские помещения……………………………………………………………...33

8.Рацион Робинзона……………………………………………………...38

9.Взаимные экстремальные задачи……………………………………..42

10.Модель потребительского выбора……………………………………44

11.Лабораторные задачи…………………………………………………..47

12.Заключение……………………………………………………………..51

Список использованной литературы………………………………...………52

Введение

Научная модель является отображением некоторых интересующих нас явлений (например, определенных объектов, событий, процессов, систем) и используется в целях управления и предсказания. Основная функция научной модели заключается не в том, чтобы описать явления, а в том, чтобы объяснить их. Модель должна помочь выяснить, каким образом некоторые стороны явления влияют на другие стороны или же на явления в целом. Если построена достаточно верная модель, то эти вопросы можно выяснить, производя соответствующие опыты на модели, не меняя характеристик изучаемого объекта.

Преимущества использования модели для этих целей особенно очевидны, когда опыты на самом объекте или невозможны, как, например, в астрономии, или очень дороги, как в сложных промышленных организациях. Но знание моделей этих далеко не исчерпывается. В самом дели, в некотором смысле научные теории, объясняющие определенные явления, аналогичны моделям этого явления, потому наука не могла бы существовать без моделей, как она не могла бы существовать без теории.

Таким образом, модели играют важнейшую роль в исследовательском процессе и поэтому неизменно возрастает интерес к их изучению. Существующие модели можно разделить на три типа: изобразительные (модели геометрического подобия), модели - аналогии и символические (математические).

Изобразительная модель отображает внешние характеристики системы (как фотография и ли модель самолета). Она подобна оригиналу. Многие фотографии, картины и скульптуры являются изобразительными моделями людей, различных предметов или сцен. Игрушечный автомобиль является изобразительной моделью “настоящего” автомобиля. Глобус является изобразительной моделью земного шара. В общем случае всякое отображение представляет собой изобразительную модель в той мере, в какой его свойства совпадают со свойствами оригинала. Правда, эти свойства обычно подвергаются метрическому преобразованию, т.е. берётся определенный масштаб. Например, глобус имеет уменьшенный диаметр по сравнению с земным шаром, хотя форма и относительные размеры континентов, морей и т.д. приблизительно правильные. Модель атома, наоборот, имеет увеличенные размеры, чтобы его можно было разглядеть не вооруженным глазом. Масштаб в модели вводится для экономии и удобства пользователя. В обычных условиях гораздо легче работать с моделью здания, атома или производственной системы, чем с самим объектом. Так, с опытным заводом, который является уменьшенной моделью полного завода, работать гораздо легче, чем с настоящим заводом.

Изобразительные модели хорошо приспособлены для отображения статического или динамического явления в определенный момент времени. Например, фотография или схема производственных потоков может дать хорошую “картину” работы завода. Но такие модели не подходят для отображения динамики явлений, например для отображения рабочих операций, на заводе. Поэтому они не годятся для изучения изменяющегося процесса, или динамики системы.

Хотя изобразительная модель и подобна оригиналу, она, как и другие типы моделей, отличается от оригинала и не может отразить всех его свойств. В ней отображается только свойства оригинала, существенные для задач, решаемых с помощью данной модели. Этой избирательностью во многом определяется экономичность использования любой научной модели.

Модель - аналог использует ряд свойств одного явления для отображения свойств другого явления (например, в некоторых случаях поток воды через трубы можно принять за аналог “потока” электричества по проводам).

При построении модели различных объектов, событий, процессов или систем не всегда можно простым изменением масштаба изобразить все интересующие нас свойства. Например, мы не можем наглядно представить на глобусе геометрическую структуру Земли. Но мы легко можем представить различные геометрические формации с помощью разноцветной окраски. При этом мы производим подмену одного свойства (цвет) другим (геометрическая структура) в соответствии с некоторыми правилами преобразования. В картографии, например, такое преобразование является узаконенным, причем правила для преобразования приводятся в легенде. В легенде на карте приводится также перечень обозначений: например, сплошная линией обозначается грунтовая дорога, а пунктирной - шоссейная. Такая модель называется моделью - аналогом, поскольку в ней совокупность одних свойств представляется с помощью совокупности других свойств.

Примером простой аналогии является графики. На графиках пользуются расстоянием для отображения таких свойств, как время, число, проценты, вес, и многих других. Графики часто удобны для представления количественных соотношений и дают возможность предсказывать, как изменения одного свойства сказывается на другом свойстве.

Используя модели - аналоги, мы увеличиваем наши возможности проверять на модели изменения различных параметров. Обычно проще изменить модель - аналог, чем изобразительную модель.

Модели - аналоги удобны для отображения динамических процессов или систем. Можно построить модель, работа которой будет аналогична работе конвейера на заводе. Или можно отобразить колебания спроса путем соответствующего изменения некоторой входной величины модели. Однако на изобразительной модели, например уменьшенной действующей модели цеха, такое изменение провести трудно.

Другим преимуществом модели - аналога по сравнению с изобразительной моделью является большая универсальность этой модели. Так, незначительно изменение модели, можно отобразить различные процессы одного класса.

Символическая модель использует символы для отображения свойств изучаемой системы (с помощью математического уравнения или системы уравнений). Элементы модели и их взаимосвязь задаются с помощью символов (обычно математического или логического характера).

Во многих случаях построения моделей - аналогов затруднительно, поскольку изучение динамики явления отнимает много времени. Например, чтобы изучить с помощью аналоговой модели влияния колебания спроса на производственный процесс, нужно проделать на модели много опытов. Если же системы можно представить с помощью математического выражения, то влияние изменить какого-нибудь параметра можно установить с помощью математической дедукции за несколько шагов. Поэтому мы рассматриваем в основном символические модели.

1. Построение модели

Для постановки задачи необходима анализ системы, исследование её особенностей и возможных методов управления системой. Схема, построения в результате такого анализа, является либо изобразительной, либо аналоговой моделью. Таким образом, первый этап построения модели выполняется в процессе постановки задачи. После такого анализа системы уточняется перечень различных вариантов в решения, которые надо оценить. Затем определяются меры общей эффективности этих вариантов. Следовательно, следующий этап заключается в построении такой модели, в которой эффективность системы можно выразить в функции переменных, определяющих систему. Некоторые из этих переменных в реальной системе можно менять, другие переменные менять нельзя. Те переменные, которые можно изменить, назовем “управляемыми”. Различные варианты решения задачи необходимо выразить с помощью управляемых переменных.

Построение математической (символической) модели системы можно начать с перечисления всех элементов системы, которые влияют на эффективность работы системы. Если в качестве меры общей эффективности используется “общие ожидаемые издержки”, то можно начать с исследования изобразительной или аналоговой модели, полученной на стадии постановки задачи. Можно выделить операции и материалы, которым сопоставляется некоторые затраты. При этом получим, например, следующий исходный список:

1.Производственные затраты:

а) закупочная цена сырья;

б) издержки перевозки сырья;

в) стоимость приемки сырья;

г) стоимость хранения сырья;

д) стоимость планирования производства;

е) стоимость наладочных работ в цехе;

ж) стоимость процесса обработки;

з) стоимость хранения запасов в процессе производства;

и) стоимость завершения производства и передачи готовых изделий на склад;

к) стоимость анализа результатов работы группой планирования;

л) стоимость хранения готовых изделий.

2.Затраты на сбыт.

3.Накладные расходы.

2. Задача Лагранжа

Безусловный и условный экстремумы

Важное место в математиком аппарате экономики занимают оптимальные задачи - задачи, которых ищется наилучшее в определенном смысле решение. В экономической практике требуется использовать имеющиеся ресурс наиболее выгодным образом. В экономической теории одним из отправных пунктов является постулат о том, что каждый экономический субъект, имея определенную свободу выбора своего поведения, отыскивает наилучший со своей точки зрения вариант. И оптимизационные задачи служат средством описания поведения экономических субъектов, инструментом исследования закономерностей этого поведения.

Многие задачи оптимизации формулируются следующим образом. Решение, которое должен принять субъект, описывается набором чисел х1 ,х2 ,…,хn (или точкой Х=(х1 ,х2 ,…,хn) n-мерного пространства). Достоинства того или иного решения определяются значениями функция f(X) = f(х1, х2 ,…,хn) — целевой функции. Наилучшее решение — это такая точка Х, в которой функция f(Х) принимает наибольшее значение. Задача нахождения такой точки описывается следующим образом:

Если функция f(X) характеризует отрицательные стороны решения (ущерб, убытки и т. п.), то ищется точка Х, в которой значение f(X) минимально:

Минимум и максимум объединяются понятием экстремума. Для определенности мы будем говорить только о задачах максимизации. Поиск минимума не требует специального рассмотрения, поскольку заменой целевой функции f(X) на -f(Х) всегда можно “превратить недостатки в достоинства” и свести минимизацию к максимизации.

Из каких вариантов должен быть выбран наилучший? Иными словами, среди каких точек пространства нужно искать оптимум. Ответ на этот вопрос связан с таким элементом оптимизационной задачи, как множество допустимых решений. В некоторых задачах допустимыми являются любые комбинации чисел х1, х2,…,хn то есть множество допустимых решений - это все рассматриваемое пространство.

В других задачах следует принимать во внимание различные ограничения, означающие, что не все точки пространства доступны при выборе. В содержательных постановках задач это может быть связано, например, с ограниченностью располагаемого количества ресурсов.

Ограничения могут быть представлены в форме равенств вида

или неравенства

Если условия имеют несколько другую форму, скажем, g1(Х) = g2(X) или g(X)  A, то их можно привести к стандартному виду, перенеся в функции и константы в одну из частей равенства или неравенства.

Экстремум, отыскиваемый во всем пространстве, без каких-либо ограничивающих условий, носит название безусловного. Если целевая функция непрерывно дифференцируема, то, необходимое условие безусловного экстремума функции состоит в равенстве нулю всех ее частных производных:

Если же заданы ограничения, то экстремум ищется лишь среди точек, которые удовлетворяют всем ограничениям задачи, так как только такие точки являются допустимыми. В этом случае экстремум носит название условного.

Рассмотрим задачу поиска условного экстремума:

при условиях(2)

g1(Х) = 0; g2(Х) = 0, …, gn(Х) = 0,

все ограничения которой представляют собой равенства.

Если при этом целевая функция и все ограничивающие функции непрерывно дифференцируемы, то такую задачу мы будем называть задачей Лагранжа.

3. Задача Лагранжа с одним ограничением

Рассмотрим задачу, имеющую следующую структуру:

при условии (3)

Рассмотрим пример. По склону горы идет дорога, требуется найти на ней самую высокую точку. На рис. 1 представлена карта местности с нанесенными на нее линиями

равных высот; толстая линия - это дорога. Точка М, в которой дорога касается одной линий уровня, - это и есть наивысшая точка дороги.

Если Х = (х1, х2) - точка плотности, х1 и х2 - её координаты, то задаче можно придать следующую форму. Пусть f(Х) — высота точки Х над уровнем моря, а уравнение g(X) = 0 описывает дорогу. Тогда наивысшая точка дороги - решение задачи (3).

Если бы дорога проходила через вершину горы, то ее высшая точка была бы самой высокой точкой местности, и ограничение можно было бы не принимать во внимание.

Если же дорога не проходит через вершину, то, немного отклонившись от дороги, можно было бы подняться выше, чем двигаясь строго по дороге. Отклонение от дороги соответствует попаданию в такие точки, где g(X)  0; при малых отклонениях достижимую при этом высоту можно приближенно считать пропорциональной отклонению.

Идею решения задачи Лагранжа можно представить следующим образом: можно попытаться “исправить” рельеф местности так, чтобы отклонение от дороги не давало преимуществ в достижении высоты. Для этого нужно заменить высоту f(Х) функцией.

L(X) = f(X) - g(Х),

где множитель  подбирается таким образом, чтобы участок склона в окрестности точки М стал горизонтальным (слишком малое  не устранит преимуществ отклонений от дороги, а слишком большое - придаст преимущество отклонениям в противоположную сторону).

Теперь, поскольку рельеф L(X) делает площадку в окрестности точки оптимума горизонтальной, эта точка удовлетворяет равенствам

а так как точка лежит на дороге, то - и ограничению g(X) = 0.

Пример с горой и дорогой — лишь иллюстрация идеи; точно так же двумерный случай использован исключительно для наглядности. Подобным образом можно было бы рассуждать и в общем, n-мерном случае.

Справедливо следующее утверждение:

Если f(х1,…,хn) и g(х1,…,хn) - непрерывно дифференцируемые функции всех своих аргументов, то решение задачи

f(х1,…,хn)  max

при условии

g(х1,…,хn) = 0

удовлетворяет равенствам

L(х1,…,хn;) = f(х1,…,хn) — g(х1,…,хn).

Функция L(X; ) получила название функции Лагранжа (или лагранжиана) задачи (3), а коэффициент  — множителя Лагранжа.

Заметим, что равенство (5) — это представленное в другой форме ограничение g(Х) = 0.

Приведенные выше рассуждения, разумеется, не являются доказательством сформулированного здесь утверждения; они лишь помогают понять существо метода: составляющая g(Х) в составе функции Лагранжа должна уравновешивать возможное увеличение максимального значения функции g(Х) от нуля. Это обстоятельство в дальнейшем будет весьма полезно при обсуждении смысла множителя Лагранжа.

Рассмотрим чрезвычайно простой пример. Веревкой длины А требуется огородить на берегу моря прямоугольный участок наибольшей площади (берег считается прямолинейным).

Рис.3 к задаче Дидона

Обозначим стороны прямоугольника х1 и х2 (см. рис. 3). Решим сначала задачу без использования метода Лагранжа.

Очевидно, х2 = А - 2 х1 и площадь прямоугольника равна S = х1х2 = x1(А - 2х1). Рассматривая ее как функцию одного аргумента х1, нетрудно найти его значение, при котором площадь максимальна: х1 = А/4. Отсюда х2 = А/2. Максимальная площадь равна S* = А2/8.

Теперь рассмотрим эту же задачу в форме задачи Лагранжа:

при условии

2 х1 + х2 - А = 0

Лагранжиан этой задачи равен

L(х1,х2; ) = х1х2 - (2х1 + х2 - А),

и условия экстремума имеют вид

2 х1 + х2 = А

Подставляя значения х1 и х2 из первого и второго равенств в третье, находим, что 4 = А, откуда

 = А/4; х1 = А/4; х2 =А/2,

как и при решении первым способом.

Этот пример показывает распространенный способ решения задачи Лагранжа. Соотношения (4) и (5) образуют систему уравнений относительно х1,…,хn и ,. Система состоит из n + 1 уравнения - n уравнений вида (4) и одно уравнение вида (5). Число уравнений равно числу неизвестных. Из уравнений вида (4) можно попытаться выразить каждую из неизвестных х1,…,х2 через , то есть решить ее как систему из n уравнений, рассматривая  как параметр. Подставляя получившиеся выражения в уравнение (5) - нам известно, что оно совпадает с ограничением, - получаем уравнение относительно . Решая его, находят , после чего определяются исходные неизвестные х1,…,хn.

4. Смысл множителей Лагранжа

При решении задачи Лагранжа мы интересовались значениями х1,…,хn; кроме того, нас могло интересовать экстремальное значение целевой функции f(X). Но в процессе решения попутно было определено значение еще одной величины - множителя Лагранжа.

Оказывается, множитель Лагранжа — весьма существенная характеристика решаемой задачи. Чтобы смысл ее стал яснее, несколько изменим формулировку ограничения, ничего не изменяя по существу.

Типичная экономическая ситуация характеризуется тем, что приходится искать наиболее выгодное решение при ограниченном количестве некоторого ресурса. Если r - заданное количество ресурса, а функция h(X) характеризует потребное его количество для достижения точки Х, то ограничению естественно придать форму

По характеру задачи часто бывает ясно, что для достижения оптимума ресурс нужно использовать полностью, так что ограничение может быть записано в виде равенства

F(r) = max f(X)  h(X) = r.

В правой части - принятое обозначение условного экстремума: после вертикальной черты выписывается условие.

Вспомним, что при обсуждении структуры лагранжиана мы интерпретировали g(Х) как составляющую, уравновешивающую возможный прирост максимума f(X) при отклонении g(X) от нуля. Но отклонение g(X) от нуля есть отклонение h(Х) от r. Если располагаемое количество ресурса получает приращение r, то мы должны ожидать приращение максимума функции f(X) на r.

В действительности это соотношение носит приближенный характер. Точный результат мы получили бы в пределе при r  0:

Таким образом, множитель Лагранжа характеризует скорость изменения максимума целевой функции при изменении ограничивающей константы r в ограничении вида (6).

В рассмотренном в предыдущем пункте варианте задачи Дидоны ограниченным ресурсом была длина веревки А. Максимальная площадь оказалось равной S(A) = A2/8. Отсюда dS(А)/dА = А/4, что в точности соответствует найденному при решении значению .

Приведем еще одно рассуждение. Для всевозможных точек Х найдем значения f(X) и h(Х) и отложим эти значения в виде точек в декартовых координатах (рис. 4). Если при каждом значении h(Х) существует максимум функции f(Х), то все точки расположатся ниже некоторой кривой, показанной на рисунке жирной линией.

Нас интересуют точки, соответствующие условию h(X) = r. Максимум f(X) помечен точкой М*; обозначим  наклон кривой в этой точке. Если в качестве ординаты брать не f(X), а L(X; ) =f(X) -  , то новая верхняя граница имела бы в точке М* горизонтальную касательную. Это значит, что в исходном n-мерном пространстве соответствующая точка М — стационарная точка функции L (X; ) с данным значением параметра . Таким образом,  - множитель Лагранжа.

Но жирная черная кривая — это график функции F(r), а  - его угловой коэффициент, откуда и следует равенство (7).

5. Простейшие модели управления запасами.

Рассмотренные ниже задачи связаны с оптимальным регулированием запасов. Эти задачи можно сформулировать следующим образом:

1.Моменты времени, в которые принимаются заказы на пополнение запасов, фиксированы. Остается определить объем и время заказов.

2.Необходимо определить и объем и время заказов.

1.Расходы, вызываемые оформлением и получением заказа при закупке или производстве. Это величина, не зависящая от размера партии, и, следовательно, переменная для единицы продукции.

2.Стоимость хранения единицы продукции на складе. Сюда включается затраты, связанные с организацией хранения, устареванием и порчей, расходы на страхование и налог.

3.Расходы (штрафы), возникает при истощении запасов, когда происходит задержка в обслуживании или спрос вообще невозможно удовлетворить.

Все затраты могут оставаться постоянными или изменяться как функции времени (например, в зависимости от сезона может быть различным штраф за зависимость хранения единицы товара на складе).

В задачах управления запасами учитывается также характеристики спроса и возможности пополнения запасов.

Спрос может быть известным или неизвестным, постоянным или зависящем от времени. Величина, характеризующая спрос, может быть как дискретной (например, количество автомобилей), так и непрерывной.

Спрос на запасенные товары может возникать в определенные моменты времени (спрос на мороженое на стадионе) или существовать постоянно (спрос на мороженное в большом аэропорту).

Заказы на пополнение запасов в ряде случаев могут выполняться немедленно (например, при заказе молока в небольшом магазине). В других случаях выполнение заказа требует значительного времени. Заказы можно делать в любые или только в определенные моменты времени.

Объем поступающий на склад продукции может измеряться дискретной или непрерывной и может быть как постоянным, так и переменным. Само поступление может быть дискретным и непрерывным и происходить равномерно или неравномерно.

Примем следующие обозначения:

q - объем заказа (при пополнении запасов);

q0 - оптимальный размер заказа;

t - интервал времени;

ts - интервал времени между двумя заказами;

tso - оптимальный интервал времени между заказами;

T - период времени, для которого ищется оптимальная стратегия;

R - полный спрос за время Т;

C1 - стоимость хранения единицы продукции в единицу времени;

C2 - величина штрафа за нехватку одной единицы продукции (в определенный момент времени).

Cs - стоимость заказа (при покупке или производстве),

Cs - ожидаемые суммарные накладные расходы;

Qo - минимум ожидаемых суммарных накладных расходов;

So - оптимальный уровень запасов к началу некоторого интервала времени.

Пусть некий предприниматель должен поставлять своим клиентов R изделий равномерно в течение интервала времени Т. таким образом, спрос фиксирован и известен. Нехватка товара не допускается, т.е. штраф при неудовлетворенном спросе бесконечно велик (C2 =). Переменные затраты производства складываются из следующих элементов: C1 - стоимость хранения одного изделия (в единицу времени), C2 - стоимость запуска в производство одной партии изделий.

Предприниматель должен решать, как часто ему следует организовывать выпуск партии и каким должен быть размер каждой партии.

Уравнение цен и его аналитическое решение. Только что описанная ситуация представлена графически на рис.5. Пусть q -размер партии, ts - интервал времени между запусками в производство партии, а R - полный спрос за всё времени планирования T.

Тогда R/q - число партий за время Т и

Если интервал ts начинается, когда на кладе имеется q изделий и заканчивается при.

отсутствии заказов, тогда q/2 - средний запас в течение ts (равенство q/2= qср следует рассматривать как приближенное. Точность его тем выше, чем больше R) q/2* C1 ts затраты на хранения в интервале ts.

Общая стоимость создания запасов в интервале ts равна сумме стоимости запуска в производство

Для вычисления полной стоимости создания запасов за время Т следует эту величину умножить на общее число партий за это время:

Подставляя сюда выражение для ts, получаем

Члены в правой части уравнений (44) представляют стоимость хранения и полную стоимость заказа в производстве всех партий. С увеличением размера партий первый член возрастает, а второй убывает. Решение задачи управления запасами и состоит в определении такого размера партии qo, при котором суммарная стоимость была бы наименьшей (рис. 6)

Найденное оптимальное значение qo размер партии

Для оптимальных tsо и Qo имеем

Пример I: Пусть предприниматель должен поставлять своему заказчику 24000 единиц продукции в год. Так как получаемая продукция используется непосредственно на сборочной линии и заказчик не имеет для нее специальных складов, поставщик должен единично отгружать дневную норму. В случаи нарушения поставок поставщик рискует потерять заказ. Поэтому нехватка продукции недопустима, т.е. штраф при нехватке можно бесконечным. Хранение единицы продукции в месяц стоит 0,1 долл. Стоимость запуска в производство одной партии продукции составляет 350 долл.

Требуется определить оптимальный размер партии q0, оптимальный период и tsо вычислить минимум общих ожидаемых годовых затрат Qо. В данном случае Т = 12 месяцам, R = 24 000 единиц, Сs = 0,1 долл./партия Сs = 350 дол/партия. Подстановка этих значений в уравнения (9), (10) и (11) дает нам.

Модель II.

Рассмотрим теперь случай, который отличается от предыдущего только тем, что превышение спроса над запасами уже допускается, т.е. штраф за нехватку конечный.

Уравнение цен и его аналитическое решение. Рассматриваемая ситуация изображена на рис. 7. В начале каждого интервала имеется уровень запасов. Из подобия треугольников находим.

Средний запас в течении t1, равен S/2. Поэтому затраты на хранение за всё время t1

составляют S/2 * t1 С1. Средняя нехватка (превышение спроса над уровнем запасов) за врем t2 равна (q-S)/2, и штраф за время t2 равна (q - S)/2, и штраф за время t2 составляет ((q - S)/2)* Q2 t2 .

Таким образом, ожидаемые суммарные расходы за всё время Т определяется следующим выражением:

Подставляя сюда найденные выше выражения для t1 и t2 учитывая полученное раннее выражение для ts, имеем

Из уравнения (12) можно найти оптимальные значения для q и S, при которых полные ожидаемый расходы будут минимальными.

После дифференцирования уравнения (12) имеем:

Приравнивая эти частные производные нулю и упрощая, получаем выражения,

Решая эту систему уравнений относительно S и q, находим

и, следовательно,

Что бы получить Qо, заменим, что

Поставляем (14) и (51) в (12), после упрощения получаем

При сравнении результатов, полученных для моделей I и II, можно заметить, что во первых уравнения (9), (10) и (11) можно получить из уравнения (13), (15), и (16), если в них устремиться С2 к бесконечности. Этот результат нельзя считать неожиданным, так как модель I есть частный случай модели II.

Во - вторых, если С2  , то

Следовательно, ожидаемые суммарные расходы в модели II меньше, чем в модели I.

Пример II: Пусть сохраняются все условия примера I, но только штраф С2 за нехватку теперь равен 0,2 долл. за одно изделие в месяц. И уравнения (13) - (16) получаем:

При оптимальной стратегии ожидаемый дефицит к концу каждого периода составлял бы 4578 - 3058 = 1522 изделия.

6. Модель I. Модель Уилсона без ограничений

В качестве простейшей модели управления запасами рассмотрим модель оптимизации текущих товарных запасов, позволяющих повысить эффективность работы торгового предприятия. Такая модель строится в следующей ситуации: некоторое торговое предприятие в течении фиксированного периода времени собирается завести и реализовать товар конкретного (заранее известного) объема и при этом необходимо смоделировать работу предприятия так, чтобы суммарные издержки были минимальны. При построении этой модели используется следующие исходные предложения:

1.планируется запасы только одного товара или одной товарной группы;

2.уровень запасов снижается равномерно в результате равномерно производимой продажи;

3.спрос и планируемом периоде заранее полностью определен;

4.поступление товаров производится строго в соответствии с планом, отклонения не допускаются, штраф при неудовлетворенном спросе бесконечно велик;

5.издержки управления запасами складывается только из издержек по завозу и хранению запасов.

Суммарные издержки будем считать зависящими от величины одной поставки q. Таким образом, задача оптимального регулирования запасов сводится к нахождению оптимального размера q0 одной постановки. Найдя оптимальное значение управляемой переменной q, можно вычислить и другие параметры модели, а именно: количество поставок n0, оптимальный интервал времени tso между двумя последовательными поставками, минимальные (теоретические) суммарные издержки Q0.

Введем следующие обозначения для заранее известных параметров модели:

T - полный период времени, для которого строится модель;

R - весь объем (полный спрос) повара за время T;

C1 - стоимость хранения одной единицы товара в единицы времени;

Cs - расходы по завозу одной партии товара.

Обозначим через Q неизвестную пока суммарную стоимость создания запасов или, что то же самое, целевую функцию. Задача моделирования состоит в построении целевой функции Q = Q(q). Суммарные издержки, будут состоять из издержек по завозу и хранению товара.

Полные издержки по хранению текущего запаса будет равны

т.е. произведению стоимости хранению одной единицы товара на “средний” текущий запас. По предложению 2 уровень запасов снижается равномерно в результате равномерно производимой продажи, т.е. если в начальный момент создания запаса он равен q, то в конце периода времени ts он стал равен 0 и тогда “средний” запас равен

Полные издержки по завозу товара будут равны

т.е. произведению стоимости завоза одной партии товара на количество поставок n, которые очевидно равны.

Тогда суммарные издержки управления текущими запасами составят

т.е. целевая функция Q является нелинейной функцией величины q, изменяющейся в пределах от 0 до R.

Таким образом, для задачи оптимального управления текущими запасами построена следующая математическая модель:

при ограничениях 0

определить значения q, обращающее в минимум нелинейную целевую функцию

Формализованная задача строго математически записывается в виде:

Решение задачи проведем по известной схеме. Вычисляем производную:

И приравниваем её к нулю:

Чтобы убедиться, что в точке q = q0 функция Q(q) действительно достигает своего минимума, вычислим вторую производную:

Итак, оптимальный размер одной поставки равен:

оптимальный средний текущий запас:

оптимальное число поставок:

оптимальный интервал между двумя последовательными поставками:

оптимальные (теоретические) издержки составят:

ПРИМЕР 1. Торговое предприятие в течение года планирует завести и реализовать сахар общим объёмом 10 тысяч тон. Стоимость завоза одной партии товара равна 1000 рублей, а хранение одной тонны сахара обходится в 50 рублей. Определить оптимальный размер одной поставки, чтобы суммарные расходы по завозу и хранению товара были минимальны, а также количество поставок, интервал времени между двумя последовательными поставками и минимальные (теоретические) суммарные издержки.

По условию задачи: R = 10000, Cs = 1000, C1 = 50, T = 12 мес.

По формулам (19), (21), (22) и (23) имеем:

Итак, оптимальный размер одной поставки равен 632 тонны, количество поставок nо равно 16, время tso между двумя последовательными поставками равно 23 дня, а минимальные суммарные расходы составят 31600 рублей.

Заметим, что условия рассмотренной задачи во многом являются идеализированными. На практике не всегда является возможным придерживаться полученных теоретических параметров модели управления запасами. Например, в рассмотренной задаче мы получили, что оптимальный размер одной поставки равен 632 тонны, но может так оказаться, что завод-изготовитель отпускает сахар только вагонами по 60 тонн. Значит, торговое предприятие вынуждено отклоняться от оптимального размера одной поставки. Поэтому важно определить такие пределы отклонения, которые не приводят к существенному возрастанию суммарных издержек.

Целевая функция Q(q) управления запасами является суммой двух функций - линейной и гиперболической. Изобразим её график схематически.

В области минимума она изменяется медленно, но с удалением от точки qo, особенно в сторону малых q, величина Q быстро возрастает. Определим доступные изменения размера одной поставки по доступному уровню возрастания издержек. Пусть торговое предприятие “согласно” на возрастание минимальных издержек в не более, чем  раз ( > 1), т.е. предприятие допускает издержки

Отклонение размера одной поставки q от оптимального зададим с помощью дополнительного параметра  в виде:

Тогда суммарные издержки при таком размере одной поставки будет равны:

из (24) и (25) следует:

Разрешая (26) относительно  получаем:

Пусть в примере 1 предприятие допускает увеличение суммарных издержек на 20% по сравнению с оптимальными, т.е.  = 1,2. Тогда по формулам (27) получаем: 1 = 1,2 - 1,44 - 1 = 0,54; 2 = 1,2 + 1,44 - 1 = 1,86. И интервал допустимых величин  есть 0,54    1,86. Тогда: 1qo = 0,54 * 632  341; 2qo = 1,86 * 632  1176 и объём одной постановки q может изменяться в интервале (1qo; 2q0) = (341; 1176). При этом суммарные издержки не превысят оптимальные более чем в 1, 2 раза.

Заметим здесь, что полученный допустимый интервал значений q не симметричен относительно qо, поскольку в сторону уменьшения значений q можно отклониться от qo на 632 - 341 = 291 единиц, а в сторону увеличения значений q можно отклоняться от q0 на 1176 - 632 = 544 единиц.

Такая асимметричность допустимых значений q относительно q0 легко объясняется из графика функции Q на рис.1: при отклонении влево от q0 график функции возрастает “быстрее”, чем при отклонении на такую же величину вправо от q0.

Рассмотренная выше модель конечно же достаточно проста и может применяться только на предприятиях реализующих один тип товара, что встречается крайне редко. Обычно у любого торгового предприятия имеются запасы самых различных товаров. Если при этом товар не является взаимозаменяемыми, то определение оптимальных размеров запасов производится отдельно по каждому товару, как это было показано выше. Взаимозаменяемые товары целесообразно объединить в группы и для них производить оптимизацию товарных запасов как для отдельных товаров. На практике, однако, не всегда можно воспользоваться такими рекомендациями, поскольку могут возникнуть другие ограничительные условия, в частности ограниченность размеров складских помещений. Такие ограничительные условия приводят к тому, что оптимальная по величине партия товара не может быть размещена в имеющийся складской емкости. Рассматриваемая далее модель учитывает такие ограничения.

7. Модель II. Модель Уилсона с ограничениями на складские помещения

Пусть торговое предприятие в течении периода времени Т должно завести и реализовать n видов товара. Соответственно обозначим:

Ri - полный спрос i - го товара за время Т;

C1i - стоимость хранения одной единицы i-го товара планируемом периоде времени;

CSi - расходы по завозу одной партии i - го товара;

Vi - объем складского помещения занимаемый одной единицей i -го товара.

V - вся ёмкость складского помещения.

Все эти значения считаются заранее известными. Неизвестный пока размер одной поставки i-го товара обозначим через qi, а через qio будем в дальнейшем обозначать оптимальный размер одной поставки i-го товара.

Тогда в соответствии с (2) полные издержки по завозу и хранению i-го товара будут равны:

а суммарные издержки по всем видам товара принимают вид:

qi  Ri, qi  0 (30).

Итак, приходим к следующей задаче Лагранжа:

Найти минимум нелинейной функции (12) при линейных ограничениях (29) и (30). Функция Лагранжа рассматриваемой задачи (28) - (30) имеет вид:

Функция Лагранжа (31) совпадает с целевой функцией (28) в случаи если в (31)

Следуя алгоритму решения задачи Лагранжа, найдем частные производные функции (31) по всем qi и прировняем их к нулю:

Каждое из уравнений системы (34) определяет соответствующее значение

где в правой части все значения параметров известны за исключением множителя . Для определения значения подставим выражения qi в условие (32). Получаем:

В соотношении (36) все величины, кроме , заранее известны, т.е. оно является иррациональным уравнением с одним неизвестным. Его всегда можно разрешить относительно множителя . Найдя значения  = 0, можно определить оптимальные величины поставок каждого из товаров по формулам:

Теперь можно рассматривать конкретный пример.

Пусть торговое предприятие намерено завести и реализовать товар трех видов (n = 3) объемами соответственно 24 тыс. ед, 20 тыс. ед. и 16 тыс. ед. Весь объем складских помещений составляет 18 000 куб. м. Стоимость хранения одной единицы первого вида товара 6 руб., второго - 8 руб., третьего - 10 руб. Расходы по завозу одной партии первого вида товара 1200 руб., второго - 1600 руб., третьего - 2000 руб. При этом одна единица первого вида товара занимает 3 куб. м., второго - 4 куб. м., третьего - 5 куб. м. Найти оптимальные размеры поставок каждого из видов товара. По условию имеем:

R1 = 24000, R2 = 20000, R3 = 16000;

C11 = 6, C12 = 8, C13 = 10;

Cs1 = 1200, Cs2 = 1600, Cs3 = 2000;

V1 = 3, V2 = 4, V3 = 5;

Составляем уравнение вида (36) для определения значения множителя ;

откуда о = - 2,41.

Найдем величины оптимальных поставок каждого из товаров по формулам (37):

Проверим выполнимость условия (29) при найденных объемах оптимальных поставок. Должно выполняться:

V1 * q1о + V2 * q2о + V3 * q3о  V = 18000.

3 * 1677 + 4 * 1531 + 5 * 1369 = 5031 + 6124 + 6845 = 18000.

Выполнимость неравенства (29) служит подтверждением того, что объемы оптимальных поставок определены верно. Более того. Неравенство (29) в нашем примере выполнилось как равенство, что говорит о том, что при первом завозе товара все складские помещения будут заполнены максимально полно. С течением времени, при последующих завозах товара, картина будет конечно же не столь идеальной и какая та часть складских помещений будет не заполнена.

Здесь можем заметить одну небольшую “уловку” в этом примере исходные данные в примере подобраны так, что иррациональное уравнение (*) вида (36) имеет во всех трех слагаемых один и тот же знаменатель, что конечно же упрощает решение уравнения. Эта “уловка” использована для облегчения рассмотрения примера, поскольку нашей главной целью в настоящий момент не является возможность разрешения иррационального уравнения. И тем не менее, возникает вопрос: а что же делать, когда при использовании этой модели на практике исходные данные будут таковы, что нашей “уловкой” воспользоваться будет невозможно. Ответ на этот вопрос достаточно прост: в современной математике разработаны десятки методов приближенных решений уравнений и потому значения множителя  можно определить из уравнения (36) приближенно с любой степенью точности. К тому же несмотря на нашу “уловку” облегчающую нахождения значения , тем не менее мы определили его приближение. С учетом выше сказанного, можем прийти к выводу, что использованная “уловка” не сужается общностью рассмотрения модели.

8. Рацион Робинзона

Обратимся теперь к задаче о потреблении примерно в таком виде, в каком ее ставил Госсен.

Человек может потреблять блага n видов в количествах хi, i = 1, …, n. Общая полезность потребления i-того блага описывается функцией TUi(xi). Предельная полезность MUi(хi) = dTUi(хi)/dxi убывает с ростом хi - в этом состоит закон Госсена. Полезность потребления всех: благ суммируется по отдельным благам, так что

Будем считать, опять-таки следуя Госсену, что потребительские возможности человека ограничены лишь временем, которое он может затачивать на добывание и потребление благ, как это имело место у Робинзона Крузо. Если на единицу i-того блага ему приходится тратить ti единиц времени, то ресурсное ограничение выражается равенством

где Т — фонд времени, выделяемый на потребление благ.

Оптимизация - процесс нахождения экстремума (глобального максимума или минимума) определённой функции или выбора наилучшего (оптимального) варианта из множества возможных. Наиболее надёжным способом нахождения наилучшего варианта является сравнительная оценка всех возможных вариантов (альтернатив). Если число альтернатив велико, при поиске наилучшей обычно используют методы математического программирования. Применить эти методы можно, если есть строгая постановка задачи: задан набор переменных, установлена область их возможного изменения (заданы ограничения) и определён вид целевой функции (функции, экстремум которой нужно найти) от этих переменных. Последняя представляет собой количественную меру (критерий) оценки степени достижения поставленной цели.

Задача безусловной оптимизации состоит в нахождении минимума или максимума функции в отсутствие каких-либо ограничений. Несмотря на то что большинство практических задач оптимизации содержит ограничения, изучение методов безусловной оптимизации важно с нескольких точек зрения. Многие алгоритмы решения задачи с ограничениями предполагают сведение ее к последовательности задач безусловной оптимизации. Другой класс методов основан на поиске подходящего направления и последующей минимизации вдоль этого направления. Обоснование методов безусловной оптимизации может быть естественным образом распространено на обоснование процедур решения задач с ограничениями.

Задача условной оптимизации заключается в поиске минимального или максимального значения скалярной функции f(x) n-мерного векторного аргументах. Решение задачи основывается на линейной или квадратичной аппроксимации целевой функции для определения приращений x1, …,xn на каждой итерации. Существуют также приближенные методы решения нелинейных задач. Это методы основанные на методе кусочно-линейной аппроксимации. Точность нахождения решений зависит от количества интервалов, на которых мы находим решение линейной задачи, максимально приближенной к нелинейной. Такой метод позволяет производить расчеты с помощью симплекс-метода. Обычно в линейных моделях коэффициенты целевой функции постоянны и не зависят от значения переменных. Однако существует ряд задач, где затраты зависят от объема нелинейно.

Алгоритм решения:

  • 1. Работа начинается с построения регулярного симплекса в пространстве независимых переменных и оценивая значения целевой функции в каждой из вершин симплекса.
  • 2. Определяется вершина - наибольшее значение функции.
  • 3. Вершина проецируется через центр тяжести остальных вершин в новую точку, которая используется в качестве вершины нового симплекса.
  • 4. Если функция убывает достаточно плавно, итерации продолжаются до тех пор, пока либо не будет накрыта точка min, либо не начнется циклическое движение по 2 или более симплексам.
  • 5. Поиск завершается, когда или размеры симплекса, или разности между значениями функции в вершинах останутся достаточно малыми.

Задача: оптимизация емкостей. Добиться минимальных затрат на изготовление емкости объёмом 2750 литров для хранения песка.

Z = C1X1 + C2X2 + C3X3 + C4X4 + C5X5 min;

где: X1 - количество необходимого металла, кг;

C1 - стоимость металла, руб/кг;

X2 - масса требующихся электродов, кг;

C2 - стоимость электродов, руб/кг;

X3 - количество затраченной электроэнергии, кВт ч;

C3 - стоимость электроэнергии, руб/кВт ч;

X4 - время работы сварщика, ч;

C4 - тарифная ставка сварщика, руб/ч;

X5 - время работы подъемника, ч;

C5 - оплата подъемника, руб/ч.

1. Найдем оптимальную поверхностную площадь емкости:

F = 2ab+2bh+2ah min (1)

где V=2750 литров.

x1=16,331; x2=10,99

Минимум функции получен в процессе оптимизации по методу Бокса- 1196,065 дм2

В соответствие с ГОСТ 19903 - 74, примем:

h=16,50 дм, b=10,00 дм.

Выразим a из (1) и получим:

Рассчитаем оптимальную толщину листа металла

Выберем углеродистую обыкновенную сталь Ст2сп

Для этой стали 320 МПа, ;

Масса песка.

Нагрузка на стенку емкости наибольшей площади:

Высчитаем нагрузку на 1 погонный сантиметр листа шириной 100 см:

Определим толщину стенки, исходя из условия:

где: l - длина листа (желательно наибольшая, чтобы оставить дополнительный запас прочности);

q - нагрузка на 1 погонный сантиметр, кг/см;

Толщина листа металла, м

Максимально допустимое напряжение металла, Н/мм2.

Выразим из (2) толщину стенки:

Учитывая, что 320 МПа = 3263 кг/см2,

Масса металла

где: F - площадь поверхности емкости, м2 ;

Толщина стенки металла, м;

Плотность металла, кг/м3.

Цена на сталь Ст2сп составляет около 38 руб/кг.

2. Длина сварного шва:

Воспользуемся электродами для нержавеющей стали «УОНИ-13/45»

Цена 88,66 руб/кг;

где: Sшва - поперечная площадь сечения сварного шва, м2;

l - длина сварного шва, м;

Плотность наплавленного металла, кг/м3.

3. Время сварки:

где l - длина сварного шва, м;

v - скорость сварки, м/ч.

Суммарная потребляемая мощность:

Рсум = 5 17 = 85 кВт ч;

Стоимость электроэнергии 5,7 руб/ кВт ч.

4. Для ручной дуговой сварки затраты вспомогательного, подготовительно-заключительного времени и времени на обслуживание рабочего места составляют в среднем 40 - 60%. Воспользуемся средним значением в 50%.

Общее время:

Оплата сварщика VI разряда - 270 руб/час.

Плюс тарифный коэффициент 17% за работу в замкнутом плохо проветриваемом пространстве:

Оплата помощника составит 60% от оплаты сварщика:

8055 0,6 = 4833 руб.

Итого: 8055+4833 = 12888 рублей.

5. Кран понадобиться для того, чтобы держать листы металла во время сварки, погрузки и выгрузки листов металла и непосредственно готовой емкости.

Чтобы «прихватить» всю конструкцию, сварщику необходимо наложить около 30% швов.

Оплата крана - 1000 руб/час.

Общая стоимость емкости.

Трудность решения задач нелинейной оптимизации обусловлена рядом факторов. Во-первых, при нелинейных ограничениях область допустимых решений может не быть выпуклой или даже состоять из ряда несвязанных областей. Во-вторых, процедура решения обычно позволяет выделить экстремум, но не дает гарантии, что этот экстремум глобальный. Эти и ряд других обстоятельств приводят к тому, что нелинейную задачу удается решить не всегда или же довольствоваться приближенным решением.

Задача на безусловный экстремум

Пусть в некоторой области n-мерного пространства R n задана функция п переменных WQQ. Требуется найти точки X * =(*1 х„), в которых эта функция имеет максимальные

(минимальные значения). Формально это можно записать так:

Задача (13.1) относится к множеству задач, которые объединены термином «задача на безусловный экстремум». Решение такого рода задач целиком и полностью определяется свойствами функции W(X).

Введем некоторые определения. Говорят, что функция W(X) имеет в точке X* локальный максимум (нестрогий), если при любых малых АХ имеет место условие

При выполнении же условия

говорят, что вХ* функция W(X) имеет минимум (нестрогий).

Если неравенства строгие («>» или «максимум (минимум ) называют глобальным («самый большой максимум» и «самый маленький минимум»).

Все точки максимума и минимума функции имеют обобщенное название - экстремумы. Очевидно, что глобальный экстремум является в то же время и локальным экстремумом. Функция W(X) может иметь в области своего определения один, несколько или даже бесконечное количество экстремумов. Она может и не иметь экстремума. На рис. 13.1 представлен график функции одной переменной Дх), рассматриваемой на отрезке [а; Ь]. Внутри отрезка эта функция имеет экстремумы в точках х, х 2 , х 3 , х 4 , х 5 . Из них точка х 2 - глобальный минимум, х 3 - глобальный максимум, а в точках х г и х 5 функция имеет локальные максимумы, в точке х 4 - локальный минимум. Отметим, что граничные точки также могут являться точками экстремума.


Рис. 13.1.

Нахождение точек, в которых функция имеет экстремум, является одной из важных задач математики, поскольку к ней сводится множество других, имеющих большое практическое значение задач. Где и как искать точки экстремума, т.е. как решать задачи безусловной оптимизации?

Пусть Дх) - функция одной переменной заданная на отрезке [а; Ь]. Точками экстремума функции Дх) могут быть лишь те точки, в которых выполняется одно из следующих условий:

  • 1) Дх) терпит разрыв (на рис. 13.2 - точка х 2);
  • 2) Дх) непрерывна, но производная/"(х) не существует (точках^;
  • 3) Д(х) = 0 (точки х 3 и х 4);
  • 4) граничные точки (точки х = а и х = Ь).

Точки, в которых выполняется хотя бы одно из этих условий, называются подозрительными на экстремум. Таким образом, функция может иметь экстремум только в точках, подозрительных на экстремум.

Если в формуле (13.1) функция дифференцируемая, то возможность решения этой задачи определяет теорема Вейерштрасса.

Рис. 13.2.

Теорема 13.1 (Вейерштрасса). Непрерывная функция, определенная на непустом замкнутом ограниченном множестве, достигает максимума (.минимума) по крайней мере в одной из точек этого множества.

Отметим, что эта теорема говорит лишь о возможности решения задачи (13.1), но не о методах ее решения.

В некоторых случаях могут быть сформулированы необходимые условия существования экстремума в точке. Так, для дифференцируемых функций имеет место следующее необходимое условие существования экстремума: если дифференцируемая функция f(x) имеет в точке х = х* экстремум, то ее производная обращается в этой точке в нуль, т.е. f"(x*) = 0.

Для функции нескольких переменных W(X) необходимое условие экстремума выполняется там, где все ее частные производные равны нулю, Например, для точки максимума имеем

Очевидно, что для точек, где достигается минимум, аналогичное условие также имеет место. Точки, в которых выполняется условие равенства нулю всех частных производных, называются стационарными.

Подчеркнем, что стационарность точки есть лишь необходимое условие существования в ней экстремума и далеко не во всех стационарных точках функция имеет экстремум. Однако выявление стационарных точек упрощает решение задачи.

Для дважды дифференцируемых функций сформулированы и достаточные условия существования экстремума, что обусловливает и соответствующий метод решения задачи (13.1). Имеет место следующая теорема.

Теорема 13.2 . Если в стационарной точке функция дважды дифференцируема и матрица ее вторых производных (матрица

Гессе ) положительно полуопределена, то функция в этой точке имеет минимум, если же матрица отрицательно полуопреде- ленна, то в этой точке функция имеет максимум.

Напомним, что симметрическая матрица называется положительно полуопределенной в точке, если все ее собственные значения неотрицательны или, что то же самое, все главные миноры матрицы Гессе неотрицательны. В этой точке функция имеет минимум. В случае отрицательно полуопределенной матрицы, когда все ее собственные значения неположительны или (что то же самое) главные миноры четной степени неположительны, матрица положительно полуопределена. В таких точках функция имеет максимум.

Пример 13.1

Найти экстремум функции Дх х, х 2) = х? + х| - 3xiX 2 .

Решение. Вначале вычислим первые частные производные и приравняем их к нулю:

Эта система имеет два решения - две стационарные точки: =

= (о, 0),Х 2 =(1, 1).

Составим матрицу Гессе:

Рассмотрим матрицу в каждой из найденных точек.

Для X, имеем Диагональные члены матрицы нулевые, а определитель равен -9. Следовательно, в точке Х 1 = (0, 0) функция имеет максимум.

Для Х 2 имеем . Диагональные члены положительны,

а определитель матрицы равен 27 > 0. Отсюда вывод: в точке Х 2 = (1,1) функция /(xj, х 2) = X] 3 +х| -ЗХ[Х 2 имеет минимум, т.е. min/(x x , х 2) = =/(1,1) =-1.

При поиске глобального экстремума необходимо, перебирая и сравнивая все точки локального экстремума, выбрать точки с наименьшим и наибольшим значениями функции. Процедуры поиска экстремумов аналитическими методами весьма сложны и не всегда работают. В связи с этим чаще используются алгоритмы, основанные на численных (приближенных) методах.

Метод дихотомии. Простейшим численным методом поиска экстремума функции одной переменной, не требующим вычисления производной, является метод деления отрезка пополам (методом дихотомии ). Этот метод позволяет уточнить расположение точки максимума (или минимума), когда предварительно найден отрезок, на котором эта точки непременно присутствует, и притом в единственном числе.

Пусть известная функция Дх) на отрезке [а; Ъ ] имеет один максимум, расположенный в неизвестной точке х*. Поскольку х* находится в неизвестной точке отрезка [а; Ь], то его называют отрезком неопределенности. Требуется с наперед заданной точностью г найти точку максимума функции Дх).

Идея метода дихотомии заключается в том, чтобы на каждом шаге сокращать отрезок неопределенности практически вдвое, до тех пор пока его длина не станет меньше заданной точности. Это делается следующим образом: отрезок неопределенности делится пополам, находится та половина, где лежит искомый максимум, затем этот отрезок вновь делится пополам и процедура продолжается.

Рассмотрим схему алгоритма этого метода немного детальнее. Пусть известно, что искомая точка х* находится на отрезке [а 0 ; Ь 0 ]. Выберем середину отрезка с 0 = (а 0 + Ь 0)/2. Далее анализируются два пересекающихся отрезка [а; с 0 + 5] и [с 0 -5; Ь], где 8 - малое число, много меньшее е, т.е. 8 «: е (иногда для удобства выбирают величину S/2). Очевидно, что если/(с 0 - б) >/(с 0 + б), то максимум находится на отрезке [а 0 ; с 0 + 5], иначе - на отрезке [с 0 - б; Ь 0 ]. Поэтому если выполнено условие/(с 0 - б) >/(с 0 + 5), то за новый интервал неопределенности принимается отрезок [а а; Ь х ], где а а = а 0 , Ь а = с 0 + 5, в противном случае - отрезок, где а 0 = с 0 - 8, Ь г = Ь 0 . Этот отрезок вновь делится пополам, и процедура продолжается до выполнения условия | fo fc - a fc |

Пример 13.2

Рассмотрим для примера следующую задачу: на отрезке найти точку минимума функции Дх) = 2х 2 - 4х + 4 с точностью до е = 0,5.

Решение. Выберем параметр 5 = 0,2. Исходный отрезок неопределенности - . Находим точки «середин» этого отрезка:

Вычислим в этих точках значения функции и сравним их:

В качестве нового отрезка неопределенности выбираем тот, где находится искомая точка минимума, т.е. = [а; х 2 ] = .

Вновь определим «средние» точки:

Поскольку ДО,95) е, поэтому продолжаем процесс:

Так как/(х 5) >/(х 6), то полагаем а 3 = х 5 , Ь 3 = Ь 2 . Новый отрезок неопределенности [а 3 ; Ь 3 ] = . Его длина 0,675 превышает заданную точность, поэтому продолжаем процесс дихотомии:

Поскольку Дх 7) = 2,1653, Дх 8) = 2,0153, то новым отрезком неопределенности будет [а 4 ; Ь 4 ] = . Этот отрезок имеет длину 0,4375, что меньше, чем 0,5. Следовательно, процесс дихотомии закончен. Из двух точек х 7 и х 8 в качестве искомого приближения х* выбираем точку х 8 , так как/(х 8)

Рис. 13.3.

Градиентные методы. Для функции многих переменных обычно применимы поисковые методы, основанные на свойстве градиента указывать в каждой данной точке направление наибольшего возрастания функции. Напомним, что градиентом скалярной функции W(x ь х 2 ,..., х„) называют вектор, состоящий из частных производных этой функции:

В основе любого градиентного метода лежит идея пошагового улучшения некоторого начального решения за счет движения к экстремуму исследуемой функции. Все многообразие методов заключается в различиях процедуры такого продвижения. Рассмотрим лишь одну из них.

Пусть найдено некоторое начальное решение задачи (13.1) Х° =(xJ) ,X2,...,x®) и выбран шаг h. Следующий и все последующие шаги выполняются последовательно согласно следующему рекуррентному соотношению:

Смысл формулы такой: из данной точки X й делается шаг длиной h в направлении, указанном градиентом. Знак «плюс» выбирается при поиске максимума, знак «минус» - в противоположном случае.

Таким образом, согласно формуле (13.4) на каждом шаге к каждая координата х, решения получает некоторое приращение в нужном направлении. Процесс продолжается до тех пор, пока не выполнится принятое условие завершения процесса. Условие завершения процесса определяется исследователем исходя из физической сущности задачи. Одной из форм условий может быть, например, такое:

где 8 - заранее назначенная малая величина - точность решения задачи. Возможно использование и такого условия завершения процесса:

Очевидно, что эффективность градиентного метода зависит от выбранного шага. Если шаг мал, то сходимость в общем случае будет медленной, если шаг большой, то может возникнуть эффект «перешагивания» точки экстремума и процесс не будет сходиться. В связи с этим в ходе решения задачи целесообразно сначала шаг взять достаточно большим, а затем постепенно его уменьшать. Можно, например, задаться изменением шага по формуле h k = h/k.

Пример 13.3

Найти минимум функции

Решение. Выберем начальную точку Х° =(3,1,1) и шаг h = 0,16. Значение функции в этой точке есть /(Х°) = 26, градиент - (4х х; 10х 2 ; 6х 3) = (12; 10; 6).

Проведем согласно формуле (13.4) первую итерацию:

Значение функции в новой точке/(X 1) =4,15.

Для второй итерации градиент равен (4,32; -6; 0,24), шаг h 2 = 0,08. Проведем вторую итерацию:

Значение функции в точке Х 2 следуюгцее: /(X 2) = 1,071. Налицо быстрая сходимость. Продолжая процесс по приведенной схеме, можно быстро приблизиться к точному решению задачи - (0, 0, 0).

Метод статистических испытаний (Монте-Карло). С развитием возможностей вычислительной техники широкое применение находят так называемые методы случайного поиска. Суть этих методов заключается в выборе величины и направления очередного шага случайным образом. Различают направленный и ненаправленный случайный поиск, случайный поиск с обучением и ряд других методов .

Схема простейшего метода случайного поиска максимума может быть такой. Определяется начальная (отправная) точка Х° и из этой точки в случайном направлении совершается перемещение на расстояние |й| в точку X 1 . При этом случайное направление формируется посредством генерации последовательности псевдослучайных чисел в количестве, равном числу переменных анализируемой функции, т.е. компонентами вектора h являются разыгранные значения случайной величины, равномерно распределенной на отрезке , где I - максимальное допустимое смещение по той или иной координате h е .

Если значение функции W (X 1) не увеличилось по сравнению с W(X°), то возвращаются в точку Х°. Разыгрывают новое направление и в этом направлении делают шаг. В том случае, если значение W(X*) > W(X°), точка X 1 принимается за отправную и процедура повторяется уже из этой точки. В противном случае попытка найти эффективное направление повторяется. В каждой очередной точке процедура поиска улучшающего направления повторяется не более заданного числа, например т раз. Та точка, из которой т раз подряд были совершены неудачные попытки увеличения значения анализируемой функции, принимается за точку максимума. В приложении 2 приведены пример и программа его решения на языке Visual Basic for Application.

Основное преимущество методов случайного поиска - в простоте их реализации и в том, что они не налагают никаких ограничений на вид функции W. Недостатки связаны с медленной сходимостью этих методов (для получения высокой точности требуется значительное число шагов). Однако в некоторых случаях они могут быть компенсированы посредством применением высокоскоростных компьютеров.