\( \def\vec#1{\bf{\underline{#1}}} \)
Aus Beispiel \ref{Beispiel:hinreichendeBedingungNVariablen} ergibt
sich, dass es nicht ausreicht, die direkten partiellen Ableitungen
in $x_1-$ bzw. $x_2-$Richtung allein zu betrachten, um
hinreichende Bedingungen für ein Maximum (bzw. Minimum) zu
bekommen. Offensichtlich muss die Funktion auch auf Ihr Verhalten
\glqq zwischen den Achsen\grqq betrachtet werden. Somit sind
augenscheinlich auch die gemischten zweiten Ableitungen zu
berücksichtigen.
Um alle zweiten Ableitungen betrachten zu können, werden diese in
einer Matrix, der so genannten \emph{Hesse-Matrix},
zusammengefasst. Mit Hilfe der Hesse-Matrix kann die Bedingung der
lokalen Konvexität bzw. Konkavität dann als quadratische Form
geschrieben werden.
Die Definitheit dieser quadratischen Form liefert dann
hinreichende Bedingungen für ein Maximum (Minimum).
Um die Notation einfach zu halten, wird im Folgenden in der Regel
für zweite Ableitungen die Newton-Notation $f_{ij}$ und nicht die
Leibnitz-Notation ${\partial^2 f\over \partial x_i
\partial x_j}$ benutzt.
Bei Funktionen mit einer Variablen ist es hinreichend, dass die
Funktion in der Umgebung eines Maximums abnimmt bzw. dass die
Funktion in der Umgebung eines Minimums zunimmt. Dies ist auch auf
Funktionen mit mehreren Variablen übertragbar.
Die Änderung eines Funktionswerts, die durch die simultane
Änderung von $x_1$ und $x_2$ (bzw. von $x_1, \dots, x_n$)erzeugt
wird, wird durch das vollständige Differential ausgedrückt. Es
gilt:
$$f_{ij} := {\partial^2 f\over \partial x_i \partial x_j}$$
Beispiel
Es existiert eine Lösung $(x_1^*, x_2^*)$, so dass das erste
vollständige Differential:
\begin{eqnarray*}
d f(x_1^*, x_2^*) = f_1(x_1^*, x_2^*) \cdot d x_1 + f_2 (x_1^*,
x_2^*)\cdot dx_2 = 0
\end{eqnarray*}
dann ist $(x_1^*, x_2^*)$ ein stationärer Punkt.
Im Weiteren muss die Frage geklärt werden, ob es sich beim Punkt
$(x_1^*, x_2^*)$ um ein Minimum, Maximum oder um keines von beiden
handelt?\\
Handelt es sich bei einem stationären Punkt $(x_1^*, x_2^*)$ um
ein Maximum, so muss das vollständige Differential in der Umgebung
von $(x_1^*, x_2^*)$ abnehmen. Andersherum muss das vollständige
Differential in der von $(x_1^*, x_2^*)$ zunehmen, damit es sich
im Punkt $(x_1^*, x_2^*)$ um ein Minimum handelt. Mit dem zweiten
vollständigen Differential wird die Änderung des vollständigen
Differentials angezeigt.Um zu prüfen, ob es sich um ein Minimum
oder ein Maximum handelt, wird das Vorzeichen des vollständigen
Differentials 2. Ordnung untersucht:
Beispiel
Es handelt sich um ein(lokales) Maximum, wenn $f(x_1,x_2)$ (lokal)
konkav (in $(x_1^*, x_2^*)$) ist,d.~h. das zweite vollständige
Differential (von $f(x_1, x _2)$) muss kleiner null sein:
\begin{eqnarray*}
d^2f = f_{11} \cdot (dx_1)^2 + f_{12} dx_1 \cdot dx_2 + f_{21}
dx_2dx_1 + f_{22} (dx_2)^2 < 0
\end{eqnarray*}
Bei Stetigkeit der zweiten Ableitungen gilt $f_{12} = f_{21}$
(Satz von Schwarz, Young's Theorem, vgl.
\cite[S.156]{Leydold:2003} oder \cite[S.26]{Beckmann:1984}).
\begin{equation}
\label{eq:17} f_{11} \cdot dx_1^2 + f_{12} \cdot dx_1 \cdot dx_2 +
f_{21} \cdot dx_1 \cdot dx_2 + f_{22} \cdot dx_2^2 < 0
\end{equation}
Die Ungleichung \ref{eq:17} kann umgeformt werden zu:
$$\begin{array}{cccccc}
&\begin{pmatrix}dx_1 &dx_2\end{pmatrix}
&\begin{pmatrix}f_{11}\cdot dx_1 + f_{12}\cdot dx_2\cr f_{21}
\cdot
dx_1 + f_{22}\cdot dx_2\end{pmatrix} \\
\\
= &\underbrace{\begin{pmatrix}dx_1
&dx_2\end{pmatrix}}_{\hbox{$\vec{x}^T$}}
&\underbrace{\begin{pmatrix}f_{11} &f_{12}\cr f_{21}
&f_{22}\end{pmatrix}}_{\hbox{$\rm\bf H$}}
&\underbrace{\begin{pmatrix}dx_1\cr
dx_2\end{pmatrix}}_{\hbox{$\vec{x}$}} &< &0\end{array}$$
%
Das heißt, die quadratische Form
$$\vec{x}^T \cdot {\rm\bf H} \cdot \vec{x}$$
muss negativ definit sein.\\
Bei der Bestimmung eines Minimums für eine Funktion mit mehreren
Variablen wird analog zur oben skizzierten Vorgehensweise
verfahren.
Hesse-Matrix
Die Bestimmung der Art der Extrema bei Funktionen mehrerer
Variablen wird über die Definitheit der \emph{Hesse-Matrix}
bestimmt, wie es in Kapitel \ref{chap:ch1-sec:QuadratischeFormen}
geschildert wird. Die Elemente der Hesse-Matrix sind sämtliche
partiellen zweiten Ableitungen einer Funktion mehrerer Variablen.
Definition [Hesse-Matrix]
Die Matrix
$$\mathbf{H} =
\begin{pmatrix}f_{11} && f_{12}\cr \cr f_{21} && f_{22}\end{pmatrix}
=
\begin{pmatrix}{\partial^2 f(x_1,x_2)\over \partial x_1^2}
&&{\partial^2 f(x_1,x_2)\over \partial x_1 \partial x_2}\cr \cr
{\partial^2 f(x_1,x_2)\over \partial x_2\partial x_1}
&&{\partial^2 f(x_1,x_2)\over \partial x_2^2}\end{pmatrix}$$
heißt Hessesche Matrix bzw. Hesse-Matrix. (Vgl. \cite[S.
300]{Ohse:1995}, \cite[S. 53f]{Beckmann:1984}).
In der Hesseschen Matrix werden alle partiellen zweiten
Ableitungen zusammengefasst. Sie ist symmetrisch, wenn die zweiten
Ableitungen existieren und stetig sind.
Die Untersuchung der Hesseschen Matrix auf Definitheit wird
benutzt, um hinreichende Bedingungen für ein Extremum zu gewinnen.
Bei einer Funktion $y=f(\vec{x})$ mit $n$ Variablen $\vec{x} =
(x_{1}, \ \dots \ , x_{n})$ ergibt sich entsprechend folgende
Hessesche Matrix:
$$\mathbf{H} =
\begin{pmatrix}f_{11} &\dots &f_{1n}\cr \vdots &&\vdots\cr f_{n1}
&\dots &f_{nn}\end{pmatrix}
= \begin{pmatrix}{\partial^{2} f(\vec{x})\over \partial
x_{1}^{2}} &\dots &{\partial^{2} f(\vec{x})\over \partial x_{1}
\partial x_{n}}\cr \vdots &&\vdots\cr {\partial^{2} f(\vec{x})\over
\partial x_{n}\partial x_{1}} &\dots &{\partial^{2} f(\vec{x})\over \partial
x_{n}^{2}}\end{pmatrix}$$
Die Untersuchung dieser Matrix liefert hinreichende Bedingungen
für ein Optimum \cite[S. 302]{Ohse:1995}.
Hinreichende Bedingungen
Die Funktion $f(x_1,\dots,x_n)$ hat in $\vec x^*$ genau dann
- ein Minimum, wenn $\mathbf{H}$ in $\vec x^*$ positiv definit ist
- ein Maximum, wenn $\mathbf{H}$ in $\vec x^*$ negativ definit ist
Ist $\mathbf{H}$ in $\vec x^*$ semidefinit, so ist keine
Entscheidung möglich.
Ist $\mathbf{H}$ in $\vec x^*$ indefinit, so liegt kein Extremwert
vor.