\( \def\vec#1{\bf{\underline{#1}}} \) Aus Beispiel \ref{Beispiel:hinreichendeBedingungNVariablen} ergibt sich, dass es nicht ausreicht, die direkten partiellen Ableitungen in $x_1-$ bzw. $x_2-$Richtung allein zu betrachten, um hinreichende Bedingungen für ein Maximum (bzw. Minimum) zu bekommen. Offensichtlich muss die Funktion auch auf Ihr Verhalten \glqq zwischen den Achsen\grqq betrachtet werden. Somit sind augenscheinlich auch die gemischten zweiten Ableitungen zu berücksichtigen.

Um alle zweiten Ableitungen betrachten zu können, werden diese in einer Matrix, der so genannten \emph{Hesse-Matrix}, zusammengefasst. Mit Hilfe der Hesse-Matrix kann die Bedingung der lokalen Konvexität bzw. Konkavität dann als quadratische Form geschrieben werden. Die Definitheit dieser quadratischen Form liefert dann hinreichende Bedingungen für ein Maximum (Minimum).

Um die Notation einfach zu halten, wird im Folgenden in der Regel für zweite Ableitungen die Newton-Notation $f_{ij}$ und nicht die Leibnitz-Notation ${\partial^2 f\over \partial x_i \partial x_j}$ benutzt. Bei Funktionen mit einer Variablen ist es hinreichend, dass die Funktion in der Umgebung eines Maximums abnimmt bzw. dass die Funktion in der Umgebung eines Minimums zunimmt. Dies ist auch auf Funktionen mit mehreren Variablen übertragbar. Die Änderung eines Funktionswerts, die durch die simultane Änderung von $x_1$ und $x_2$ (bzw. von $x_1, \dots, x_n$)erzeugt wird, wird durch das vollständige Differential ausgedrückt. Es gilt: $$f_{ij} := {\partial^2 f\over \partial x_i \partial x_j}$$
Beispiel

Es existiert eine Lösung $(x_1^*, x_2^*)$, so dass das erste vollständige Differential: \begin{eqnarray*} d f(x_1^*, x_2^*) = f_1(x_1^*, x_2^*) \cdot d x_1 + f_2 (x_1^*, x_2^*)\cdot dx_2 = 0 \end{eqnarray*} dann ist $(x_1^*, x_2^*)$ ein stationärer Punkt.

Im Weiteren muss die Frage geklärt werden, ob es sich beim Punkt $(x_1^*, x_2^*)$ um ein Minimum, Maximum oder um keines von beiden handelt?\\ Handelt es sich bei einem stationären Punkt $(x_1^*, x_2^*)$ um ein Maximum, so muss das vollständige Differential in der Umgebung von $(x_1^*, x_2^*)$ abnehmen. Andersherum muss das vollständige Differential in der von $(x_1^*, x_2^*)$ zunehmen, damit es sich im Punkt $(x_1^*, x_2^*)$ um ein Minimum handelt. Mit dem zweiten vollständigen Differential wird die Änderung des vollständigen Differentials angezeigt.Um zu prüfen, ob es sich um ein Minimum oder ein Maximum handelt, wird das Vorzeichen des vollständigen Differentials 2. Ordnung untersucht:
Beispiel

Es handelt sich um ein(lokales) Maximum, wenn $f(x_1,x_2)$ (lokal) konkav (in $(x_1^*, x_2^*)$) ist,d.~h. das zweite vollständige Differential (von $f(x_1, x _2)$) muss kleiner null sein: \begin{eqnarray*} d^2f = f_{11} \cdot (dx_1)^2 + f_{12} dx_1 \cdot dx_2 + f_{21} dx_2dx_1 + f_{22} (dx_2)^2 < 0 \end{eqnarray*} Bei Stetigkeit der zweiten Ableitungen gilt $f_{12} = f_{21}$ (Satz von Schwarz, Young's Theorem, vgl. \cite[S.156]{Leydold:2003} oder \cite[S.26]{Beckmann:1984}). \begin{equation} \label{eq:17} f_{11} \cdot dx_1^2 + f_{12} \cdot dx_1 \cdot dx_2 + f_{21} \cdot dx_1 \cdot dx_2 + f_{22} \cdot dx_2^2 < 0 \end{equation} Die Ungleichung \ref{eq:17} kann umgeformt werden zu: $$\begin{array}{cccccc} &\begin{pmatrix}dx_1 &dx_2\end{pmatrix} &\begin{pmatrix}f_{11}\cdot dx_1 + f_{12}\cdot dx_2\cr f_{21} \cdot dx_1 + f_{22}\cdot dx_2\end{pmatrix} \\ \\ = &\underbrace{\begin{pmatrix}dx_1 &dx_2\end{pmatrix}}_{\hbox{$\vec{x}^T$}} &\underbrace{\begin{pmatrix}f_{11} &f_{12}\cr f_{21} &f_{22}\end{pmatrix}}_{\hbox{$\rm\bf H$}} &\underbrace{\begin{pmatrix}dx_1\cr dx_2\end{pmatrix}}_{\hbox{$\vec{x}$}} &< &0\end{array}$$ % Das heißt, die quadratische Form $$\vec{x}^T \cdot {\rm\bf H} \cdot \vec{x}$$ muss negativ definit sein.\\ Bei der Bestimmung eines Minimums für eine Funktion mit mehreren Variablen wird analog zur oben skizzierten Vorgehensweise verfahren.

Hesse-Matrix

Die Bestimmung der Art der Extrema bei Funktionen mehrerer Variablen wird über die Definitheit der \emph{Hesse-Matrix} bestimmt, wie es in Kapitel \ref{chap:ch1-sec:QuadratischeFormen} geschildert wird. Die Elemente der Hesse-Matrix sind sämtliche partiellen zweiten Ableitungen einer Funktion mehrerer Variablen.

Definition [Hesse-Matrix]

Die Matrix $$\mathbf{H} = \begin{pmatrix}f_{11} && f_{12}\cr \cr f_{21} && f_{22}\end{pmatrix} = \begin{pmatrix}{\partial^2 f(x_1,x_2)\over \partial x_1^2} &&{\partial^2 f(x_1,x_2)\over \partial x_1 \partial x_2}\cr \cr {\partial^2 f(x_1,x_2)\over \partial x_2\partial x_1} &&{\partial^2 f(x_1,x_2)\over \partial x_2^2}\end{pmatrix}$$ heißt Hessesche Matrix bzw. Hesse-Matrix. (Vgl. \cite[S. 300]{Ohse:1995}, \cite[S. 53f]{Beckmann:1984}).
In der Hesseschen Matrix werden alle partiellen zweiten Ableitungen zusammengefasst. Sie ist symmetrisch, wenn die zweiten Ableitungen existieren und stetig sind.

Die Untersuchung der Hesseschen Matrix auf Definitheit wird benutzt, um hinreichende Bedingungen für ein Extremum zu gewinnen. Bei einer Funktion $y=f(\vec{x})$ mit $n$ Variablen $\vec{x} = (x_{1}, \ \dots \ , x_{n})$ ergibt sich entsprechend folgende Hessesche Matrix: $$\mathbf{H} = \begin{pmatrix}f_{11} &\dots &f_{1n}\cr \vdots &&\vdots\cr f_{n1} &\dots &f_{nn}\end{pmatrix} = \begin{pmatrix}{\partial^{2} f(\vec{x})\over \partial x_{1}^{2}} &\dots &{\partial^{2} f(\vec{x})\over \partial x_{1} \partial x_{n}}\cr \vdots &&\vdots\cr {\partial^{2} f(\vec{x})\over \partial x_{n}\partial x_{1}} &\dots &{\partial^{2} f(\vec{x})\over \partial x_{n}^{2}}\end{pmatrix}$$ Die Untersuchung dieser Matrix liefert hinreichende Bedingungen für ein Optimum \cite[S. 302]{Ohse:1995}.
Hinreichende Bedingungen

Die Funktion $f(x_1,\dots,x_n)$ hat in $\vec x^*$ genau dann Ist $\mathbf{H}$ in $\vec x^*$ semidefinit, so ist keine Entscheidung möglich. Ist $\mathbf{H}$ in $\vec x^*$ indefinit, so liegt kein Extremwert vor.