Observación:
- Si es una función
cuadrática entonces para cada y
-
- Toda función cuadrática en es continua, pues
es la suma de las funciones definidas como
con y cada una de éstas es una función continua
al ser el producto de una constante por dos funciones proyección:
y
Lema 6
Toda función cuadrática alcanza su valor mínimo en la
esfera unitaria de y
Si es la función cuadrática asociada a una matriz
real , entonces la desigualdad anterior equivale a
Demostración:
Sea El conjunto es cerrado y acotado y
es continua en , entonces restringida a alcanza
su valor mínimo
Si no es el vector cero, tenemos y entonces
Si entonces Por tanto, la desigualdad
vale para todo
La desigualdad () se tiene porque si es la función cuadrática
asociada, a
QED
Matriz positiva (negativa) definida y matriz indefinida
Definición 7
Una matriz simétrica y real es llamada positiva definida
si su función cuadrática asociada satisface
para todo vector en
Definición 8
Una matriz simétrica real es llamada:
Positiva semidefinida si
para todo
Negativa definida si
para todo vector en
Indefinida si la función cuadrática toma al menos un valor
positivo y otro negativo.
Lema 9
Si una matriz simétrica y real es
indefinida y es la función cuadrática asociada a entonces
existen vectores unitarios y en tales que
y
Demostración:
Como es indefinida, existen vectores y en tales que
y
Estos vectores son distintos del vector cero, pues Los vectores y son unitarios y
y
QED
Observaciones:
- Si es positiva definida, entonces es positiva semidefinida.
- es negativa definida si y sólo si es positiva definida.
Teorema 10
Si es una matriz positiva definida, entonces
su función cuadrática asociada restringida a alcanza un
valor mínimo positivo y se cumple que
Demostración:
Por el lema (
6), sólo falta probar que
Tenemos para algún .
Como es positiva definida, entonces , ya que para todo .
QED
Para dar una caracterización de las matrices positivas definidas vamos a
dar una generalización de la desigualdad de Cauchy-Schwarz.
Teorema 11 Desigualdad generalizada de Cauchy-Schwarz
Si es una matriz positiva semidefinida y entonces se cumple
Demostración:
Supongamos , y
Si la desigualdad es obvia, ya que y por ser positiva semidefinida.
Supongamos que
Para , tenemos por ser
positiva semidefinida. Por el Teorema (4) y dado que el
producto escalar conmuta, tenemos
Así,
Si , hagamos Entonces
Al despejar, obtenemos la desigualdad buscada
Por otra parte, no puede suceder que
por que si así fuera, entonces () se reduce a
para cualquier y para
llegamos al absurdo
QED
Corolario 12
Si es una matriz positiva semidefinida y entonces
Demostración:
Si la desigualdad es obvia porque por ser positiva semidefinida y
Supongamos En la desigualdad
generalizada de Cauchy tomemos y Entonces
Por la desigualdad de Cauchy-Schwarz en y dado que tenemos
Por otra parte, Al hacer las sustituciones en (), obtenemos
Así,
QED
Teorema 13
Sea una matriz real y simétrica y el mínimo,
en la esfera unitaria de , de su función cuadrática
asociada. Entonces es un valor característico de
Demostración:
Recordamos que y .
Como para cada entero y existe con , tal que
Probaremos primero que
En vista de que donde es la matriz identidad de tamaño
, tenemos
La matriz es positiva semidefinida, pues es simétrica y
para todo ya que por lema (6)
Del corolario anterior y la desigualdad (), se sigue que
Entonces
Por el Teorema del sandwich, obtenemos
Supongamos que no es un valor característico de . Entonces para todo y por el Corolario (2), la matriz es
invertible.
Para cada tenemos que
es un vector unitario.
Como
entonces
Así,
Al hacer tender a llegamos al absurdo debido a (
). Por tanto, es un valor característico de
QED
Teorema 14
Una matriz real y simétrica es
positiva definida si y sólo si cada uno de sus valores característicos es positivo.
Demostración:
Supongamos que es positiva definida y es un valor característico de
Hay un vector en tal que y como es positiva definida, entonces
De donde,
Recíprocamente, supongamos que todo valor característico de es
positivo.
De acuerdo con el teorema anterior
es un valor característico de y por nuestra hipótesis
Por el lema (6),
En particular, para todo Por tanto, es positiva definida.
QED
Combinando los teoremas anterior y el teorema(1) obtenemos:
Corolario 15
El determinante de una matriz positiva definida es
positivo.
Corolario 16
Si es una matriz positiva definida,
entonces es invertible y es positiva definida.
Demostración:
La matriz es invertible por tener determinante distinto de cero, de
hecho positivo.
Como y es
simétrica, entonces
Así, es simétrica.
Sea distinto de Existe con tal
que ya que es invertible. Debido a esto y
a que y
tenemos
Por consiguiente, es positiva definida.
QED
Corolario 17
Una matriz real y simétrica es negativa definida si y sólo si cada uno de sus valores característicos es negativo.
Demostración:
es negativa definida es positiva definida.
Un número real es valor característico de es un valor característico de
Por estas dos equivalencias y el Teorema (14), tenemos:
Supongamos que es negativa definida.
Si es un valor característico de , entonces
es un valor característico de y por tanto, por ser positiva definida. Así,
Recíprocamente, supongamos que todo valor característico de es
negativo. Entonces todo valor característico de es positivo y
es positiva definida, o sea es negativa definida.
QED
Corolario 18
Sea una matriz real, simétrica e
invertible. La matriz es indefinida si y sólo si no es positiva
definida ni negativa definida.
Demostración:
Supongamos que no es positiva definida ni negativa definida.
Por el Teorema (14) y el corolario anterior, existen
valores característicos y de tales
que y Hay dos
vectores unitarios en que satisfacen
Como es invertible, por hipótesis, entonces Y como es el producto de sus valores
característicos, entonces todo valor característico de es
distinto de Así, y
y
Es decir,
es indefinida.
Recíprocamente, si es indefinida entonces no es positiva definida
ni negativa definida, pues toma un valor positivo y otro negativo en
vectores distintos de cero.
QED
Los siguientes tres resultados están tomados de [1, Teoremas 27 y 29,
pp. 25,26].
Lema 19
Sea
una matriz positiva definida y
no necesariamente distintos entre sí. Definimos
Entonces
Demostración:
Si , hagamos
Definamos la matriz
Entonces
1.
2. Por la multiplicación de matrices y la definición de tenemos
de donde,
3.
Al desarrollar respecto al último renglón, tenemos
y por tanto,
Por otra parte,
En resumen,
De donde,
En resumen,
Al desarrollar respecto al último renglón,
obtenemos
Como y entonces
QED
Teorema 20
Sea
una matriz positiva definida, y .
Definimos
Entonces es positiva definida si y sólo si
Demostración:
Como es positiva definida, entonces es simétrica e invertible. Por
el lema anterior, se tiene
Probaremos que las siguientes afirmaciones son equivalentes
(i)
(ii)
(iii) es positiva definida, donde es como en el lema anterior.
(iv) es positiva definida.
(i) implica (ii). implica , pues ,
por ser positiva definida.
(ii) implica (iii). Supongamos que y sea
distinto de
Vimos en el lema anterior que
De donde,
Donde la desigualdad se debe a que ambos sumandos son mayores o iguales que
cero y al menos uno de ellos es positivo, puesto que , o bien, y es
positiva definida y por
hipótesis.
Por tanto, es positiva definida.
(iii) implica (iv). Supongamos que es positiva definida y sea
distinto del vector
Como es invertible existe tal que
Notamos que , por propiedades generales de la traspuesta.
Entonces
por ser positiva definida y De donde, es
positiva definida.
iv) implica i) Es el Corolario (15).
QED
Teorema 21
Una matriz real simétrica
es positiva definida si y sólo si
Demostración:
Supongamos que es positiva definida. Entonces Sean y un vector no cero, entonces es un vector distinto de De donde,
O sea, es positiva definida y por tanto,
Inversamente, supongamos que para cada
Como entonces la matriz es positiva definida. Por el teorema (20) y
dado que , por hipótesis, la matriz
es positiva definida. Aplicando sucesivamente este argumento para
concluimos que es positiva definida.
QED
Corolario 22
Una matriz real simétrica es negativa definida si
y sólo si para
cada
Demostración:
es negativa definida es positiva definida. Por el teorema
anterior, es positiva definida
QED
Máximo y mínimo de una función real de varias variables
Definición 23
Sean una función
de clase . La matriz hessiana de en
es la matriz simétrica
Es simétrica porque para y por ser de clase
La función cuadrática asociada a
es llamada la función hessiana de en (algunos
autores la llaman simplemente hessiano de en . Esta
función aplicada a la denotamos como por lo que
Cuando sea claro del contexto con qué función estamos trabajando
escribiremos en lugar de
Teorema 24 Teorema de Taylor de orden 1[1, Teorema 8, p.123]
Supongamos que es de
clase con abierto y sea , entonces,
existe tal que implica y se cumple
para y
donde es la función
hessiana de en
Demostración:
Por ser abierto existe tal que . Fijemos , con , definimos
Entonces
para todo
Fijemos y para cada definimos
Entonces es una función de clase en la bola abierta y por la igualdad ()
satisface que
Por el Teorema del valor medio para funciones reales de varias variables
para algún real que depende de
Sea Como tiene
derivadas parciales continuas en , por ser de clase en entonces cada es
derivable en , por lo que para cada , la función
con es tal que
y es claro que
Por la definición de () y la igualdad anterior
Por la igualdad (): tenemos
De donde,
Al sustituir esto en (): obtenemos
para cada Hacemos
y tenemos
Entonces
ya que y para por ().
QED
Criterio de máximos y mínimos para funciones de varias
variables
Definición 25
Dada una función
de clase y donde es un abierto de Decimos que es un punto estacionario si
el gradiente de en vale cero,
Con ayuda de los lemas anteriores, podemos probar el siguiente resultado.
Teorema 26
Supongamos que es de clase , con abierto y
es un punto estacionario de .
1.Si la matriz hessiana de en es positiva definida, el punto es un
mínimo relativo de
2. Si la matriz hessiana de en es negativa definida, el punto es un
máximo relativo de
3. Si la matriz hessiana de de
en es indefinida, entonces el punto es
un punto silla de
4. Si el determinante hessiano de en es cero, no se tiene
información.
Demostración:
Como es de clase y es un punto estacionario, entonces por el
teorema 24 existe tal que
si , donde es la función
cuadrática asociada a y
1. Supongamos que es positiva
definida, entonces por el Teorema (
10), existe tal que
Como
entonces existe tal que si , tenemos que
de donde,
Por () y () tenemos
y por ()
Por tanto, si
entonces
es decir, es un mínimo relativo estricto.
(2) Si es negativa definida, entonces es positiva definida, de donde es
un mínimo relativo estricto de entonces es un
máximo relativo estricto de
(3) Por último, supongamos que la matriz hessiana de en es indefinida. Por el
Lema (9), existen vectores unitarios y en tales que
y
Debemos probar que en cada bola abierta con centro en hay un punto donde vale
más que y otro donde vale menos
Por el teorema de Taylor,
donde es la función cuadrática
asociada a y
Así, existe tal que implica
con
Si para entonces
de donde
En particular,
y
Por tanto,
y
O sea,
y
(4) La función tiene un mínimo absoluto estricto en el origen y tiene
un máximo absoluto en el origen. En tanto que la función tiene un punto
silla en el origen. En los tres casos, el determinante hessiano de en el
origen es
QED
Observación:
Si en el teorema anterior es decir la matriz es invertible, y no son aplicables los apartados
(1) y (2) entonces es un punto silla de pues por el
Corolario (18), es entonces
indefinida y aplica el apartado (3).
Teorema 27 Criterio de la 2a derivada para funciones reales de variables
Supongamos que es de clase y , con abierto, es un punto estacionario
de . Para cada definamos
- Si
para todo , entonces el punto es un
mínimo relativo estricto de
- Si para todo , entonces el punto es un máximo relativo estricto de
- Si y
no son aplicables los apartados (1) y (2) anteriores, entonces el punto es un punto silla de
- Si
entonces no se tiene información.
Demostración:
Por el Teorema (
21):
para todo si y sólo si la matriz hessiana es positiva definida.
Por el Corolario (22):
para todo si y sólo si la matriz
hessiana es negativa definida.
Por tanto, los afirmaciones (1) y (2) se siguen del Teorema (26).
(3) Las hipótesis de los apartados (1) y (2) de este teorema equivalen a
decir que es positiva definida y
negativa definida, respectivamente. Si (1) y (2) no son aplicables, entonces
la matriz hessiana de no es positiva
definida ni negativa definida. Como entonces es indefinida, por el Corolario (18), y entonces es un punto silla, por el Teorema (26).
(4) Ya se vio en el Teorema (26).
QED
Casos particulares
Teorema 28 Criterio de la 2a derivada para funciones reales de dos variables
Sean una función
de clase con abierto, y un punto
estacionario de
- Si
y
entonces tiene un mínimo local estricto en
- Si
y
entonces tiene un máximo local estricto en
- Si entonces es un punto silla.
- Si entonces no se tiene información.
Demostración:
El teorema es consecuencia del Criterio de la 2a derivada para funciones
reales de variables, puesto que los apartados (1) y (2) son los de dicho
criterio, con
Asimismo, el inciso (3) es el inciso (3) de ese criterio para ya que
equivale a decir que y que no son aplicables los apartados (1) y (2).
En efecto, si entonces no son aplicables los apartados (1) y (2) y
Recíprocamente, si éstas dos últimas condiciones se satisfacen,
entonces o bien
Esta segunda desigualdad implica que y entonces aplicaría el
apartado (1) o el (2), lo que contradice lo supuesto. Por tanto,
(4) La función tiene un mínimo
absoluto estricto en el origen y tiene un máximo absoluto en el
origen. En tanto que la función tiene
un punto silla en el origen. En los tres casos, el determinante hessiano de en el origen es
QED
Teorema 29 Criterio de la 2a derivada para funciones reales de tres variables
Sean una función
de clase con abierto, y un punto estacionario de
- Si
entonces tiene un mínimo local estricto en
- Si
entonces tiene un máximo local estricto en
- Si y no son aplicables los apartados (1) y (2) anteriores, entonces es un punto silla
- Si
entonces no se tiene información.
Demostración:
Los incisos (1) y (2) son los del Criterio de la 2a derivada para funciones
reales de variables, con
El apartado (3) es el apartado (3) de ese criterio para
(4) La función tiene un mí
nimo absoluto estricto en el origen y tiene un máximo absoluto en
el origen. En tanto que la función tiene un punto silla en el origen. En los tres casos, el
determinante hessiano de en el origen es
QED
Al resolver problemas de máximos y mínimos de funciones de tres variables con una restricción, una estrategia es despejar una de las tres
variables en términos de las otras dos, digamos, y entonces encontrar los valores extremos
de la función . Si en la función
tiene un valor extremo, es necesario verificar que se satisfacen las hipótesis del teorema siguiente
para poder afirmar que
.
es un valor extremo de .
Teorema 30
Sean y dos funciones y .
Supongamos que y que existe una función tal que
Si la función tiene un
valor extremo relativo (estricto) en
entonces tiene el mismo tipo de valor extremo en
Demostración:
Supongamos que tiene un máximo relativo estricto en Es decir, existe tal que
y sólo se da la igualdad cuando
Veremos que la función restringida a , tiene un máximo
relativo estricto en
Sea tal que entonces , ya que
para algún por () y si , entonces
Supongamos que
entonces con
y . Por la desigualdad del triángulo,
de donde,
Así,
y sólo se da la igualdad cuando
y por lo tanto, tiene un máximo relativo estricto en
QED
Referencias
[1] Magnus, Jan R. y Neudecker, Heinz. Matrix differential calculus
with applications in statistics and econometrics. Wiley Series in
Probability and Statistics. John Wiley & Sons, Ltd., Chichester, 1999. 450
pp.