Skip to main content

Subgradient a subdiferenciál a Fenchelova transformace

\xdef\scal#1#2{\langle #1, #2 \rangle} \xdef\norm#1{\left\lVert #1 \right\rVert} \xdef\dist{\rho} \xdef\and{\&}\xdef\brackets#1{\left\{ #1 \right\}} \xdef\parc#1#2{\frac {\partial #1}{\partial #2}} \xdef\mtr#1{\begin{pmatrix}#1\end{pmatrix}} \xdef\bm#1{\boldsymbol{#1}} \xdef\mcal#1{\mathcal{#1}} \xdef\vv#1{\mathbf{#1}}\xdef\vvp#1{\pmb{#1}} \xdef\ve{\varepsilon} \xdef\l{\lambda} \xdef\th{\vartheta} \xdef\a{\alpha} \xdef\tagged#1{(\text{#1})} \xdef\tagged*#1{\text{#1}} \xdef\tagEqHere#1#2{\href{#2\#eq-#1}{(\text{#1})}} \xdef\tagDeHere#1#2{\href{#2\#de-#1}{\text{#1}}} \xdef\tagEq#1{\href{\#eq-#1}{(\text{#1})}} \xdef\tagDe#1{\href{\#de-#1}{\text{#1}}} \xdef\T#1{\htmlId{eq-#1}{#1}} \xdef\D#1{\htmlId{de-#1}{\vv{#1}}} \xdef\conv#1{\mathrm{conv}\, #1} \xdef\cone#1{\mathrm{cone}\, #1} \xdef\aff#1{\mathrm{aff}\, #1} \xdef\lin#1{\mathrm{Lin}\, #1} \xdef\span#1{\mathrm{span}\, #1} \xdef\O{\mathcal O} \xdef\ri#1{\mathrm{ri}\, #1} \xdef\rd#1{\mathrm{r}\partial\, #1} \xdef\interior#1{\mathrm{int}\, #1} \xdef\proj{\Pi} \xdef\epi#1{\mathrm{epi}\, #1} \xdef\grad#1{\mathrm{grad}\, #1} \xdef\hess#1{\nabla^2\, #1} \xdef\subdif#1{\partial #1} \xdef\co#1{\mathrm{co}\, #1}

Subgradient a subdiferenciál

Definice 2.5.1\D{2.5.1} (Subgradient a subdiferenciál)

Nechť XRnX \subseteq \R^n je konvexní množina. Vektor aRna \in \R^n se nazývá subgradient funkce f:XRf: X \to \R v bodě xXx^* \in X, jestliže f(x)f(x)a,xx(2.5.1) f(x) - f(x^* ) \geq \scal a {x - x^* } \tag{\T{2.5.1}} pro každé xXx \in X. Množina všech subgradientů funkce ff v bodě xx^* se nazývá subdiferenciál funkce ff v bodě xx^* a značí se f(x)\subdif f(x^* ). Funkce ff se nazývá subdiferencovatelná v bodě xx^* , jestliže f(x)\subdif f(x^* ) \neq \emptyset.

Jistě platí podle Věty 2.4.2\tagDeHere{2.4.2}{./konvexni-funkce} i gradf(x)f(x)\grad f(x^* ) \in \subdif f(x^* )

Speciálně, je-li f:XRRf:X \subseteq \R \to \R konvexní a xriXx^* \in \ri X, pak podle Věty 2.4.7\tagDeHere{2.4.7}{./konvexni-funkce} existují jednostranné derivace f+(x),f(x)f'_ +(x^* ), f'_ -(x^* ), přičemž platí f(x)f+(x)f'_ -(x^* ) \leq f'_ +(x^* ). V tomto případě pak máme f(x)=[f(x),f+(x)] \subdif f(x^* ) = [f'_ -(x^* ), f'_ +(x^* )]

Věta 2.5.4\D{2.5.4}

Nechť XRnX \subseteq \R^n je konvexní množina a f:XRf: X \to \R

  • Je-li funkce ff konvexní a xriXx^* \in \ri X, pak f(x)\subdif f(x^* ) je neprázdná, uzavřená a konvexní množina
  • Je-li f(x)\subdif f(x) neprázdná pro každé xXx \in X, pak ff je konvexní na XX

Fenchelova transformace

Fenchelova transformace je transformace, která k funkci f:XRnRf: X \subseteq \R^n \to \R přiřadí konvexní funkci f:RnRf^* : \R^n \to \R. Této přidružené funkci ff^* se v řeči optimalizace/matematického programování říká duální úloha (viz. TODO duální úloha).

Definice 2.6.1\D{2.6.1} (Fenchelova transformace)

Nechť f:RnRf: \R^n \to \R. Funkce f(y):=supxRn[x,yf(x)] f^* (y) := \sup_{x \in \R^n} [\scal x y - f(x)] se nazývá Fenchelova transformace funkce ff (nebo také (konvexně) konjugovanou funkcí funkce ff).

Jistě f:RnR{}f: \R^n \to \R \cup \set{\infty} a proto definujeme ještě efektivní definiční obor D(f)={xD(f)f(x)<}D^* (f) = \set{x \in D(f) \mid f(x) < \infty}

Lemma 2.6.3\D{2.6.3}

Nechť je dána funkce f:XRnRf: X \subseteq \R^n \to \R a ff^* je její Fenchelova transformace. Pak následující tvrzení jsou pravdivá:

  • Funkce ff^* je konvexní na množině Y:={yRnf(y)<}Y := \set{y \in \R^n \mid f^* (y) < \infty}
  • Pro každé xXx \in X a yRny \in \R^n platí tzv. Fenchelova(-Youngova) nerovnost
    f(x)+f(y)x,yf(x) + f^* (y) \geq \scal x y přičemž rovnost nastane právě tehdy, když yf(x)y \in \subdif f(x).
  • Je-li f(x)g(x)f(x) \geq g(x) na XX, pak f(y)g(y)f^* (y) \leq g^* (y) pro všechna yRny \in \R^n.
Věta 2.6.6\D{2.6.6} (Fenchel & Moreau)

Nechť XRnX \subseteq \R^n je konvexní množina a funkce f:XRf: X \to \R konvexní na XX. Pak v každém bodě spojitosti funkce ff platí tzv. Fenchelova rovnost f=f f^{** } = f

Jinak řečeno, druhá Fenchelova transformace ke konvexní funkci je s touto funkcí totožná, tj. fff^{**} \equiv f pro ff konvenxí. Navíc jelikož ff^* je vždy konvexní, tak dostáváme, že počítat třetí Fenchelovu transformaci ff^{* * * } nemá smysl, protože bude totožná s první Fenchelovou transformací ff^*

Definice 2.6.7\D{2.6.7} (Obálka funkce)

Nechť XRnX \subseteq \R^n je konvexní množina a f:XRf: X \to \R. Potom funkce g(x):=sup{h(x)h je konvexnıˊ a h(x)f(x)  xX} g(x) := \sup \set{h(x) \mid h \text{ je konvexní a } h(x) \leq f(x) \; \forall x \in X} se nazývá konvexní obálka (obal) funkce ff a značí se cof\co f.

Jinak řečeno, cof\co f je největší konvexní funkce, která je majorizována funkcí ff

Jistě platí D(cof)=conv(D(f))D(\co f) = \conv (D (f)), z čehož plyne conv(epif)epi(cof)\conv (\epi f) \subseteq \epi (\co f)