Nechť X⊆Rn je konvexní množina. Funkce f:X→R se nazývá
konvexní na X, jestliže pro všechna x1,x2∈X a každé λ∈[0,1] platí f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)(2.2.1)
ostře konvexní na X, jestliže nerovnost (2.2.1) je ostrá pro všechna x1,x2∈X,x1=x2 a každé λ∈(0,1).
silně konvexní na X s konstantou silné konvexnostiϑ>0, jestliže pro všechna x1,x2∈X a každé λ∈[0,1] platí (2.2.1)f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)−ϑλ(1−λ)∥x1−x2∥2(2.2.2)
V praxi je silná konvexnost "silnější" než ostrá konvexnost a ta je silnější než "obyčejná" konvexnost
Věta2.2.2 (Konvexnost nadgrafu)
Nechť X⊆Rn je konvexní množina a nechť f:X→R. Funkce f je konvexní na X právě tehdy, když její nadgraf (epigraf)
epif:=⎩⎨⎧bod[x,β]∈Rn+1∣x∈X,β≥f(x)⎭⎬⎫
je konvexní množina.
Pro ostře konvexní funkci musí "tyto dva body" vždy ležet nad sebou (myšleny jejich souřadnice na ose y). Navíc pro silnou konvexnost mezi nimi musí vždy být alespoň daná mezera.
Tyto body nemusí ležet nad sebou (na svislé přímce). Navíc ještě
Nechť X⊆Rn je konvexní množina, funkce f1,…,fm:X→R jsou konvexní na X a α1,…,αm≥0 jsou daná čísla. Potom F(x)=α1f1(x)+⋯+αmfm(x) je konvexní.
Věta2.2.4 (Sublevel set)
Nechť X⊆Rn je konvexní množina a f:X→R je konvexní funkce na X. Pak pro libovolné K∈R je odpovídající dolní vrstevnicová množina (sublevel set)
VK:={x∈X∣f(x)≤K}
také konvexní.
Platí pouze tato implikace: fkonvexní⟹sublevel set konvexní
Například x3 má konvexní sublevel set, ale sama konvexní není.
Přesněji říkáme, že pokud má funkce fkonvexnísublevel set, pak f je kvazikonvexní.
Věta2.2.5 (Jensen)
Nechť X⊆Rn je konvexní množina a funkce f:X→R je konvexní na X. Pak pro libovolné m∈N,x1,…,xm∈X a čísla λ1,…,λm≥0 splňující ∑i=1mλi=1 platí
f(i=1∑mλixi)≤i=1∑mλif(xi).(2.2.3)
Je-li navíc funkce fostře konvexní a λ1,…,λm∈(0,1), pak rovnost v (2.2.3) nastane právě tehdy, když x1=⋯=xm.
První část Věty 2.2.5 lze jistě podle Definice2.2.1 nahradit ekvivalencí
Z Jensenovy nerovnosti (2.2.3) lze odvodit například AG nerovnost mx1+⋯+xm≤mx1⋅…⋅xm
Lokalizace minima konvexní funkce
Věta2.2.6
Nechť X⊆Rn je konvexní množina a funkce f:X→R konvexní. Potom následující tvrzení jsou pravdivá
Libovolné lokální minimum funkce f na X je současně globálním minimem.
Množina bodů množiny X, v nichž funkce f nabývá svého minima na X, je konvexní. Je-li funkce dokonce ostře konvexní, pak je tato množina nejvýše jednoprvková.
Je-li funkce fdiferencovatelná na otevřené množině U⊇X a x∗∈X je jejím stacionárním bodem, tj. gradf(x∗)=0, pak x∗ je bodem globálního minima funkce f na množině X.
Z Věty 2.2.6 mimo jiné plyne, že je-li f:X→R (ostře) konvexní a spojitá funkce na konvexní a kompaktní množině X⊆Rn, pak f má na X (právě jedno) globální minumum.
Věta2.2.7 (Základní věta konvexního programování)
Máme-li konvexní funkci f:X→R na polytopu X:=conv{x1,…,xm}⊆Rn, pak je maximum funkce f na X dosaženo v některém z bodů x1,…,xm.
Obecněji: je-li X konvexní a kompaktní množina, pak maximum nastává v extrémním bodě (tj. v takovém bodě, který není netriviální konvexní kombinací dvou bodů z X)
Z Věty 2.2.7 plyne základní věta lineárního programování:
Je-li funkce fafinní (taková funkce je konvexní i konkávní zároveň), pak globální maximum nastává v některém z bodů x1,…,xm, tj. v některém z "vrcholů" polytopu.
Vlastnosti konvexních funkcí
Věta2.4.1 (Spojitost konvexní funkce)
Nechť X⊆Rn je konvexní množina a funkce f:X→R je konvexní na X. Pak f je spojitá pro každé x∈riX.
Dále ještě známe několik podmínek zaručujících spojitost funkce f:R→R:
má-li fvlastní derivaci v otevřeném intervalu I, pak f je (ostře) konvexní na I právě tehdy, když f′ je neklesající (rostoucí) na I.
má-li fvlastní derivaci v otevřeném intervalu I, pak f je (ostře) konvexní na I právě tehdy, když pro každé x,x∗∈I platí f(x)≥(>)f(x∗)+f′(x∗)(x−x∗),
tj. graf funkce f leží nad tečnou sestrojenou v libovolném bodě.
má-li f vlastní druhou derivaci v otevřeném intervalu I, pak f je konvexní na I právě tehdy, když funkce f′′(x)≥0 (je-li f′′(x)>0 na I, pak ostře konvexní)
Tyto tvrzení si nyní rozšiřme pro f:Rn→R pro silnou konvexnost s konstatnou ϑ (volbou ϑ=0 dostáváme ostrou konvexnost)
Věta2.4.2
Nechť X⊆Rn je konvexní množina a funkce f diferencovatelná na otevřené množině U⊇X. Pak f je silně konvexní na X s konstantou silné konvexnosti ϑ≥0 právě tehdy, když pro každé x,x∗∈X platí
f(x)≥f(x∗)+⟨gradf(x∗),x−x∗⟩+ϑ∥x−x∗∥2(2.4.1)
Ve (2.4.1) výraz ⟨gradf(x∗),x−x∗⟩ hraje úlohu tečné nadroviny v bodě x∗ s normálovým vektoremgradf(x∗) (tečným jak na nadrovinu, tak na funkci f v bodě x∗)
Důsledek2.4.5
Nechť X⊆Rn je konvexní množina splňující intX=∅. Nechť funkce f:X→R je dvakrát spojitě diferencovatelná na otevřené množině U⊇X s maticí druhých derivací ∇2f(x) (Hessova matice). Pak f je silně konvexní na X s konstantou silné konvexnosti ϑ≥0 právě tehdy, když pro každé x∈X a h∈Rn platí
⟨∇2f(x),h⟩≥2ϑ∥h∥2,(2.4.3)
jinými slovy ∇2f(x)≥2ϑI pro všechna x∈X.