Informace k prednasce "Kombinatoricka a vypocetni geometrie II"
(Jiri Matousek, Pavel Valtr, KAM)

LS 2002/2003
Rozsah vyuky: LETNI semestr 2/1 Z, Zk

Streda od 10:40 v Letenske 17 (seminarni mistnost ve 4. patre)

TERMINY ZKOUSEK (predbezne):

streda 21.5. dopoledne (prihlasky emailem P. Valtrovi do 19.5. rano)

streda 28.5. dopoledne

streda 11.6.

ctvrtek 19.6. 13:30
domaci ukol c. 2 (pri odevzdani do 21.5. se body nasobi koeficientem 1.5; na zapocet: 20 bodu celkove)

Anotace

Navazuje na prednasku Kombinatoricka a vypocetni geometrie I (Valtr, Matousek). Podobne zamereni. Zapocet bude za reseni dostatecneho poctu domacich ukolu. Letos je predbezne v planu napriklad neco z geometricke pravdepodobnosti (jako napriklad, jak velka je v prumeru minimalni kostra n nahodnych bodu v jednotkovem ctverci, a podobne). Pro predstavu, jak asi muze prednaska vypadat, se muzete podivat na latku lonske, ale temata se rok od roku meni.

Probrano:

1. prednaska 26.2. (J.M.)

Pravdepodobnost, ze konvexni obal n nahodnych nezavislych bodu na jednotkove kruznici obsahuje stred te kruznice, je rovna 1-2n/2^n. Trik: nejdriv se zvoli nahodne n dvojic protilehlych bodu, potom se z kazde dvojice nahodne vybere bod.
Zobecneni do vyssi dimenze: n nahodnych nezavislych bodu na S^{d-1}. Stejny trik, vede na pocitani bunek v arrangementu n "rovniku" na S^{d-1}, to se da delat pomoci rekurence (f_d(n)=f_d(n-1)+f_{d-1}(n-1)).
p_1,...,p_n nahodne nezavisle body ve ctverci, jaka je pravdepodobnost, ze jsou v konvexni poloze? (Pro n=4 Sylvesterova otazka). Prekvapive jednoducha formule [Valtr]: ((2n-2 nad n-1)/n!)^2.
My udelame jednodussi vysledek: Pravdepodobnost, ze ty body tvori spolu s levym dolnim a pravym hornim rohem ctverce konvexni retezec, je 1/(n!(n+1)!).
Prvni krok: jev M = body tvori monotoni posloupnost, pravdep. je 1/n!. Dukaz: pravdepodobnost, ze y-ove souradnice jsou usporadany podle permutace pi je pro kaznou permutaci pi stejna. To staci ukazat pro permutace, ktere se lisi jen vymenou sousednich prvku. Prislusna bijekce zamenuje y_{i-1} a y_i (a nechava vsechny ostatni souradnice na miste).
Druhy krok: definujeme a_i jako smernici usecky p_{i-1} p_i, i=1,2,...,n+1 (kde body jsou cislovany odleva doprava). Tvrzeni: pokud nastane M, pak pravdepodobnost, ze ty a_i jsou usporadany podle permutace pi, je stejna pro vsechny pi. Zase jen pro permutace lisici se transpozici sousednich. Prislusna bijekce nahrazuje x_i cislem x_{i-1}+(x_{i+1}-x_i) a y_i cislem y_{i-1}+(y_{i+1}-y_i), a jinak vse nechava.
Dusledek dukazu: efektivni algoritmus na generovani nahodneho konvexniho retezce (vygeneruj nahodne body, setrid x-ove a y-ove souradnice, uvaz usecky definovane vyslednou monotoni posloupnosti bodu, a naklad je odleva doprava podle rostouci smernice).
Poznamka (bez dukazu): nahodne konvexni retezce konverguji k "limitnimu tvaru", danemu jistou parabolou L. Formulace: pokud x je nejaky bod ctverce pod L, potom pravdepodobnost, ze bude pod nahodnym n-bodovym konvexnim retezcem, konverguje k 1 pro n jdouci do nekonecna, a podobne pro x nad L.

2. prednaska 5/III/2003 (J.M.)

Azumova nerovnost: Necht d_1,d_2,...,d_n jsou realne nahodne promenne. Predpokladejme, ze d_i nabyva hodnot jen v intervalu [-c_i,c_i] ("d_i je mala"), a dale ze plati E[d_{i_1}d_{i_2}...d_{i_k}]=0 pro kazdou volbu indexu i_1,i_2,...,i_k, 1 <= i_1 < i_2 < ... < i_k (neco jako nezavislost, ale slabsi). Necht Z=d_1+d_2+...+d_n. Potom Z je koncentrovana kolem sve stredni hodnoty (rovne 0): P[|Z|>t]< 2 e^{-t^2/2C}, kde C=c_1^2+c_2^2+...+c_n^2.
Specialni pripad (a inspirace) je Cernovova nerovnost, kde d_1,d_2,...,d_n jsou nezavisle, nabyvaji hodnot +1 a -1, kazdou s pravdepodobnosti 1/2 (tedy c_i=1 pro vsechna i).
Dukaz Azumovy nerovnosti: pouzije se Markovova nerovnost pro promennou exp(aZ), kde a>0 je vhodny realny parametr (optimalizuje se nakonec); k tomu je treba odhadnout shora E[exp(aZ)]. Kazdy faktor exp(ad_i) se pro d_i\in [-c_i,c_i] shora odhadne linearni funkci cosh(ac_i)+(d_i/c_i)sinh(ac_i) (konvexita!), po roznasobeni vsech techto linearnich funkci zmizi (dle predpokladu E[d_{i_1}...d_{i_k}]=0) vse az na soucin tech cosh(ac_i), tady se jeste odhadne cosh(ac_i)<= exp(a^2c_i^2/2).
Kde vzit takova d_i, jako v Azumove nerovnosti? Typicky z martingalu, to obecne delat nebudeme, rekneme si specialni pripad. Necht X_1,...,X_n jsou nejake nezavisle realne promenne, a necht f(X_1,...,X_n) je nejaka jejich funkce. Priklady: X_i je indikator pritomnosti i-te hrany v nahodnem grafu, f je barevnost; nebo: X_i je i-ty nahodny bod v jednotkovem ctverci, f je delka euklidovske minimalni kostry mnoziny X_1,...,X_n, a pod. Klicova definice: definujeme Z_i=Z_i(omega_1,...,omega_i) jako stredni hodnotu f(omega_1,...,omega_i,X_{i+1},...,X_n), kde stredni hodnota je pres nahodne X_{i+1},...,X_n, zatimco omega_1,...,omega_i jsou fixovany. Tedy Z_0 je proste E[f] (vse nahodne), a Z_n=f (zadna nahodnost, vse jsou parametry).
Tvrzeni: Polozime-li d_i=Z_i-Z_{i-1}, potom d_1,...,d_n splnuji predpoklad Azumovy nerovnosti, a pro f-E[f]=d_1+d_2+...+d_n dostaneme koncentraci jako v Azumovi. Dukaz: Abychom ukazali E[d_{i_1}...d_{i_k}]=0, podivame se na stradni hodnotu pres omega_{i_k}, na te zavisi pouze d_{i_k}, a je snadno videt, ze E_{omega_i}[d_i]=0.
Abychom to mohli pouzit, musime umet odhadnout c_i, maximalni moznou absolutni hodnotu d_i. Jednoduchy pristup: c_i je nejvys "efekt" i-te promenne na f, tj. o kolik se muze f(x_1,...,x_n) zmenit kdyz (libovolne) zmenime x_i a vsechny ostatni x_j nechame stejne (ale ta x_j volime libovolne - snazime se efekt maximalizovat). Nekdy potrebujeme slozitejsi odhad c_i, vyuzivajici nahodnosti tech X_{i+1},...,X_n. Tedy c_i je stredni hodnota pres X_i,...,X_n vyrazu |f(omega_1,...,omega_i,X_{i+1},...X_n)-f(omega_1,...,omega_{i-1},X_i,...,X_n)|, nejhorsi pripad pres volbu tech omega_j (tedy maximalni efekt nahrazeni libovolneho omega_i nahodnym X_i).
Ted budeme zkoumat problem obchodniho cestujiciho pro nahodne body. Pro mnozinu S v jednotkovem ctverci definujeme L(S) jako euklidovskou delku nejkratsi okruzni cesty skrz vsechny body S. Dale pisme L_n=L_n(X_1,...,X_n)=L({X_1,...,X_n}) pro X_1,...,X_n nahodne rovnomerne rozdelene nezavisle.
Chceme na L_n pouzit Azumovu nerovnost, potrebujeme odhad tech c_i. Pro libovolnou volbu omega_1,...,omega_i, X_i,...,X_n mame
L_{n-1}(omega_1,...,omega_{i-1},X_{i+1},...,X_n) <=
L_n(omega_1,...,omega_i,X_{i+1},...,X_n) <=
L_{n-1}(omega_1,...,omega_{i-1},X_{i+1},...,X_n) + 2 min {||omega_i-X_j||,i < j <= n}
(prvni nerovnost: cesta skrz mensi mnozinu neni delsi nez cesta skrz vetsi mnozinu, druha nerovnost: cesta skrz mnozinu s bodem omega_i navic je nejvys tak dlouha jako cesta skrz puvodni mnozinu plus delka napojeni omega_i k nekteremu X_j). Podobne pro pridani X_i, a odtud c_i je nejvys
2.max_x E[min{||x-X_j||: i < j <= n}],
kde E[.] je vzhledem k nahodnym X_j.

3. prednaska 12/III/2003 (J.M.)

Lemma: Jsou-li X_1,...,X_m nahodne body v jednotkovem ctverci jako obvykle, a x je libovolne, pak E[min_j ||X_j-x||]=O(m^{-1/2}). Dukaz: nejdriv odhadnout pravdepodobnost
P[min > lambda ] < (1-(pi/4)lambda^2)^m < exp(-(pi/4)m lambda^2),
pak odhadovat stredni hodnotu vhodnym rozbitim na intervaly podle lambda.
Dosazanim do Azumovy nerovnosti:
P[|L_n-E[L_n]|>t] < exp(-ct^2/log n),
tedy typicke fluktuace L_n jsou nejvys kolem (log n)^{1/2}
Poznamka: Podobne pro dimenzi d vyjde koncentrace s n^{1-2/d} misto log n.
Ted chceme odhadnout E[L_n]. Shora: pro libovolnych n bodu v jednothovem ctverci existuje cesta delky O(n^{1/2}). Zdola: ukaze se E[min_{i ruzne od j} ||X_i-X_j||] = Omega(n^{-1/2}) (dom. cviceni), a odtud E[L_n]=Omega(n^{1/2}).
Dalsi plan: ukazeme, ze lim_{n\to\infty} (E[L_n]/n^{1/2}) existuje, tj. L_n se nemeni prilis divoce v zavislosti na n.
Nastroj: Poissonovo rozdeleni. Nahodna promenna X ma Poissonovo rozdeleni s parametrem lambda, nabyva-li hodnot 0,1,2,..., a hodnotu k nabyva s pravdepodobnosti exp(-lambda)lambda^k/k!. Plati E[X]=Var[X]=lambda.
Poissonuv proces v rovine (s jednotkovou intenzitou): v omezene meritelne mnozine A v rovine vygenerujeme podle nej body ve dvou krocich:
- Vygeneruj cislo N z Poiss. rozdelenim s parametrem lambda="plocha(A)" (kde plocha je ve skutecnosti Lebesgueova mira),
- Vygeneruj N nezavislych nahodnych rovnomerne rozdelenych bodu v A.
Predstava: rovina je pokryta velejemnou mrizkou z atomu, kazdy se v prvni minute rozpadne se stejnou velmi malou pravdepodobnosti (takovou, ze na jednotku plochy pripadne v prumeru jeden rozpadly atom) nezavisle na ostatnich, realizace Poissonova procesu jsou ty atomy rozpadle behem prvni minuty.
Vlastnosti: Je-li B podmnozina A, pak zuzeni Poissonova procesu z A na B je zase Poiss. proces (spocte se). Dale (nebudeme potrebovat): Jsou-li B_1 a B_2 disjunktni podmnoziny A, pak zuzeni Poissonova procesu z A na B_1 a na B_2 jsou nezavisla.

4. prednaska 19/III/2003 (J.M.)

Smerujeme k dukazu existence limity E[L_n]/n^{1/2}. Definujeme nahodnou promennou Z(t) jako delku optimalni obchodni cesty pro nahodne body generovane Poissonovym procesem (s jednotkovou intenzitou) ve ctverci [0,t)^2, a z(t)=E[Z(t)].
Tvrzeni: f(t) := z(t)/t^2 ma limitu pro t jdouci do nekonecna.
Dukaz: Nejdrive pozorovani: Pro kazde prirozene m a realne t>0 plati z(mt)+m^2 z(t)+Ctm^2 (rozdeleni ctverce o strane mt na sit m krat m, propojeni cest v malych ctvereccich; podstatne se vyuziva toho, ze zuzeni Poissonova procesu na maly ctverecek je zase Poissonuv proces). Tedy f(mt) <= f(t) +C/t. Vezmeme beta = lim inf f(t), pro epsilon>0 se vezme t_0 tak, aby f(t_0)< beta+epsilon, a pritom t_0> C/epsilon. Ze spojitosti f v t_0 plati f(t) < beta+2epsilon na [t_0,t_0+delta), a potom taky f(mt) < beta+3epsilon pro takova t, a vsechna dost velika cisla jsou tvaru mt pro t z intervalu (t_0,t_0+delta).
Ted jak z(t) souvisi s puvodnim problemem? Oznacme a_n=E[L_n(X_1,..,X_n)], to je to co nas zajima. Plati z(t) = sum_{n=0}^\infty t.a_n e^{-t^2}t^{2n}/n!= t.E[a_N], kde N ma Poissonovo rozdeleni s parametrem n.
Staci ukazat ze |a_n- E[a_N]| je radove mensi nez n^{1/2}, pak dostaneme ze a_n/n^{1/2} ma limitu, protoze z(n^{1/2})/n ma limitu.
Pocitame |a_n-E[a_N]| <= sum_k |a_n-a_k| e^{-n} n^k/k!, odhadneme |a_n-a_k| <= C|n-k|^{1/2 (z propojeni dvou okruznich cest, a z toho, ze cesta skrz q modu ma delku O(q^{1/2})). Vysledna suma je l_1 norma jiste nahodne promenne X, tj. ||X||_1, kde X nabyva hodnoty |n-k|^{1/2} s pravdep. e^{-n} n^k/k!. Pak ||X||_1 <= ||X||_4 (nerovnost mezi l_p normami), a ||X||_4 je Var[Y]^{1/4}, kde Y ma Poissonovo rozdeleni s parametrem n. Zaverecny odhad je tedy O(n^{{1/4}).
Celkem jsme dokazali Beardwoodovu-Haltonovu-Hammersleyho vetu: Existuje konstanta beta=beta_{TSP}(2) takova, ze L_n(X_1,...,X_n)/n^{1/2} pro n jdouci do nekonecna konverguje k beta s pravdepodobnosti 1.
Podobne tvrzeni pro kazdou dimenzi d, a tez pro dalsi problemy (TSP v l_p metrikach, miminalni Steineruv strom - stejnou metodou; minimalni kostra, minimalni parovani - musi se delat trochu jinak, protoze nejsou "monotoni").
Hodnoty beta nejsou znamy. Napriklad je dokazano 0.62 < beta_{TSP}(2) < 0.921, a pocitacove experimenty naznacuji 0.70 < beta_{TSP}(2) < 0.73.

5. prednaska 26/III/2003 (J.M.)

Problem prirazeni (nebo tez problem parovani minimalni vahy): Jsou dana cisla c_{ij}, i,j=1,2,...,n, chceme najit permutaci pi ze S_n minimalizujici soucet c_{i,pi(i)}, i=1,2,...,n.
Oznacme minimalni hodnotu toho souctu pro dane c=(c_{ij}) symbolem A_n(c). Budeme zkoumat stredni hodnotu A_n(c) pro c_{ij} nahodne nezavisle rovnomerne rozdelene v intervalu [0,1].
Veta [Karp]: ta stredni hodnota je nejvys 2. (Prekvapive.)
Formulace pomoci linearniho programovani: Zavedme konvexni mnohosten P v R^{n^2}, P={x >= 0, sum_i x_{ij}=1 pro kazde j, sum_{j} x_{ij}=1 pro kazde i} (Birkhoffuv mnohosten). Plati: vsechny vrcholy P maji vsechny souradnice celociselne (tj. 0 nebo 1). [Nedokazovali jsme, ale je to prerikani vety, ze kazda bistochasticka ctvercova matice (nezaporna radkove i sloupcove soucty 1) je konvexni kombinaci permutacnich matic; ta se dokazuje indukci podle poctu nenulovych policek matice.] Proto minimum cx pro x\in P se nabyva v 0/1 vektoru, a takovy vektor definuje prirazeni (permutaci pi).
Poznamka: mnohosteny s celociselnymi vrcholy jsou dulezite v kombinatoricke optimalizaci, a souvisi tesne s tzv. totalne unimodularnimi maticemi (determinant kazde ctvercove podmatice je 0, +1, nebo -1).
Zminenou Karpovu vetu dokazeme z obecnejsi vety [Dyer - Frieze - McDiarmid]: Necht c_1,...,c_n jsou nezavisle nahodne promenne, kazda rovnomerne rozdelena v intervalu [0,1]. Necht A je (pevna) matice m x n a necht b je (pevny) m-slozkovy vektor. Bud P={x\in R^n: x >= 0, Ax=b}, a bud w libovolny bod z P. Oznacme z^* := min {cx: x\in P} (to je nahodna promenna, zavisi na c). Potom E[z^*] <= soucet m nejvetsich slozek w.
Odvozeni Karpovy vety z DFMcD: w_{ij} = 1/n pro vsechna i,j.
Pro dukaz DFMcD vety muzeme predpokladat, ze A ma plnou hodnost m. Potom Ax=b definuje afinni podprostor dimenze n-m, ktery protina "kladny ortant" v mnohostenu P. V dukazu budeme predpokladat, ze kazdy vrchol P je definovan presne n nadrovinami: m z nich jsou ze soustavy Ax=b, a n-m jsou tvaru x_i=0. To se da dosahnout libovolne malou perturbaci matice A a vektoru b (predstava: kazdou souradnicovou nadrovinu malinko posuneme "do minusu").
Dale, pro skoro vsechna c se min {cx: x\in P} nabyva v jedinem vrcholu.
Ted budeme potrebovat neco ze simplexove metody, coz je velmi dulezity algoritmus na reseni ulohy linearniho programovani. Ulohu uvazujeme ve standardnim tvaru min{cx: x >= 0, Ax=b}, jako v DFMcD vete.
Necht I je m-prvkova mnozina indexu z {1,2,...,n}; zapis A_I pro sloupce matice A indexovane I (bazicke sloupce), a A_N zbyle sloupce (nebazicke); podobne pro vektory c a x. Predpokladejme, ze A_I je regularni. Bazicke reseni prislusne I ma x_N=0 a x_I = A_I^{-1}b; pripustnost zde znamena x_I >= 0.
Tvrzeni (kriterium optimality pro simplexovy algoritmus:
- Je-li bazicke reseni prislusne I pripustne, a plati-li podminka
  c_N >= c_I A_I^{-1} A_N
  (rikejme ji podminka (*)), potom bazicke reseni prislusne I je optimalni, tj. minimalizuje cx pres {x >=0, Ax=b}.
- Je-li P jednoduchy mnohosten, c je takove ze min cx se nabyva v jedinem vrcholu, a tento vrchol je bazicke reseni prislusne k nejakemu (jednoznacne urcenemu) I, potom plati podminka (*). Tj. kriterium v prechozim bodu je "prave kdyz" za dodatecnych predpokladu obecne polohy.
Prvni cast tvrzeni je snadno videt z rozepsani cx na bazickou a nebazickou cast, druha cast da trochu vic prace - podstata je, ze kdyz by (*) neplatila, reseni by slo vylepsit jednim krokem simplexoveho algoritmu ("pivotovanim").

6. prednaska 2/IV/2003 (J.M.)

Dukaz Dyerovy-Friezovy-McDiarmidovy vety. Predpokladame, ze matice A ma plnou hodnost m, a ze podprostour definovany Ax=b je v obecne poloze (jako v druhe casti tvrzeni z konce minule prednasky).
Pravdepodobnostni prostor vsech c, tj. [0,1]^n, rozdelime na oblasti E_I, kde I je m-prvkova indexova podmnozina [n]: E_I sestava z tech c, pro nez bazicke reseni prislusne I je jednoznacne optimalni reseni uvazovaneho problemu min {cx: Ax=b, x >= 0}. E_I jsou disjunktni a pokryvaji vse az na mnozinu miry 0 (nejednoznacne reseni znamena, ze minimum nastane ve dvou vrcholech u a v, a cx=cu definuje nadrovinu).
Fixujme I a volme c nahodne jen z E_I. Navic ted fixujeme nejakou hodnotu c_I (tj. bazickych slozek c), a nahodne volime pouze c_N. Klicove pozorovani: Tato nahodna volba c_N je totez, jako kdyz kazdou slozku c_j z c_N zvolime nahodne z rovnomerneho rozdeleni na intervalu [h_j,1] nezavisle na ostatnich, kde h_j je j-ta slozka c_I A_I^{-1} A_N. To plyne z tvrzeni (kriteria optimality baz. reseni) z minule prednasky.
Dusledek: Pro nebazicky index j plati E[c_j | E_I, c_I pevne] = (1+h_j)/2.
Trik: ted pocitame E[cw | E_I, c_I pevne], kde w je pripustne reseni z DFMcD vety. V pocitani se nejprve pouzije predchozi dusledek, pak rovnost Aw=b (zbavime se nebazickych sloupcu A), a potom se tam objevi z^* jakozto hodnota optimalniho reseni ve tvaru c_I A_I^{-1} b. Vyjde
E[cw | E_I, c_I pevne] >= (1/2) sum_{j\in N} w_j + (1/2) z^*.
Ted uvazujeme nahodne c_I (I je stale fixovane), a mame E[cw | E_I] >= (1/2) \sum_{j\in N} w_j + (1/2) E[z^* | E_I].
Konecne oznacime p_I pravdepodobnost jevu E_I, a mame
E[cw] = sum_I p_I E[cw | E_I] >= (1/2) E[z^*] + (1/2)sum_I p_I . sum_{j\not\in I} w_j.
Na druhe strane ovsem E[cw] = (1/2) sum_{j=1}^n w_j. Porovnanim vyjde tvrzeni vety, tj. ze E[z^*] je nejvys soucet m nejvetsich slozek vektoru w.

7. prednaska 9/IV/2003 (P.V.)

Dolni odhad na prusecikove cislo a nekolik dusledku (metoda L. Szekelye)

8. prednaska 16/IV/2003 (P.V.)

pulici primky, dolni odhad cnlogn, horni odhad O(n^{4/3})

9. prednaska 23/IV/2003 (P.V.)

dolni obalka n usecek (resp. n polynomu stupne d), Davenport-Schinzelovy posloupnosti, dolni odhad cn.alfa(n) pro dolni obalku n usecek v rovine

10. prednaska 30/IV/2003 (P.V.)

dokonceni dolniho odhadu cn.alfa(n) z minule prednasky, horni odhad O(n.alfa(n)) pro Davenport-Schinzelovy posloupnosti

11. prednaska 7/V/2003 (P.V.)

dukaz Upper Bound Theoremu (max. pocet sten mnohostenu s n vrcholy v R^d je radove n^[d/2] )

Informace k prednasce "Kombinatoricka a vypocetni geometrie II" (Jiri Matousek, Pavel Valtr, KAM)

LS 2002/2003 Rozsah vyuky: LETNI semestr 2/1 Z, Zk