Mgr. Viliam Lisý, Ph.D.

Nositel Neuron Impulsu za rok 2017

Bezpečnější internet, dokonalejší ochrana letišť nebo účinnější boj s pytláky v pralese. To je krátký výčet problémů, k jejichž řešení přispějí poznatky z projektu Viliama Lisého. Nyní jeho výzkum, inspirovaný hrou poker, získal Neuron Impuls, tedy milion korun od Nadačního fondu Neuron

Poker v roli pokusné myši

Poker má ve vašem projektu roli pokusné myši, na které ověřujete nové postupy. Hrál jste někdy poker?
Určitě párkrát s kamarády, ale nikdy o větší peníze.

Jak vás napadlo, použít poker jako pokusný model?
Není to můj nápad. Poker byl při vývoji umělé inteligence už dlouho považován za významné téma, protože ho obvykle hrají chytří lidé. Hodně odborníků se proto pokoušelo vytvořit programy, které by hrály stejně dobře jako člověk, nebo ještě lépe.

Není větší výzvou počítačový program na hru go, která je kombinačně velice složitá?
Při go víte, kde jsou na hrací ploše rozmístěny kameny soupeře, zatímco v pokeru karty protihráče neznáte. Co má v ruce, odhadujete jen podle toho, jak blafuje, kolik přihazuje, nebo jestli jedno kolo vynechá. Je to hra s neúplnou informací, což je pro teoretiky a tvůrce algoritmů výrazně zajímavější situace, než jaké nastávají v go. Poker poskytuje více výzkumných výzev. 

O jaké výzvy jde?
Počítačový program pro poker musí vybalancovat strategii blafování tak, aby soupeř nepoznal, jaké má program karty. Zároveň musí z protivníkových akcí odvodit co nejvíc informací o jeho kartách. Dosavadní postupy balancovaly silně zjednodušenou hru, která se vešla do paměti počítače, ale zdaleka nezachycovala komplexnost skutečného pokeru. Podílel jsem se na vývoji počítačového algoritmu DeepStack, který umožnil takto balancovat strategii přímo ve skutečné hře a proto jako první statisticky signifikantně porazil profesionální hráče.

Kdo používá váš algoritmus, pokaždé vyhraje?
Jednotlivé partie může kvůli prvku náhody prohrát, ale v dlouhodobé řadě her je celkově v plusu.

Text o algoritmu jste publikovali letos v únoru v časopisu Science. Už ho začali používat profesionální hráči pokeru?
Jsme v tomto směru velmi opatrní. V časopise jsme uveřejnili pouze zjednodušenou formu algoritmu. Podrobné informace si hlídáme, protože nechceme, aby kdokoliv zneužíval naše výsledky pro vlastní prospěch. Možná někdo časem přijde na detaily a začne vyhrávat. Pokud se poté používání algoritmu rozšíří, přestane být jeho aplikace neférovou výhodou a je možné, že budou některé turnaje probíhat s oficiální podporou počítačů, jako je to například u šachů.

Článek v Science bývá považováný za vrchol vědecké kariéry. Jaký je cíl vašeho projektu?
Chci zobecnit hlavní algoritmus DeepStacku, aby se dal používat na celou skupinu extenzivních her s nulovým součtem. To jsou hry s jasně definovaným začátkem i koncem, kde hráči nemusí přesně znát úplný stav hry. Mohou je hrát maximálně dvě osoby, z nichž jedna musí vyhrát to, co druhá ztratí.

V žádosti o Neuron Impuls uvádíte, že výsledky projektu ověříte na jedné rekreační hře a na jednom praktickém problému. O co půjde?
V prvním případě jsou to šachy s neúplnou informací. Vidíte pouze postavení svých figur, rozmístění soupeřových musíte odhadnout jen podle toho, kolik tahů proběhlo a kam můžete, nebo nemůžete táhnout. Druhý případ se týká boje s pytláky v pralese. Společně s University of Southern California, která má široké zkušenosti s nasazováním algoritmů teorie her v praxi, navrhneme, kde a kdy mají strážci zvěře hlídkovat, aby chytili co nejvíce pytláků.

Šachovou partii s neúplnou informací si dokážu představit, ale jak vypracujete rozpis hlídek proti pytlákům?
Do počítače vložíme mapu území, trasy, kudy lze pralesem procházet a přibližný počet zvířat. Velmi důležité je vložit do programu také data získaná na základě předchozích zkušeností s pytláky, například kam obvykle pokládají pasti, nebo kde se nejčastěji zdržují. Algoritmus poté určí, jak často a kudy mají strážci chodit pralesem. Musí se chovat podobně jako hráč pokeru při blafování, takže pytláci velmi obtížně předvídají, kde narazí na hlídku.

To zní slibně. Kde všude bude možné poznatky z výzkumu využít?
Například při ochraně letištních hal před teroristy, při pašování drog, vývoji antivirových programů, hlídání strategicky důležitých objektů a podobně. Obecně lze říct, že všude tam, kde chceme efektivně využít omezený počet strážců. Na letišti máte třeba jen tři hlídky se psy a deset terminálů a na některém z nich mohou být pašeráci drog. Program navrhne strážcům obchůzky v takovém režimu, aby protivník nemohl jejich přítomnost spolehlivě předpovídat.

Ale podobné systémy se už používají. V čem je váš program lepší?
Současné modely dokáží rozvrhnout, kam mají hlídky každou hodinu chodit, ale nezvládají komplikovanější momenty. Když například strážci objeví podezřelé zavazadlo nebo na parkovišti před letištěm najdou odcizené auto, existující systémy jim neřeknou, jak mají zareagovat. Metody, které nyní vyvíjíme, umožní například optimalizovat reakce hlídek na podobné události. 

Kde máte jistotu, že teroristé, hackeři nebo gangsteři nenasadí proti strategii strážců vlastní program a po nějaké době nezískají převahu?
V reálném světě to samozřejmě hrozí. Proto je důležité průběžně sbírat data například od tajných služeb a vyhodnocovat chyby v modelu situace, aby se dala měnit strategie a strážci se stali opět silnější než vetřelci. 

V čem je přínos a unikátnost vašeho postupu?
Dříve se hry s neúplnou informací vtěsnaly do tak malého modelu, aby se vešel do paměti počítače a poté se řešila hra jako jeden celek. Varianta pokeru, kterou hraje DeepStack, je ale obrovská a nepojmuly by ji ani všechny počítače na světě. Proto jsme vyřešili menší pokerové podproblémy a naučili neuronové sítě výsledky vyřešených problémů zobecnit. Finální algoritmus uvažuje explicitně několik kroků dopředu a pak použije tyto neuronové sítě jako formu intuice o řešení zbytku hry. Tato velmi zásadní věc se dosud nikomu jinému nepodařila, protože vyžaduje velmi složitou teorii, kterou jsme vytvořili. 

Počítáte s rizikem, že se nepodaří dosáhnout cíle projektu?
Může se stát, že algoritmus bude fungovat jen na menší problémy, nebo se neuronové sítě nedokáží naučit intuitivní řešení situací v nových problémech. Vím o teoretických bariérách, které se možná nepodaří překonat, jako se nám to podařilo v pokeru.

Ve srovnání se světem jste na špičce pomyslného peletonu?
Společně s kolegy z University of Alberta v Kanadě jsme vytvořili algoritmus DeepStack. Teoreticky jsme tedy na vysoké úrovni. Pokud jde o nasazovaní herně-teoretických algoritmů do praxe jsou zahraniční týmy mnohem početnější a mají na jednání s potenciálními uživateli více času a lidí.

Můžete srovnat zkušenosti z ciziny a z Česka?
V Kanadě jsou podmínky trochu lepší. Lidé daleko méně času tráví získáváním financí. Granty poskytují slušné peníze na dostatečně dlouhou dobu a člověk se může více soustředit na výzkum. V Česku je výhodou větší počet šikovných studentů. Univerzita v Albertě je dobrá v úzké oblasti, které se věnuji, ale celkově není považovaná za nejlepší v regionu. Někdy mají problém přitáhnout dobré studenty. Mám pocit, že v Praze je to jednodušší.

Uvažoval jste o trvalém pobytu v Kanadě?
Určitě jsem tam nechtěl zapustit kořeny. Když jsem si to uvědomil, bylo na čase budovat si zázemí tady v Praze, kde chci naopak prožít většinu života. Prahu mám velmi rád, líbí se mi tady a na Slovensko, kde jsem se narodil, to není daleko. Proto jsem se z Kanady vrátil a začal zde vytvářet výzkumnou skupinu, sociální okruh známých a podobně.

Mohl jste si vybrat i jiné evropské město, odkud na Slovensko taky není daleko...
Určitě, ale v Česku nejsou podmínky na výzkum zase tak špatné. Jsou tady šikovní studenti, je zde  mnoho zajímavých možností spolupráce s aplikovaným výzkumem v průmyslových firmách. Ano, musím strávit dost času sháněním grantů, ale dá se to zvládnout.

V čem vidíte smysl vědy, proč je tak důležitá?
Mám rád výzvy, potřebuji všemu rozumět a chci to pochopit. Neumím si představit svět bez medicíny, internetu a dalších vědeckých oborů. Společnost se za posledních sto let díky vědě velmi výrazně změnila. Obecně si myslím, že k lepšímu. Společnost je efektivnější, lidé zdravější, možná méně šťastní, ale s tím se dá něco dělat. 

Proč jste si vybral pro svou kariéru počítačové vědy?
Rodiče správně odhadli, že jde o důležitý obor a koupili nám počítač asi v mých deseti letech. Zpočátku mě více lákala fyzika, zúčastňoval jsem se fyzikálních olympiád pro studenty, ale pak mě náhoda přivedla k informatice. Když jsem totiž mluvil s absolventy studia fyziky, ukázalo se, že většina pracuje jako analytici nebo programátoři v bankách. Tehdy jsem ještě neuvažoval o vědecké kariéře,. Říkal jsem si, že když to nakonec budu pravděpodobně dělat, mohu to jít rovno studovat. 

Hodně se nyní mluví o hrozbě, že svět za pár desítek let ovládne umělá inteligence. Co si o tom myslíte?
Jde o velmi populární a diskutované téma i mezi odborníky. Ale zatím si nikdo nemyslí, že to je aktuální hrozba. Někteří lidé se domnívají, že za padesát let by k tomu mohlo dojít. Většina  specialistů si podobně jako já myslí, že taková situace nastane mnohem později. Ale je dobré se touto myšlenkou zabývat, protože až by se něco stalo, bude už pozdě vymýšlet nějaké kontrolní mechanismy. Podle mě máme ještě stovky let na řešení této otázky. Z pohledu uživatele se nové technologie, jako autonomní auto, automatický překlad nebo asistent v mobilním telefonu jeví velmi „chytré“, ale kdo rozumí tomu, jak to všechno funguje, ví, že jde o velmi jasné a jednoduché algoritmy, které se nemohou „utrhnout“, získat nějaké vědomí a vyhladit nás. Možná za stovky let, ale věřím, že do té doby vytvoříme nástroje na kontrolu umělé inteligence.

Počítače nám pomáhají ovládat jaderné elektrárny, energetické sítě, vodárny, leteckou dopravu i mnoho dalších věcí. Hrozba útoků na tyto cíle je dost pravděpodobná. Co navrhujete?
Ochrana počítačových systémů před kybernetickou válkou je podle mě zatím celkově slabá. Státníci si problém uvědomují a investují do ochrany. Otázkou je, kam bude zabezpečení sítě směřovat. Umím si představit omezení svobody na internetu, nebo vznik nějaké paralelní sítě pro celostátně důležitou infrastrukturu, která bude výrazně lépe chráněna. Ale nebojím se, že po nějakém hackerském útoku se zhroutí svět. To je námět na hollywoodský film, ale myslím, že kritické věci jsou robustně zabezpečené, tak aby se daly vypnout jedním červeným tlačítkem, najít chybu a  potom následky útoku opravit. 

Text: Josef Matyáš

Napsali o něm: