Minier Zsolt mar megint nem nyughat: március 2020

kedd, március 24, 2020

jótúb

Még mindig nem tudom a gondolataimat összerázni egy bejegyzés erejéig a vírusok koronájáról, de mivel holnaptól ki sem lehet már járni rendesen, ajánlom mindenkinek a videót amit Kolozsváron készítettem vasárnap reggel. Sajnos nem sikerült betenni alá a János Vitézt, ezért szenvedtem a 23 darab összevágásával, hogy meglegyen a két óra, de aki teheti halgassa azt mellette. Nem igazán passzol, de ez van.

A franc megette ezt a világot.

csütörtök, március 05, 2020

szingularitás

Van ez a Lex figura és egész érdekeseket beszélget mindenféle mesterséges intelligencia kutatókkal. És persze mindenki a távoli jövőbe teszi az emberi szintű mesterséges intelligencia létrejöttét, mert mindenki akadémikus vagy nagy cégeknél dolgozik, ahol nem lehet mellébeszélni. Az én blogomban viszont lehet mellébeszélni, ezért leírom a mostani gondolataimat, amit az utóbbi pár video megnézése után formáltam az agyacskámban.

Általában azért nem sokat szoktak arról beszélni, hogy miért nem lesz egyhamar emberi szintű mesterséges intelligencia, csak azt, hogy még nagyon távol vagyunk tőle, mert az intelligenciáról sem tudunk sokat. Yann LeCun azt mondja, hogy egyrészt az emberi intelligencia nem túl általános, ez egy kicsit talán könnyíti a problémát, viszont a mostani leginkább használt módszer, a felügyelt tanulás nem lesz elég, az ember sem felügyelten tanulja meg a világot értelmezni és befolyásolni. És ha új paradigmára váltunk, mondjuk a félig felügyelt, vagy önfelügyelt tanulásra, akkor azzal még olyan keveset foglalkoztunk, hogy fogalmunk sincs, ha véletlenül hatékonnyá tudjuk tenni, mi következik utána. Ő azt mondja, hogy a nem felügyelt tanulás a következő hegy, amit a tudománynak meg kell másznia és fogalmunk sincs, hogy hány hegy van utána, ugyanis még nem értünk fel a tetejére. Lehet, hogy csak egy hegy van, lehet hogy száz.

Én azt mondom, mi van akkor, ha nincs is több hegy?

Elég optimista kijelentés ez, nem rám vall. De azért talán vannak okok az optimizmusra, ebből fogok néhányat felsorolni.

Lehet, hogy a látás a fizikai világban sokkal nehezebb, mint a gondolkodás egy absztrakt világban. Ezért persze sok speciális neuront is fejleszettünk hozzá, de amennyire én tudom, matematikáért felelős neuront még nem találtak, már csak evolúciós okok miatt sem. Ugyanakkor bármilyen jó matekes is legyen valaki, nem tud fejben összeszorozni két 10 számjegyű számot, vagy elképzelni egy 5 dimenziós síkot (szerintem 4 dimenziósat sem, nekem legalábbis nem nagyon sikerült az előbb). Persze papírral nagyon ügyesen tudunk ilyen és ennel sokkal bonyolultabb matematikai objektumokkal operálni, de ez nekem azt jelenti, hogy bár jó reprezentációkat tudunk alkotni, túl sokat nem tudunk belőle tárolni (ugyebár a kognitív pszichológiában is megjelenik ez a fogalom, azzal a bizonyos 7-es számmal) és akkor ez eléggé limitálja is a dolgok mélységét amelyeket meg tudunk érteni, vagy legalábbis műveleteket végezni vele.

Egy érdekes technikai fejlemény, hogy most a nyelvi problémák megoldásában igen hatékonynak bizonyuló transzformer módszerek eredetileg a gépi látásban jelentek meg, ahol az lett volna a feladatuk, hogy a kép részleket egy kanonikus pózba transzformálják, amiben már könnyebb felismerni őket. Ami igazán optimizmusra ad okot, hogy mostmár sokkal bonyolultabb modelleket tudunk alkotni, eddig nagyjából minden a konvolúcióra és egyébb egyszerű mátrixműveletekre szorítkozott. Viszont mostanában már gráfokon, halmazokon, akár kissebb optimalizációs feladatok megoldásán alapuló hálókat építhetünk, szerintem ezek már bőven elegek lesznek ahhoz, hogy megoldjuk a gépi látást és szerintem ezek a módszerek a hallásban és nyelvfeldolgozásban is meghozzák az áttörést. Már vannak olyan cikkek, amelyekben matematikai képletekkel végeznek műveleteket transzformerekkel és csodák csodája, hatékony heurisztikákat tudnak tanulni.

Szóval az én kevéssé hozzáértő véleményem az, hogy nem lesz több hegy. És még rengeteg idő van 2029-ig, remélem, hogy a modellező programozási nyelvek is fejlődnek addig, mert szerintem most egy kicsit visszafogja a területet az, hogy Pythonban modellezünk, ami arra jó, hogy nagyobb kész kockákat összeillesszen, de ami nincs előre elkészítve, azt nem tudja apróbb részekből összerakni, mert ahhoz túl lassú. Most, hogy már antibiotikumokat is találtak mesterséges intelligenciával, ha beszáll az egészségügy a sok-sok pénzzel amit rá költünk, szerintem már sosem jön el a mestint tél.

Na most erről nincs kedvem többet írni, majd jön a kiegészítő bejegyzés valamikor, amikor rájövök, hogy mit hagytam ki azokból amiket összegondoltam. :)

fényképészet 2

Szokásomhoz híven, a legutóbbi bejegyzést rendesen összecsaptam és pont az alaptézist, amire felépítettem a mondandómat felejtettem ki. Szóval most itt jön, aztán majd valószínűleg lesz még bejegyzés ebben a témában, mert még mindig foglalkoztat és persze most is sok minden ki fog maradni.

Szóval én azon ritka csoportjához tartozom az embereknek, akik először kaptak számítógépet (93 karácsony, C64) és csak sokkal később lett saját fényképezőgépük (2007 karácsony, a marseillei útat megörökíteni). Persze volt otthon filmes fényképezőgép, de valahogy nem érdekelt egyáltalán. Én előbb írtam a képernyőn összefolyó gömböket, minthogy lefényképeztem volna egy almát. Ennek köszönhetően kialakult bennem egy elvárás a képekkel szemben, a demós múltamnak is köszönhetően, mindig is úgy tekintettem a képekre, amelyek mögött valamilyen módszer bújik meg és amelyre először rá kell jönni és utána paraméterezni úgy, hogy az tetszetős legyen. Persze nálam ez nagyjából úgy jelent meg, hogy nagy nehezen rájöttem a módszerre és azzal kábé el is veszítettem az érdeklődésem iránta, a paraméterezés és szépítgetés már elmaradt. így sikerülhetett, hogy ilyen szín-förmedvényeket is sikerült kiadni. :) Azt hiszem, az első paletta volt ez a sárga-piros amit inkább a turbulencia+zaj textúrageneráló debuggolására használtam, mint arra, hogy egy kellemes, nézhető képet generáljak. Na mindegy, szóval az a lényeg, hogy a képek mögött módszer kell legyen és paraméterek amiket húzni lehet.

Ez persze némileg ráillik a művészeti fotográfiára is, ott is vannak gondolatok, a dolgoknak helye és viszonya, mozgó és álló dolgok, kompozíció, miegymás. Ami viszont hiányzik, az a paraméterezhetőség és én anno mindig is nagyon fontosnak tartottam a paraméterezhetőséget, még ha általában nem is igazán éltem vele. A digitális és némileg az analóg fotózásban is van egy bizonyos paraméterezhetőség, lehet mindenféle színgörbéket és histogrammokat lokálisan és globálisan húzogatni, de egyrészt ez nagyon sok munka (amit megint nem szeretek :)) és másrészt igen limitált.

Én olyant akarok, hogy úgy készíthessek a tengeren a napfelkeltéről képet, hogy nem kell korán felkeljek, hanem csak egyszerűen a nap közepén készítek egy képet és paraméterező rendszerben ki tudom szedni az embereket a vízből, a hullámokat el tudom simítani, a napot le tudom hozni a tenger színtjére és a rendszer újraszámolja a fény szóródását az atmoszférában. Ezt nevezem én paraméterezhetőségnek és hiszek benne, hogy el fogunk ide jutni, illetve már vannak kezdetleges ilyen rendszerek, amelyek mondjuk ugyanazt a képet különböző napszakokra vagy akár különböző évszakokra transzformálják, de egyrészt még nagyon egyszerű a modelljük, másrészt komolyabb feladatokkal, mint mondjuk egy ember vagy egy épület kitörlésével nem igazán bírkóznak meg. De eljön majd az idő, hogy mindez menni fog, a sok adat és sok intelligenciának köszönhetően, amit egy ilyen rendszerbe fogunk pakolni. Na ezért érdekel engem inkább a digitális fényképezés. A lustaság a digitális világ legnagyobb szövetségese. :)