szombat, június 21, 2014

még mindig nem teljes

A múlt szombati bejegyzésben az mi-teljes problémákról volt szó, de annyi gonoszságot elkövettem benne, hogy kénytelen vagyok egy kicsit még foglalkozni a témával. Sajnos általában nagyon hamar alábbhagy a blogolhatnék bennem, miután nekifogtam írni, ezért mindent összecsapok, eltúlzok, elhallgatok, de senki nem szól be, mert a bejegyzések annyi sebből vérzenek, hogy hosszabb lenne a komment mint a bejegyzés. És hát elvégre is ez egy blog, egy szar blog, amiben lehet éssel kezdeni a mondatokat, alapvető helyesírási hibákat elkövetni, stb. stb.. Továbbá nincs is nagyon irány, csak annyit szeretnék, hogy mire 2029-et írunk és eljön az emberi szintű MI, nagyjából tisztázva legyenek a fogalmak, amiről az majd szólni fog (mármint nem a technikai részletek, hogy mi is az SVM, inkább az, hogy lehet tanítani a gépeket és elvárni tőlük, hogy generalizálni tudjanak a tanult dolgokból, valamilyen megkötések mellett ugye) és legyen pár lépcső megemlítve, ha utólag is, az emberek elég rosszul sejtik meg, hogy mi lesz a menő/fontos 15 év múlva.

Szóval ugye azt írtam, hogy az autóvezető MI elég rossz chatbot lenne, és fordítva. Itt persze azonnal be lehet szólni, hogy ez úgy alapvetően helyes, de mégsem, mert ugye az MI-k (meg minden más program és intelligencia is) három alapvető feladatot kell megoldjon (mondhatnánk, lépésből áll): bemenet, elaboráció (ezentúl gondolkodás, nem szeretem ezt az elaboráció szót), kimenet. Márpedig az autóvezető MI-t és a chatbotot nagyon különböző lehetőségekkel látják el, ami a bemenetet és a kimenetet jelenti. Az autóvezető ugye több videokamerával nézi a világot, azontúl gyakran használnak lézeres távolságmérést (LIDAR) és gps helymeghatározást, valószínűleg majd még bővítik az arzenált néhány egyébb szenzorral, lehet egy mikrofon is elkel majd, ha hagyjuk az embereket is vezetni és nem szedjük ki a dudát. A kimenete viszont nem túl bonyolult, van kormány, gáz, fék, bizonyos lámpák, ablaktörlő, néhány folytonos és még pár bináris változó. A chatbot bemenete sokkal egyszerűbbnek tűnik, karaktersorozatok jönnek, a kimenet is ugyanaz, karaktersorozatok. Ha viszont a gondolkodási részfeladatokat tekintjük, akkor sokkal több hasonlóságot találunk, mindkettő kell kövesse a kontextust amiben működik (az egyik autókat, járókelőket, táblákat, a másik a dialógus során feltárt tényeket), kell ismerjen egy csomó tényt a világról (a térképet, a táblák, szemaforok jelentését, a rendőr kézjeleit, ilyenek, valamint egy chatbot kell tudjon egy csomó (pop)kultúrális tényt és kell tudjon rövidebb hosszabb monológot folytatni róla), kell tudjon műveleteket végezni a világot alkotó dolgokkal, rövidebb-hosszabb időre megjósolni a mozgásukat (ha valaki megindul az átjáró egyik oldalán, akkor valószínűleg át fog rajta menni, ha a biciklista jelzi merre fog kanyarodni, valószínűleg ezt meg is fogja tenni, ha az én sávomon piros a lámpa, valamelyik merőleges irányban már zöld, vagy zöld lesz és jönnek majd az autók, illetve egy dialógus dinamikáját, a releváns témákat sorrendbe tenni, hogy haladjon is a beszélgetés, meg időzzön is ott ahol kell). Valószínűleg még rengeteg párhuzamot lehetne vonni a két feladat feldolgozási fázisa között. Ez nem azt jelenti, hogy a két feldolgozási fázist ugyanolyan módszerekkel kéne megoldani, valószínűleg találunk speciális algoritmusokat, amelyek az egyes feladatokat nagyon jól megoldják és nem érdemes más módszerekkel kísérletezni, mert úgysem tudjuk megjavítani a megoldást. De ez nem is azt jelenti, hogy ne léteznének olyan módszerek, amelyek mindkét feladatot ne tudnák megoldani kielégítő módon. Valószínűleg nem ezeket fogjuk használni, minél általánosabb egy módszer, annál nehezebb megjósolni a működését és valószínűleg az autóvezetésnél több garanciát fognak a vásárlók kérni, hogy nem viszi őket halálba az autó, mint a chatbotok vásárlói, hogy nem lesznek depressziósak a sok chateléstől.

Szóval a múltkori következtetésem, hogy nincsenek is mi-teljes feladatok nem is olyan helyes, de egy kicsit mégis, mert szerintem jobb út az, hogy minden feladatot megoldunk külön és a végén csak összerakjuk őket. Ez persze sok különböző szinten történhet, a mostani deep learning revolúció meg pont ellent mond ennek, van egy szuper módszer, amivel nagyon sok MI feladatban új rekordokat állítottak be. De bármit azért nem lehet betanulni, kell egy kis feladatspecifikus mérnöki munka is, legalábbis az emberi szintű MI-hez. A szingularitáshoz már nem kell majd, annak az a lényege, hogy már túllép az emberi machinációk lehetőségein és tényleg a lehető legközelebbről mintavételezi a valóságot és alkot modellt róla.

Ha már ez a mai téma, akartam még arról is írni egy kicsit, hogy ugye rájöttek az okos emberek, hogy a bemeneti és kimeneti fázis is elég bonyolult és ott is elkél a tanulás (adaptivitás). A természet is hamar rájött erre és nagyon jól alkalmazza is, olyan szinteken is, amiket mi nem tartanánk etikusnak, de ő leszarja. Szóval a szem is tömöríti az információt, amit továbbít az agynak, mert ez így hatékonyabb és a csupasz földkutya is feladta a látását azért, hogy ne kaphasson rákot, mert ez így jó neki. A tudomány még nagyon az elején van az ilyen bemenet-kimenet optimalizációk megértésének, de legalább már nekifogtak MI módszereket is használni arra, hogy felfedjék ezeket a rejtélyeket. Mondtam már, hogy az MI-t mindenre lehet használni? Az is fontos, hogy ezek a területek, azaz bemenet, gondolkodás, kiement, eléggé párhuzamosan is tudnak fejlődni, eddig legalábbis ezt tették, csak mostanában kezdenek egyre jobban összekapcsolódni. És mindhárom területen a határ a csillagos ég, ezért lehet majd az emberi intelligenciát messze meghaladó MI-t készíteni. Tekintsünk egy átlagos emberszabású robotot. A bementi részben rendelkezhet mind az öt érzékszervünkkel, de lényegesen kibővítve, valószínűleg lesz majd mindenféle hullámhosszon kamerája és sokkal nagyobb térbeli és időbeli felbontása lesz, mint ami nekünk van, valószínűleg nem csak az arckifejezésünket használhatja majd az érzéseink leolvasására, hanem a pulzusunkat is le tudja olvasni, a lehelletünk széndioxid szintjét, a vérünk cukortartalmát, stb. Valamint hallani fogja, hogy hogyan folytatódik a másik teremben az a beszélgetés, amiről éppen kiviharzottunk. A gondolkodási fázisban hetvenmillió olyan paramétert fog ismerni, amiről nekünk fogalmunk sincs, pl. hogy mikor vettünk utoljára kávét és hány perc múlva dobtuk a poharat a szemétbe, a nap melyik szakában szoktuk a legvidámabb emaileket írni és a tegnap hányig néztük a tévét, melyik könyvben hányadik oldalon tartunk és hova foglaltunk szállást a nyaraláshoz. A kimeneti fázisban meg száz kilós súlyok emelgetése közben jambikus pentaméterben fog tudni beszélni. Egészen jó kis haver lesz egy ilyen emberszabású robot, sajnos, kevés embernek lesz rá pénze. Vagy ha nem is lesz drága, biztos nem akarunk majd röntgen szemeket szereltetni belé. Vagy ha szereltetünk is, azt majd nem használhatja emberek között, csak amikor éppen csillágvizsgálósat játszik az éjszaka a közeli dombon, én tuti nem hagynám, hogy lazsáljon egy percet se. :))

Nincsenek megjegyzések: