péntek, szeptember 28, 2007

szerda, szeptember 26, 2007

E15

Az MIT-sek készítenek egy új webes grafika készítő programnyelvet, ez lesz az E15. Még nem egészen tiszta nekem, hogy saját script nyelv vagy mi is lesz ez, meg hogy is lesz azzal a böngészős OpenGL-el, de hajrá, a Processing is az MIT-n kezdte. :)

A hír a SIMPLICITY blogról származik, amelyről erre a vicces blogra lehet evezni, amelyen sok ember található és mindenki eltakarja a fél szemét, valamilyen különös indíttatástól vezérelve. :) Ha már linkek blogokra, akkor érdemes még olvasni a jövőnézőt is, és akkor ennyi mára.

Keepon

Érdemes megnézni ezt a videót a táncoló robottal, több információt ezen az oldalon lehet találni. Tutira megnézném majd, amikor ez az ember védeni fog, az első 25 percben lenyom kismillió képletet és a maradék időben odateszi a robotját, hogy táncoljon mondjuk britniszpírszre, aki még bírja röhögés nélkül, kérdezhet.

hétfő, szeptember 24, 2007

a lista

Hmm, van román blogokból már Pagerank lista (via Gramos), legalábbis én így értem az algoritmustot, amit jelenleg megfogalmaztak. Ilyesmit szerettem volna én is, csak ugye a lustaság... Mindenesetre érdekes lesz megfigyelni, merre csavarják a témát. Valami szép vizualizációkat feldobhatnának, azok nagyon szórakoztatóak.

kedd, szeptember 18, 2007

Hold 2.0

Vicces lesz, ha valaki tényleg megnyeri a Google Lunar X Prizet és valószínüleg megelőzi a NASA-t (és az ESA-t és kínaiakat és az oroszokat) a legközelebbi holdraszállásban. Én mindenesetre drukkolok nekik. És olvasom a cydoniat.

Vakáció. NOT

Véget ért a vakáció. Amennyire sikerül, elkerülöm a blogokat és koreait is fogok újra tanulni. És van még néhány egyéb elintézni való is... :)

szerda, szeptember 12, 2007

Ratatouille

Megnéztem, a moziban, nagyon jó volt. Az egy kicsit rosszul esett, hogy román szinkron volt, lehet csak azért, mert nagyon ovis időpontban mentem, déli egykor, de kibírtam. Hát mit lehet mondani róla, a technológia szuper, a karakterek kedvesek, a történet egyszerű, de kerek és nincs is amiért túlbonyolítsák, az üzenet lejön. Valami hiányzott azért az Incredibles-hez képest, talán Remy kicsit elsikkad, túlontúl a patkány a főszereplő, az Incredibles sokkal kiegyensúlyozottabb ilyen szempontból, de mindenképpen jobban szeretem ezeket a fajta történeteket, mint a Toy Storykat meg Bogarak életét. A bevezetőben mutatott WALL E viszont nagyon érdekesnek tűnik, remélem Lasseter fogja rendezni és azt is hallottam, hogy Brad Bird szeretne még Incredibles filmet készíteni. És az évek is gyorsan telnek, szóval már nem is kell sokat várni. Hogy is volt azzal a Dragonlance animációval?

vasárnap, szeptember 09, 2007

Wöb dögök

Egyesek értelmesebb dolgokra használják a processinget mint én, ezen az oldalon pl. megtekinthető egy weboldal gráf formájában. Hát így néz ki ez a blog. (innen) PS. Ja igen, szóval ez az oldal html struktúráját mutatja, nem a linkek struktúráját.

Más. Wow, Brian May is blogol. Neki mondjuk szabad, ő már ledoktorált. :)

péntek, szeptember 07, 2007

Szilvalé

Kijött a Microsoft Silverlight. Eléggé érdekesnek tűnik, ki kéne próbálni. Azért az új technológiák közül én mégis a JavaFX-nek szurkolok leginkább, érdekes gondolat, hogy deklaratív lesz a scriptnyelv, hátha sikerül így egy kis reklámot csinálni a deklaratív nyelveknek. Persze, a legesélyesebb mégis az új Flash, mégis csak ők a legelterjedtebbek. Mindenesetre reméljük csak nekünk, felhasználóknak lesz hasznunk a client side scripting háborúból és nem osztják fel a webet teljesen. Bár installálni könnyebb mint programozni.

Más. Kitettek a főépületbe két nagy böhöm plazma tévét, az egyiken három nyelven mennek a rendezvények ismertetői, ez már egy előrelépés, lehet látni magyar szavakat is a bejáratnál. A másikon meg valami képek mennek boldog (és kevésbé boldog :)) diákokról, épületekről, meg ilyenek. Jó lenne, ha uborkaszezonban, mondjuk nyáron, engednének oda valami kis valósidejű cuccokat is írogatni, esetleg még live feedeket is kinyomorgatni, valami modernebbet mint a póverpont. Vajon nagyot néznének egy ilyen kérvényen? Melyik prorektor hatáskörébe tartozhat a dolog? Egyébként most a nyáron egész sok túristát láttam bemenni az épületbe, egyesek még babakocsikat is toltak.

szerda, szeptember 05, 2007

Természetes nyelvek számítógépes abajgatása

A természetes nyelvek fontosak, mert ugye sokat használjuk őket, néha talán többet is mint kéne, mindenesetre olyan sokat, hogy lassan ideje volt számítógépekkel segíteni a feldolgozásukat, ennek a területnek vagyok én a csicskása, szóval ideje volt írni róla, hátha valakit érdekel, hogy mi is a "big picture" amikor éppen úgy teszek, mintha dolgoznék.

A természetes nyelvek számítógépes feldolgozását a számítógépes nyelvészeti elméletek teszik lehetővé. Ezzel az a baj, hogy néha nagyon nem hasonlít a rendes nyelvészetre és az sem világos, hogy kellene-e neki. A számítógép az agytól egy nagyon eltérő szerkezet, ezért eléggé nehéz neki megmagyarázni egyszerű dolgokat, de vannak olyan nehéz dolgok, amiket viszont nagyon ügyesen meg tud oldani. Ezért az informatikusok gyakran próbálkoznak azzal, hogy bonyolult dolgokkal egyszerűeket utánozzanak, de ha véletlenül még működik is a dolog, akkor sajnos nehéz megérteni, hogy pontosan miért is működik és hogy milyen körülmények között fog szintén jól működni. Ez a kijelentés nagyjából az egész informatika tudományra igaz, de kiemelten igaz a természetes nyelvfeldolgozásra (NLP ezután).

Az egyik klaszikus és talán a legelső NLP feladatot Turing fogalmazta meg, amikor 1950-ben azt tette a mesterséges intelligencia mértékévé, hogy kimondottan szöveges kommunikációval egy számítógép meg tudja-e 80%-os pontossággal határozni a beszélgetőpartnerének a nemét úgy, hogy az akármit válaszolhat a feltett kérdésekre, tehát hazudhat is. Anno úgy képzelték, hogy ez a kérdés 2000-re megoldódik, de messze vagyunk ettől az álomtól, én erősen kételkedem abban, hogy 2050-re megoldott lesz.

Az első harminc év az álmodozások kora volt az NLP-ben is, mint az egész mesterséges intelligenciában, mindenféle szimbólikus módszerrel próbálkoztak amelyek csak nagyon kevés esetben működtek jól és jelentős hackolás és hozzáértés kellett az elkészítésükhöz és kibővítésükhöz. Mindenesetre kialakultak az alapvető területek, ezek egy része elsődleges, vagyis önmagában érdekes és fontos feladat, mint mondjuk a fordítás (machine translation), összefoglalás (summarization), kulcsszó kiválasztás (keyword extracion), kérdésekre válaszolás (question answering), vagy másodlagos, tehát valamilyen összetettebb feladat önállóként kezelhető része, mint pl. a mondatelemzés (parsing), szófaj megállapítása egy mondat szavaira (part of speech tagging), többértelmű szavaknál a helyes értelem kiválasztása (word sense disambiguation), dokumentumok visszakeresése kulcsszavak alapján (information retrieval) (ebben az a nehéz a sima indexelésen túl, hogy szeretnénk azokat a dokumentumokat is megkapni, amelyekben nem használt a keresett szó, mégis nagyjából arról szól, amire gondoltunk a keresésnél).

Aztán jöttek a statisztikus módszerek (és most újabban a nemparametrikus statisztikai módszerek) és a gépi tanulási módszerek és rengeteg feladatot egy szinttel jobban megoldottak mint a régi okoskodós módszerek azért, mert
jobban modellezik a bizonytalanságot. Ezeknél már nem kell érteni a megoldást, egyszerűen csak rengeteg helyes példát (és néhol a kimondottan helytelenekre is szükség van) fel kell sorolni egy tanulási algoritmusnak és ő valamilyen mágikus információkat leszűr az egészből és néha ezek alapján egész jól meg tudja mondani az újabb és újabb esetekben, hogy mi a helyes válasz. Közben nagyon sok új részfeladat és nagyobb feladat is megfoglamazódott és egyesek igencsak előtérbe kerültek, mint pl a dokumentumok visszanyerése, ami magyar az, amit a keresők csinálnak és most mindenki az új és okos algoritmuson töri a fejét, amivel átvehetné a Googletől a vezetést. Érdekes, hogy a Googlet megalapozó algoritmus, a PageRank nagyjából ismert volt már jóval régebben, kutatták páran a gráfok spektrumát, mindenféle elvi határokat felállítva mindenféle sajátértékekre meg minden, de nem jutott eszükbe, hogy a weblapok gráfjára alkalmazzák, pedig akkor most lehet, hogy Szlovéniában székelne a Google (Bojan Mohar szlovén kutató pl sok jó cikket írt a témában). Na szóval egy pár újabb feladat pl. a szöveg kategorizálás, amivel mi is foglalkozunk, vagy mondjuk annak megállapítása, hogy egyik mondatból logikailag következik-e egy másik, ami egy elég frissen megfogalmazott feladat (2004-es talán) de nagyon sok feladatnak részfeladataként elképzelhető (és én pl. nagyon érdekesnek találom), a szavak értelmi hasonlóságának vizsgálata, mindenféle fordítási feladatok és persze egy érdekes metafeladat, hogyan tudjuk az interneten fellelhető egyre több információt automatikus módon felhasználni (mostanában lassan már az etikussága is terítékre kerül ennek, főleg az AOL fiaskó óta).

Szóval nagyon ágas-bogas ez a téma és hát hasznos lenne a haladás benne, merthogy ha valaki elkottyantja a blogjában van messengeren, hogy mosógépet szeretne venni, akkor legközelebb amikor nézi a méljét, már lehet is reklámozni neki a vadiúj mosógépeket. És ha majd a Holdon az asztronauták arra kérik a robotot, hogy tartsák meg egy kicsit azt az elektromos vezetéket, amíg elmennek pisilni, nehogy leszakítsák, mert azt értik, hogy el kell tegyék. És hogy a technológiákban mennyire lesz a nyelvészetnek és mennyire a statisztikának szerepe, azt még meglátjuk, én mindenesetre annak drukkolok, hogy ne legyen Chomskynak igaza és a nyelv használata egy tanult és nem genetikailag drótozott képesség legyen.

Gondolatok a blogger főoldalán és azon kívül is

Vicces, mennyire nem rólam szól már ez a blog. Persze ez nem baj, magam sem tudom igazán ki vagyok, miért vagyok, miért csinálom, satöbbi, mostanában nem volt jó ezt csinálni, most éppen bűnbakot is találtam magamon kívül, de a fék nem fog jól, vagy már rég lejtőn vagyok. Szórakoztató, ahogy nem állnak össze a szavak most a fejemben, pedig máskor még fájni is tudnak, de akkor nem írom le őket. Most viszont írok és nem érdekel, hogy értelmetlen zagyvaság ez, mert sok értelmes zagyvaságot olvastam az utóbbi időben és úgy érzem, csak értelmes zagyvaságokat okoz a fejemben aminek még kevesebb értelme van mint az értelmetleneknek. Azok legalább nem kérnek enni, inni, aludni.

Politika. Vicces, hogy mennyi néphülyítés megy és mégsem vehetem fel a kesztyűt, mert az tuti a lejtő kezdete, így még van esélyem, hogy egy lokális minimumban meghúzzam magam. Majd talán, ha változnak a szupport vektorok, újragondolom a témát, addig nem, bármennyire is ez most az a téma, amiről leginkább írnék.

Pótcselekvés. Másról fogok blogolni. Azt hiszem, eljött az ideje, hogy a kutatásomról blogoljak. Meg játékokról. Meg könyvekről amiket olvasok. Nagy ritkán. Meg zenéről amit hallgatok. Meg filmekről. Meg képekről. Meg mangákról. Meg animékről. Nagy ritkán.

Akinek ez nem volt elég zavaros, nézze meg ezt a két nagyon NSFW mangát.