péntek, szeptember 23, 2022

a gépek hallgatják a beszélgetést, hogy nekünk már ne kelljen

Az NVIDIA bejelentette az új grafikus kártyáit és megint sikerült duplázzák a teljesítményt két év alatt. Nem sok más hardver gyártónak megy ez mostanában, pl. szerintem az epöl eléggé gyengécskét villantott idén, vagy csak nekem voltak túlzottak az elvárásaim. Egyébként sok érdekes dolgot bejelentettek, jó dolog az, hogy így rárepültek a mesterséges intelligenciára, elvégre rengetek klienst biztosít nekik, szóval érdemes kutatni és patentálni a patentálható dolgokat.

Számomra viszont a legérdekesebb az RTX Remix nevű programocska, amivel ki lehet lopkodni a régi játékokból a teljes geometriát és textúrákat és sédereket és fel lehet őket javítani és visszarakni a játékba. Vagy mondjuk lehet használni ezt a sok-sok adatot 3ds stable diffusion tanítására, amivel gyakorlatilag be lehet majd tanulni minden játék stílusát és elegendő metaadat hozzáadásával a játékok akár bármilyen választott stílusban is megjeleníthetőek (ez elvileg most is lehet, ha átvisszük a textúrákat, modelleket és sédereket és még kicsit babrálunk egy-két dologgal, mint a skinning). Ez viszont mindenki számára könnyűvé teszi majd ezt a dolgot és gondolom lesznek majd nyílt megoldások, szóval elég érdekes jövő elé nézünk, ha elkészül az ami szerintem a következő lehetséges lépés. És persze lehet az én játékomba se lesz nehéz szörnyikéket generálni ezzel. :))

Más. A stabil éjáj nyíltságának megvan az első pozitív következménye, ugyanis a (nevében) nyitott éjáj kiadott egy minden eddiginél jobb beszédfelismerő rendszert. Állítólag ez már tényleg szinte emberi szinten ismeri fel a beszédet és annyi volt a spíl, hogy nagyon sok adaton tanították, 680000 órányi szupervizált adaton, de több nyelven. Ez szinte annyi, mint egy teljes emberi élethossz. Érdekes implikáció, hogy még mindig nincs szükség a világ értésére, hogy jól megérthessük a beszélt nyelvet, elég ha csak baromi sok adat áll rendelkezésre. Az ember ugye néha ha nem ért valamit, teker még egyet az agya és felhasználja a kontextust és elég jól ki tudja javítani a félrehallást, a gép sajnos nem érti a kontextust, ennyi beszéd még messze elmarad egy mostani nyelvmodelltől is, de úgy látszik, nem is kell.

A másik menő dolog meg az, hogy mostanában belerakták a python programozási nyelvet abba a bizonyos gtp3 nyelvmodellbe és hirtelen megtanult a rendszer programozni valami alapibb szinten. Ebben az a menő, hogy mondjuk be tudnak integrálni egy logikai következtető rendszert is és azt is meg tudja tanulni használni a nyelv modell, sőt, ott már akár egy cirkuláris rendszer is elképzelhető. Ja, és lehet integrálni bármilyen más programot is, mondjuk egy modellező programot, vagy egy internet brózert, vagy egy fizikai szimulációkat végző rendszert, aminek szöveges bemenete és kimenete van, akár még a gittet is be lehet nyomni, hogy tanulja meg lementeni a tudásbázisát. Az az igazság, hogy egyáltalán nem lepne meg, ha 2-3 év múlva bejelentenék, hogy tényleg meg van az emberi szintű mesterséges intelligencia és nem valami buta hekket csináltak, ki is lehetne próbálni meg minden. Az, hogy kezdjük belerakni a számítógépek erősségét, a programozhatóságot az emberről másolt tudásba teljesen kiszámíthatatlanná teszi ezt a folyamatot, mert a számítógépeket elég jól értjük és már tudjuk, hogy a határ a csillagos ég, az embert még nem értjük, de lassan-lassan kiderül, hogy nem olyan nagyon bonyolult mint ahogy gondoltuk, ha készítünk egy baromi nagy asszociatív memóriát, az már lassan elég is. És ami a legjobb, a gép majd el tudja dönteni, mit kell megjegyezni és mire kell programot írni. Szerintem meglepődünk majd.

A lényeg persze az, hogy jóra használjuk ezt az új lehetőséget. Vagy legalább arra, hogy belerakjuk a kedvenc politikusunkat a Titanicba.

Zene.

Nincsenek megjegyzések: