2024.május.01. szerda.

Könnyű neked, nehéz egy robotnak

13 perc olvasás
Kiderült, hogy a könnyűnek tartott feladatok valójában nem is olyan "könnyűek". Miközben sétálsz a házadban, vagy felveszel és elmozdítasz egy sakkfigurát, az agyad hihetetlen számítási és koordinációs teljesítményt nyújt. Csak nem vesszük észre, mert gondolkodás nélkül csináljuk.
Konnyonekunk bezzeg a robotnak

A mérnökök megpróbálják csökkenteni a robotok ügyetlenségét – és növelni a józan eszüket. Egy robottal szemben ülsz, és egy sakktáblát bámulsz. Végül meglátsz egy lépést, ami elég jónak tűnik. Kinyújtod a kezed, és előre tolod a királynődet. Most a roboton a sor. A robot agya a másodperc tört része alatt kiszámítja a nyerő lépést. De amikor megpróbálja megfogni a huszárt, egy sor gyalogot üt le. A játéknak vége.

“A robotok ügyetlenek” – mondja Ken Goldberg. Mérnök és mesterséges intelligencia (AI) szakértő a Berkeley-i Kaliforniai Egyetemen. Egy számítógép könnyedén legyőzhet egy emberi nagymestert a sakkjátékban, ha jobb lépéseket talál ki. Egy robotnak azonban gondot okoz egy valódi sakkfigura felvétele.

Ez a Moravec-paradoxon egyik példája. Hans Moravec a pittsburghi Carnegie Mellon Egyetem robotikusa, aki a mesterséges intelligenciáról és a jövőről is ír. Még 1988-ban írt egy könyvet, amelyben megjegyezte, hogy az emberek számára nehéznek tűnő érvelési feladatokat viszonylag könnyű számítógépekbe programozni. Eközben sok olyan feladatot, amely számunkra könnyen megy – mint a mozgás, a látás vagy a megragadás -, meglehetősen nehéz programozni.

Azt írta, hogy “nehéz vagy lehetetlen” egy számítógép számára, hogy egy egyéves csecsemő képességeihez hasonlítson ezeken a területeken. Bár a számítógépek azóta ugrásszerűen fejlődtek, a csecsemők és a gyerekek még mindig legyőzik a gépeket az ilyen típusú feladatokban.

Kiderült, hogy a könnyűnek tartott feladatok valójában nem is olyan “könnyűek”. Miközben sétálsz a házadban, vagy felveszel és elmozdítasz egy sakkfigurát, az agyad hihetetlen számítási és koordinációs teljesítményt nyújt. Csak nem vesszük észre, mert gondolkodás nélkül csináljuk.

Nézzünk meg néhány olyan feladatot, amely a gyerekeknek könnyű, de a robotoknak nem. Mindegyiknél kiderítjük, hogy valójában miért olyan nehéz a feladat. Emellett megismerkedünk azzal a zseniális munkával is, amelyet a mérnökök és informatikusok végeznek az új mesterséges intelligencia megtervezésén, amely segíthet a robotoknak feljebb lépni.

  1. feladat: Felvenni a tárgyakat

Goldbergnek van valami közös vonása a robotokkal. Ő is ügyetlen. “Én voltam a legrosszabb gyerek a sportban. Ha dobtál nekem egy labdát, biztos voltam benne, hogy elejtem” – mondja. Talán – gondolkodik el – ezért került a robotok fogásának tanulmányozásához. Talán rájött volna a dolgok megtartásának titkára.

Felfedezte, hogy a robotok (és az ügyetlen emberek) három kihívással szembesülnek egy tárgy megragadásakor. Az első az érzékelés. Ez az a képesség, hogy lássunk egy tárgyat, és rájöjjünk, hol van a térben. A távolságot mérő kamerák és érzékelők az elmúlt években sokkal jobbá váltak ebben a feladatban. A robotokat azonban még mindig összezavarja minden, ami “fényes vagy átlátszó” – jegyzi meg.

A második kihívás az irányítás. Ez az a tulajdonságod, hogy pontosan tudod mozgatni a kezed. Az emberek jók ebben, de nem tökéletesek. Goldberg azt mondja, hogy teszteld magad: “Nyújtsd ki a kezed, majd érintsd meg az orrodat. Próbáld meg gyorsan csinálni!” Aztán próbáld meg még néhányszor. Valószínűleg nem fogod tudni minden egyes alkalommal pontosan ugyanazt a pontot megérinteni az orrodon. Hasonlóképpen, a robot kamerái és érzékelői sem lesznek mindig tökéletesen szinkronban a mozgó “kezével”. Ha a robot nem tudja pontosan megmondani, hogy hol van a keze, elhibázhat valamit, vagy elejtheti.

Az utolsó kihívást a fizika jelenti. Ahhoz, hogy valamit megragadhassunk, meg kell értenünk, hogyan mozdulhat el az adott tárgy, amikor megérintjük. A fizika meghatározza ezt a mozgást. De kis léptékben ez kiszámíthatatlan lehet. Hogy lássuk, miért, tegyünk egy ceruzát a padlóra, majd adjunk neki egy nagy lökést. Tedd vissza a kiindulási helyére, és próbáld meg újra. Goldberg azt mondja: “Ha háromszor ugyanúgy nyomod meg, a ceruza általában máshol köt ki.” A padló vagy a ceruza nagyon apró döccenései megváltoztathatják a mozgást.

E kihívások ellenére az emberek és más állatok folyamatosan megragadnak dolgokat – kézzel, csápokkal, farokkal és szájjal.
“A kutyám, Rosie elég jól meg tud fogni bármit a házunkban” – mondja Goldberg. Az evolúció évmilliói során az agy és a test mindhárom kihíváshoz alkalmazkodni tudott. Hajlamosak vagyunk arra, amit Goldberg “robusztus fogásoknak” nevez. Ezek olyan biztonságos fogások, amelyek akkor is működnek, ha érzékelési, irányítási vagy fizikai problémákba ütközünk. Ha például egy kisgyermek fel akar venni egy építőkockát, hogy egymásra rakja, nem próbál megragadni egy sarkot, amely kicsúszhat a markából. Ehelyett megtanulta, hogy az ujjait a lapos oldalakra tegye.

Ahhoz, hogy a robotok megtanulják a robusztus fogásokat, Goldberg csapata létrehozott egy virtuális világot. A DexNet nevű világ olyan, mint egy edzőpálya a robotok mesterséges intelligenciája számára. A mesterséges intelligencia modell a virtuális világban gyakorolhat, hogy megtanulja, milyen típusú tárgyakhoz milyen típusú fogások a legstabilabbak. A DexNet világ több mint 1600 különböző virtuális 3D-s tárgyat és ötmillió különböző fogási módot tartalmaz. Egyes fogások karomszerű megragadót használnak. Mások tapadókorongot használnak. Mindkettő gyakori robot “kéz” típus.

Egy virtuális világban egy rendszer tökéletes érzékeléssel és irányítással, valamint a fizika tökéletes megértésével rendelkezhet. Ezért, hogy jobban hasonlítson a valós világra, a csapat bedobott egy kis randomizációt. Minden egyes fogásnál egy kicsit eltolták a tárgyat. Ezután ellenőrizték, hogy a fogókar továbbra is megtartja-e a tárgyat. Minden fogás kapott egy pontszámot az alapján, hogy az ilyen véletlenszerű változtatások során mennyire tartotta meg a tárgyat.

Miután a robot elvégezte ezt a tréninget, ki tudta találni a saját robusztus fogását egy olyan valós tárgyra, amelyet még soha nem látott.

Az ehhez hasonló kutatásoknak köszönhetően a robotok egyre kevésbé lesznek ügyetlenek. Talán egy nap egy fogást végző robot képes lesz arra, hogy kitakarítsa a szobádat.

2. feladat: Bejárni a világot

Ha valaki letesz egy olyan épület közepén, ahol még sosem jártál, lehet, hogy kicsit elveszettnek érzed magad. De körülnézhetsz, találhatsz egy ajtót, és gyorsan kijuthatsz a helyiségből anélkül, hogy bármibe beleütköznél vagy elakadnál. A legtöbb robot erre nem lenne képes. Antoni Rosinol kutatót először drónokkal való munka közben kezdte érdekelni ez a probléma. Általában valaki távirányítással irányítja a drónokat. Ez azért van, mert a legtöbb drón nem tud magától nagyon jól repülni. “Alig tudnak előrehaladni anélkül, hogy ne ütközzenek egy fának” – jegyzi meg Rosinol. A Cambridge-i Massachusetts Institute of Technology (MIT) számítógépes látást tanuló PhD-hallgatója.

Az érzékelés sok navigáló robot számára nagy problémát jelent, ahogyan a dolgokat megragadó robotok számára is. A robotnak fel kell térképeznie a teljes teret maga körül. Meg kell értenie a tárgyak alakját, méretét és távolságát. Azonosítania kell a legjobb útvonalakat is, hogy eljusson oda, ahová mennie kell.

A számítógépes látás nagyon jó lett a robotot körülvevő tárgyak észlelésében, sőt azonosításában is. Egyes robotok, fejlett drónok és önvezető autók nagyon jól meg tudják kerülni az akadályokat. De túl gyakran még mindig hibáznak. Az egyik legtrükkösebb dolog, amit egy navigáló robotnak kezelnie kell, egy nagy, üres tér, például egy mennyezet vagy egy fal. “Egy gép számára nagyon nehéz megérteni, hogy mi történik ott” – magyarázza Rosinol.

A másik probléma az, hogy a robotok semmit sem értenek az emberi életterekből. Egy ismeretlen szobából kijutni próbáló robot általában körbe-körbe jár, és mindenhol – beleértve a padlót is – lehetőségeket keres. Ha talál egy fürdőszobát, lehet, hogy bemegy, nem is sejtve, hogy ez a helyiség nem vezet sehová máshová.

Az MIT csapata kifejlesztett egy rendszert, amely segíthet megoldani ezt a problémát. Kimera néven emlegetik. “Ez egy térképcsoport a robotok számára” – mondja Rosinol. Ezek a térképek rétegekbe vannak illesztve. Az alsó réteg az, amit a legtöbb robot már most is kreál. Ez a körülöttük lévő háromdimenziós tér alakjának térképe. Ennek az alaknak azonban nincs jelentősége egy robot számára. Ezen a szinten csak egy domború halmazt lát, mintha a körülötte lévő világ mind egyforma színű lenne. Nem képes kiszűrni falakat, ajtónyílásokat, sétáló embereket, cserepes növényeket vagy más dolgokat.

A második réteg domború tömeg objektumokra és szereplőkre osztja fel a göröngyös masszát. A tárgyak olyan dolgok, mint például a bútorok, amelyek nem mozognak. Az szereplők, mint például az emberek és más robotok, mozognak. A harmadik réteg a helyeket és struktúrákat azonosítja. A helyek olyan nyitott területek, amelyeken a robot mozoghat, például ajtók vagy folyosók. A struktúrák a falak, padlók, oszlopok és az épület egyéb részei. Az utolsó két térképréteg a helyiségeket és az egész épületet azonosítja, amelyhez ezek a helyiségek tartoznak. Egy Kimera-val felszerelt robot egyszerre képes felépíteni mindezeket a térképeket, miközben egy térben mozog. Ezáltal könnyebben megtalálja a legegyszerűbb útvonalat.

  • 3 feladat: Az emberek megértése

Bármit is próbál egy robot, egy nagy dolog visszatartja. A robotokból hiányzik a józan ész. Ez az a tudás, amiről az embereknek nem kell gondolkodniuk vagy beszélniük, mert számunkra annyira nyilvánvaló. A józan észnek köszönhetően tudod, hogy a nyalókát a pálcikánál fogva kell megfogni, nem pedig a cukorkánál. Tudod, hogy az ajtók szinte soha nem a padlón vagy a mennyezeten helyezkednek el. És így tovább.

Az informatikusok megpróbálták megtanítani a robotokat a józan ész szabályaira. De úgy tűnik, még az ilyen szabályokat tartalmazó hatalmas adatbázisok sem segítenek sokat. Egyszerűen túl sok a szabály és túl sok a kivétel. És egyetlen számítógép vagy robot sem érti elég jól a világot ahhoz, hogy ezeket a szabályokat magától kitalálja.

A megértés hiánya megnehezíti a megértést és a navigációt. Ez a fő oka annak is, hogy a virtuális asszisztensek néha nevetséges dolgokat mondanak. A józan ész nélkül egy mesterséges intelligenciamodell nem képes megérteni az emberek szavait vagy cselekedeteit, és nem tudja kitalálni, hogy mit fognak legközelebb tenni. “Olyan mesterséges intelligenciát akarunk építeni, amely együtt tud élni az emberekkel” – mondja Tianmin Shu, az MIT informatikusa. Az ilyen típusú mesterséges intelligenciának józan észt kell szereznie.

De hogyan?

A világban szerzett tapasztalatainkból rengeteg józan észt tanulunk. De a józan ész egy része velünk és sok más állattal már születésünktől fogva, vagy nem sokkal azután velünk van.

Az emberi csecsemők 18 hónapos koruk előtt megértik a különbséget az anyagi tényezők és a tárgyak között. Azt is megértik, hogy mit jelent, ha van egy cél, és hogyan akadályozhatják a cél elérését az akadályok. Ezt onnan tudjuk, hogy pszichológusok kísérleteket végeztek a csecsemők józan ítélőképességének tesztelésére.

E kísérletek alapján Shu úgy döntött, hogy létrehoz egy virtuális világot, az AGENT-et. A DexNet-hez hasonlóan az AGENT is a mesterséges intelligencia modellek gyakorlóterepe. A modellek úgy gyakorolnak, hogy olyan videósorozatokat néznek, amelyek egy alapvető józan ész fogalmát mutatják be. Az egyik videóban például egy élénk színű kocka átugrik egy gödrön, hogy elérjen egy lila hengert a másik oldalon. A következő két forgatókönyvben a gödör eltűnik. Az egyikben a kocka mégis átugrik. A másikban viszont egyenesen a hengerhez megy. Melyik döntés a meglepőbb?

A józan ész azt mondja, hogy a legegyenesebb utat választja. A csecsemők (és a felnőttek) meglepetést mutatnak, amikor egy felesleges ugrást látnak. Ha egy AI-modell jutalmat kap, amikor meglepetést mutat az ugráson, megtanulhatja, hogy hasonló forgatókönyvek esetén is meglepetést mutasson. A modell azonban nem tanulta meg a mélyebb koncepciót – azt, hogy az emberek a legrövidebb utat választják a célhoz, hogy időt és energiát takarítsanak meg.

Shu ezt onnan tudja, hogy háromféle hétköznapi forgatókönyvön próbálta betanítani a modellt. Ezután egy negyedik típuson tesztelte. Az első három forgatókönyv tartalmazta az összes olyan fogalmat, amely a negyedik megértéséhez szükséges. De a modellje mégsem értette meg. “Még mindig nagy kihívás a mesterséges intelligenciában, hogy egy olyan gépet kapjunk, amely egy 18 hónapos csecsemő józan eszével rendelkezik” – mondja Melanie Mitchell. Ő az új-mexikói Santa Fe Intézet AI-szakértője.

4. feladat: Új ötletek kigondolása

A fenti kihívások ellenére a mesterséges intelligencia nagyon hosszú utat tett meg – különösen az elmúlt években. 2019-ben az AI-modellek, amelyek megtanultak sárkányokat és elefántokat is felismerni, még mindig nem tudták ezeket egy új fogalommá, egy elefántsárkánnyá kombinálni. Persze egy gyerek elég könnyen el tud képzelni és le tud rajzolni egyet. 2021-től egy számítógép is képes rá.

A Dall-E egy vadonatúj mesterséges intelligenciamodell, amelyet az OpenAI nevű cég készített. Egy szöveges leírást új, kreatív képek sorozatává alakít. (A “Dall-E” név Salvador Dalí spanyol művész vezetéknevének és a 2008-as Disney-film sztárjának, Wall-E robotnak a kombinációja).

Az OpenAI közzétett egy weboldalt, amelyen az emberek szavak kombinációit választhatják ki egy legördülő listából, és megnézhetik, milyen képekkel áll elő a Dall-E. A lehetséges kombinációk között szerepel egy sárgarépából készült kenguru, egy zavarodott medúza emoji és egy fagylaltot evő uborka varázslósapkában. Tekintse meg Ön is a https://openai.com/blog/dall-e/ oldalon.

Dall-E-nek nincs józan esze. Így a képzelőereje nem mindig találja el a kívánt célt. Néhány sárgarépa-kenguruja inkább olyan, mint a kínos narancssárga foltok. Ha pedig azt mondjuk neki, hogy rajzoljon egy pingvint zöld sapkában és sárga ingben, akkor az összes képen pingvinek láthatóak, bár némelyiken sárga vagy piros sapka van.

Néha azonban Dall-E nem emberi látásmódja elragadó és kreatív. Ha például megkérünk valakit, hogy képzeljen el egy sakkozó cápát, valószínűleg azt fogja rajzolni, hogy a cápa az uszonyait kezekként használja. Dall-E egyik képén a cápa ehelyett a farkát használja. Egy napon Dall-E vagy egy hasonló modell segíthet az emberi művészeknek és tervezőknek, hogy az ötletek szélesebb skálájával álljanak elő. “Sok olyan dolgot láttam, amire magamtól soha nem gondoltam volna” – mondja Ashley Pilipsizyn, aki nemrég még az OpenAI technikai igazgatója volt.

Nagyon valószínű, hogy az elkövetkező években valaki megtervez egy jó érzékkel rendelkező, kecses robotot vagy akár egy józan ésszel rendelkező mesterséges intelligenciamodellt. Egyelőre azonban, ha meg akarunk verni egy robotot sakkban, akkor egy valódi, fizikai sakktáblán kell játszatnunk vele.

Forrás:https://www.sciencenewsforstudents.org/article/easy-for-you-tough-for-a-robot-artificial-intelligence

Vélemény, hozzászólás?

WebshopCompany Ltd. Copyright 1999-2022 © Powered by WebshopCompany kft.