Algoritmi i ri ndihmon në ndërtimin e makinerive që kuptojnë më mirë qëllimet njerëzore

Algoritmi i ri ndihmon në ndërtimin e makinerive që kuptojnë më mirë qëllimet njerëzore

Një algoritëm i ri i aftë të nxjerrë qëllime dhe plane mund të ndihmojë makineritë të përshtaten më mirë me natyrën e papërsosur të planifikimit njerëzor.

Në një eksperiment klasik mbi inteligjencën sociale njerëzore nga psikologët Felix Warneken dhe Michael Tomasello, një vogëlush 18 muajsh shikon një burrë që mbart një pirg librash drejt një kabineti të pahapur. Kur burri arrin në kabinet, ai përplas me ngathësi librat disa herë te dera e kabinetit, pastaj bën një zhurmë të çuditur.

Duke arritur në përfundimin e qëllimit të burrit, fëmija i vogël shkon deri në kabinet dhe hap dyert e tij, duke e lejuar burrin të vendosë librat e tij brenda. Por si është në gjendje vogëlushi, me përvojë kaq të kufizuar jetësore, të bëjë këtë përfundim?

Kohët e fundit, shkencëtarët e kompjuterit e kanë ridrejtuar këtë pyetje drejt kompjuterëve: Si mundet që makineritë të bëjnë të njëjtën gjë?

Komponenti kritik për inxhinierinë e këtij lloji të të kuptuarit është pa dyshim ajo që na bën më njerëzorë: gabimet tona. Ashtu si vogëlushi mund të konkludojë qëllimin e burrit thjesht nga dështimi i tij, makineritë që nxjerrin përfundimet e qëllimeve tona duhet të japin llogari për veprimet dhe planet tona të gabuara.

Në kërkim për të kapur këtë inteligjencë sociale në makineri, studiuesit nga Laboratori i Shkencave Kompjuterike dhe Inteligjencës Artificiale të MIT (CSAIL) dhe Departamenti i Shkencave të Trurit dhe Kognitivit krijuan një algoritëm të aftë për të nxjerrë qëllime dhe plane, edhe kur ato plane mund të dështojnë.

Ky lloj i kërkimit përfundimisht mund të përdoret për të përmirësuar një sërë teknologjish ndihmëse, robotë bashkëpunues ose kujdestarë dhe asistentë dixhitalë si Siri dhe Alexa.

“Kjo aftësi për të dhënë llogari për gabimet mund të jetë thelbësore për ndërtimin e makinave që nxjerrin përfundime të fuqishme dhe veprojnë në interesin tonë”, thotë Tan Zhi-Xuan, student i doktoratës në Departamentin e Inxhinierisë Elektrike dhe Shkencave Kompjuterike të MIT (EECS) dhe autori kryesor i një të reje punim rreth hulumtimit. “Përndryshe, sistemet e AI mund të përfundojnë gabimisht se, meqë nuk kemi arritur t’i arrijmë qëllimet tona të një niveli më të lartë, ato qëllime nuk ishin të dëshiruara në fund të fundit. Ne kemi parë se çfarë ndodh kur algoritmet ushqehen me përdorimin tonë reflektues dhe të paplanifikuar të mediave sociale, duke na çuar në shtigje të varësisë dhe polarizimit. Në mënyrë ideale, algoritmet e së ardhmes do të njohin gabimet, zakonet e këqija dhe irracionalitetet tona dhe do të na ndihmojnë t’i shmangim, në vend që t’i forcojmë, “.

Për të krijuar modelin e tyre, ekipi përdori Gen, një platformë të re programimi AI të zhvilluar kohët e fundit në MIT, për të kombinuar planifikimin simbolik të AI me konkluzionin Bayesian. Përfundimi Bayesian siguron një mënyrë optimale për të kombinuar besimet e pasigurta me të dhëna të reja dhe përdoret gjerësisht për vlerësimin e rrezikut financiar, testimin diagnostik dhe parashikimin e zgjedhjeve.

Modeli i ekipit performoi 20 deri në 150 herë më shpejt se një metodë bazë ekzistuese e quajtur Bayesian Inverse Reinforcement Learning (BIRL), e cila mëson objektivat, vlerat ose shpërblimet e një agjenti duke vëzhguar sjelljen e tij dhe përpiqet të llogarisë politikat ose planet e plota paraprakisht. Modeli i ri ishte i saktë 75 për qind të kohës në përfundimin e golave.

“AI është në procesin e braktisjes së ‘modelit standard’ ku makinerisë i jepet një objektiv fiks, i njohur”, thotë Stuart Russell, Profesor i Inxhinierisë Smith-Zadeh në Universitetin e Kalifornisë në Berkeley. “Në vend të kësaj, makina e di se nuk e di se çfarë duam, që do të thotë se kërkimi se si të nxjerrim qëllime dhe preferenca nga sjellja njerëzore bëhet një temë qendrore në UA. Ky punim e merr seriozisht atë qëllim; në veçanti, është një hap drejt modelimit – dhe si rrjedhim përmbysja – e procesit aktual me të cilin njerëzit gjenerojnë sjellje nga qëllimet dhe preferencat “.

Si punon?

Ndërsa ka pasur një punë të konsiderueshme në përfundimin e qëllimeve dhe dëshirave të agjentëve, shumica e kësaj pune ka supozuar se agjentët veprojnë në mënyrë optimale për të arritur qëllimet e tyre.

Sidoqoftë, ekipi u frymëzua veçanërisht nga një mënyrë e zakonshme e planifikimit njerëzor që është kryesisht nën-optimale: të mos planifikojë gjithçka paraprakisht, por përkundrazi të formojë vetëm plane të pjesshme, t’i ekzekutojë ato, dhe pastaj të planifikojë përsëri nga atje. Ndërsa kjo mund të çojë në gabime nga mos mendimi i mjaftueshëm “para kohe”, ajo gjithashtu zvogëlon ngarkesën njohëse.

Për shembull, imagjinoni sikur po shikoni mikun tuaj duke përgatitur ushqim dhe do të donit të ndihmonit duke kuptuar se çfarë po gatuan. Ju merrni me mend hapat e ardhshëm që mund të bëjë shoku juaj: mbase ngrohni paraprakisht furrën, pastaj bëni brumë për një byrek me mollë. Ju pastaj “mbani” vetëm planet e pjesshme që qëndrojnë në përputhje me atë që bën shoku juaj në të vërtetë, dhe pastaj e përsëritni procesin duke planifikuar përpara vetëm disa hapa nga atje.

Pasi ta keni parë mikun tuaj duke e bërë brumin, ju mund të kufizoni mundësitë vetëm në produkte të pjekura, dhe me mend se ata mund të presin mollë më pas, ose të merrni disa pecans për një përzierje byrek. Përfundimisht, ju do të keni eliminuar të gjitha planet për pjatat që miku juaj nuk mund të bënte ndoshta, duke mbajtur vetëm planet e mundshme (d.m.th., recetat e byrekut). Pasi të jeni mjaft i sigurt se cila është pjata, mund të ofroni ndihmë.

Algoritmi i konkluzionit të ekipit, i quajtur “Sequential Inverse Plan Search (SIPS)”, ndjek këtë sekuencë për të nxjerrë në pah qëllimet e një agjenti, pasi bën vetëm plane të pjesshme në secilin hap dhe shkurton planet e mundshme në fillim. Meqenëse modeli planifikon vetëm disa hapa përpara çdo herë, ai gjithashtu llogarit mundësinë që agjenti – shoku juaj – të bëjë të njëjtën gjë. Kjo përfshin mundësinë e gabimeve për shkak të planifikimit të kufizuar, të tilla si mos kuptimi se mund t’ju duhen dy duar të lira para se të hapni frigoriferin. Duke zbuluar paraprakisht këto dështime të mundshme, ekipi shpreson se modeli mund të përdoret nga makineritë për të ofruar më mirë ndihmë.

“Një nga njohuritë tona të hershme ishte se nëse doni të nxirrni në pah qëllimet e dikujt, nuk keni nevojë të mendoni më tej se ata. Ne e kuptuam se kjo mund të përdoret jo vetëm për të shpejtuar përfundimin e qëllimit, por edhe për të nxjerrë qëllime të synuara nga veprimet që janë shumë dritëshkurtra për të patur sukses, duke na çuar në zhvendosjen nga algoritmet e shkallëzimit në eksplorimin e mënyrave për të zgjidhur kufizimet më themelore të sistemeve aktuale të UA ”Thotë Vikash Mansinghka, një shkencëtar kryesor kërkimor në MIT dhe një nga bashkë-këshilltarët e Tan Zhi-Xuan, së bashku me Joshua Tenenbaum, profesor i MIT në trurin dhe shkencat njohëse. “Kjo është pjesë e dritës sonë më të madhe të hënës – për inxhinierin e kundërt të sensit të përbashkët njerëzor 18 muajsh.”

Puna bazohet në mënyrë konceptuale në modele njohëse të mëparshme nga grupi i Tenenbaum, duke treguar se sa përfundime më të thjeshta që bëjnë fëmijët dhe madje edhe foshnjat 10 muajshe për qëllimet e të tjerëve mund të modelohen në mënyrë sasiore si një formë e planifikimit të anasjelltë Bayesian.

Ndërsa deri më sot studiuesit kanë eksploruar përfundimin vetëm në problemet relativisht të vogla të planifikimit mbi grupe qëllimesh fikse, përmes punës në të ardhmen ata planifikojnë të eksplorojnë hierarki më të pasura të qëllimeve dhe planeve njerëzore. Duke koduar ose mësuar këto hierarki, makineritë mund të jenë në gjendje të nxjerrin një larmi shumë më të gjerë qëllimesh, si dhe qëllime më të thella që ato shërbejnë.

“Megjithëse kjo vepër përfaqëson vetëm një hap të vogël fillestar, shpresa ime është që ky hulumtim të hedh disa nga bazat filozofike dhe konceptuale të nevojshme për të ndërtuar makina që kuptojnë vërtet qëllimet, planet dhe vlerat njerëzore”, thotë Xuan. “Kjo qasje themelore e modelimit të njerëzve si arsyetues të papërsosur ndjehet shumë premtuese. Tani na lejon të nxjerrim përfundime kur planet gabojnë, dhe mbase përfundimisht do të na lejojë të nxjerrim përfundime edhe kur njerëzit mbajnë bindje të gabuara, supozime dhe parime udhëzuese gjithashtu. ”

Postime te ngjashme