Si po e ndryshon AI imazhin fotografik
Nëse po pyesni se sa e mirë do të jetë kamera e telefonit tuaj të ardhshëm, do të ishte e mençur t’i kushtoni vëmendje asaj që prodhuesi duhet të thotë për AI. Përtej niveleve dhe zbardhjeve, teknologjia ka mundësuar përparime befasuese në fotografi gjatë dy viteve të fundit dhe nuk ka asnjë arsye të mendosh që progresi do të ngadalësohet.
Ende ka shumë mashtrime përreth, për të qenë të sigurt. Por përparimet më mbresëlënëse të kohëve të fundit në fotografi kanë ndodhur në nivelin e softuerit dhe silikonit sesa sensori apo lentet – dhe kjo është kryesisht në sajë të AI duke i dhënë kamerave një kuptim më të mirë të asaj që po shikojnë.
Google Photos siguroi një demonstrim të qartë se sa i fuqishëm do të ishte një përzierje AI dhe fotografia kur aplikacioni u lançua në vitin 2015. Para kësaj, gjigandi i kërkimit kishte përdorur makinën e mësimit për të kategorizuar imazhe në Google+ për vite me radhë, por nisja e aplikacionit të saj Photos përfshinte tipare AI të përballura me konsumatorët që do të kishin qenë të paimagjinueshem për shumicën. Bibliotekat e çorganizuara të përdoruesve të mijëra fotove të paharruara u shndërruan në bazat e të dhënave të kërkueshme brenda natës.
Papritur, ose kështu dukej, Google e dinte se si dukej macja juaj.
Google e ndërtoi punën e mëparshme të një blerjeje të vitit 2013, DNNresearch, duke ngritur një rrjet nervor të thellë të trajnuar në të dhëna që ishin etiketuar nga njerëzit. Kjo quhet mësim i mbikëqyrur; procesi përfshin trajnimin e rrjetit në miliona imazhe në mënyrë që të mund të kërkojë të dhëna vizuale në nivelin pixel për të ndihmuar në identifikimin e kategorisë. Me kalimin e kohës, algoritmi bëhet më i mirë në njohjen, të themi, një panda, sepse ai përmban modelet e përdorura për të identifikuar saktë pandat në të kaluarën. Me trajnime të mëtejshme, bëhet e mundur të kërkohen terma më abstraktë si “kafshë” ose “mëngjes”, të cilat mund të mos kenë tregues të zakonshëm vizual, por që janë menjëherë të dukshëm për njerëzit.
Duhet shumë kohë dhe fuqi përpunuese për të trajnuar një algoritëm si ky, por pasi qendrat e të dhënave kanë bërë gjërat e tyre, ai mund të drejtohet në pajisjet e lëvizshme me fuqi të ulët pa shumë probleme. Puna e ngritjes së rëndë tashmë është bërë, kështu që pasi fotografitë tuaja të ngarkohen në cloud, Google mund të përdorë modelin e tij për të analizuar dhe etiketuar tërë bibliotekën. Rreth një vit pas fillimit të Google Photos, Apple njoftoi një veçori të kërkimit të fotografive që ishte trajnuar në mënyrë të ngjashme në një rrjet nervor, por si pjesë e angazhimit të kompanisë për privatësi, kategorizimi i vërtetë kryhet në procesorin e secilës pajisje pa veçuar dërgimin e të dhënave. Kjo zakonisht zgjat një ose dy ditë dhe ndodh në sfond pas vendosjes.
Softueri inteligjent i menaxhimit të fotografive është një gjë, por AI dhe mësimi i makinerive pa dyshim kanë një ndikim më të madh në mënyrën se si fotografitë kapen në radhë të parë. Po, lentet vazhdojnë të marrin pak më shpejt dhe sensorët gjithmonë mund të bëhen pak më të mëdhenj, por tashmë po shtyhemi për kufizimet e fizikës kur bëhet fjalë për ndërprerjen e sistemeve optike në pajisjet e pakta të lëvizshme. Sidoqoftë, nuk është e rrallë këto ditë që telefonat të marrin fotografi më të mira në disa situata sesa shumë pajisje të dedikuara kamerash, të paktën para përpunimit.
Kjo është për shkak se kamerat tradicionale nuk mund të konkurrojnë në një kategori tjetër të pajisjeve që janë po aq të thella për fotografinë: sistemet në çip që përmbajnë një CPU, një procesor të sinjalit të imazhit dhe, gjithnjë e më shumë, një njësi të përpunimit nervor (NPU).
Ky është pajisja e përdorur në atë që bëhet e njohur si fotografi llogaritëse, një term i gjerë që mbulon gjithçka, nga efektet e rreme të fushës së thellësisë në mënyrat e portreteve të telefonave, deri tek algoritmet që ndihmojnë në drejtimin e cilësisë së jashtëzakonshme të figurës së Google Pixel. Jo të gjithë fotografitë llogaritëse përfshijnë AI, por AI është sigurisht një komponent kryesor i tij.
Apple e shfrytëzon këtë teknologji për të drejtuar modalitetin e portreteve të kamerave të dyfishtë. Procesori i sinjalit të figurës së iPhone përdor teknikat e mësimit të makinerive për të njohur njerëzit me një aparat fotografik, ndërsa kamera e dytë krijon një hartë të thellësisë për të ndihmuar në izolimin e temës dhe për të mjegulluar sfondin. Aftësia për të njohur njerëzit përmes mësimit në makinë nuk ishte e re kur kjo funksion debutoi në 2016, pasi është ajo që programi i organizimit të fotografive tashmë po bënte. Por për ta menaxhuar atë në kohë reale me shpejtësinë e kërkuar për një aparat fotografik smartphone ishte një përparim.
Google mbetet udhëheqësi i dukshëm në këtë fushë, megjithatë, me rezultatet e shkëlqyera të prodhuara nga të tre gjeneratat e Pixel si prova më bindëse. HDR +, mënyra e parazgjedhur e xhirimit, përdor një algoritëm kompleks që bashkon disa korniza të pavendosura në një dhe, siç e ka theksuar drejtuesi i fotografisë llogaritëse të Google, Marc Levoy, mësimi i makinerisë do të thotë që sistemi vetëm përmirësohet me kohën. Google ka trajnuar AI-në e saj në një bazë të dhënash të fotografive të etiketuara, si me programin Google Photos, dhe kjo ndihmon më tej kamerën me ekspozimin.
Por avantazhi i Google kurrë nuk është dukur aq i ashpër sa bëri disa muaj më parë me fillimin e Night Sight. Karakteristika e re Pixel krijon ekspozime të gjata së bashku dhe përdor një algoritëm të mësimit të makinerisë për të llogaritur ekuilibrin dhe ngjyrat më të sakta të bardha, me rezultate sinqerisht mahnitëse. Karakteristika funksionon më së miri në Pixel 3, sepse algoritmet ishin dizajnuar me harduerin më të fundit në mendje, por Google e bëri atë të disponueshëm për të gjithë telefonët Pixel – madje edhe origjinalin, i cili i mungon stabilizimi optik i imazhit – dhe është një reklamë mahnitëse për mënyrën sesi softueri tani është më e rëndësishme se hardueri i kamerës kur bëhet fjalë për fotografimin celular.
Thënë kjo, ka akoma hapësirë që pajisja të bëjë ndryshime, veçanërisht kur mbështetet nga AI. Por kjo do të thotë akoma të grisni shumë pixel të vegjël në një hapësirë të vogël, e cila ka tendencë të jetë problematike për cilësinë e figurës.
Procesorët e sinjalit të imazhit kanë qenë të rëndësishme për performancën e kamerave telefonike për një kohë, por duket se NPU-të do të marrin një rol më të madh si përparime të fotografisë llogaritëse. Huawei ishte kompania e parë që njoftoi një sistem çip-pajisje me pajisje të dedikuar AI, Kirin 970, megjithëse A11 Bionic i Apple përfundoi në arritjen e konsumatorëve të pari.
Ky lloj i pajisjeve do të jetë gjithnjë e më e rëndësishme për mësimin efikas dhe performues të makinerisë në pajisje, e cila ka një tavan jashtëzakonisht të lartë për sa i përket kërkesave të tij për procesorin
Google ka treguar disa punë mbresëlënëse që mund të zvogëlojnë barrën e përpunimit, ndërsa motorët nervorë po bëhen më të shpejtë në vit. Por edhe në këtë fazë të hershme të fotografisë kompjuterike, ka përfitime të vërteta që mund të gjenden nga kamerat telefonike që janë dizajnuar rreth mësimit të makinerive. Në fakt, nga të gjitha mundësitë dhe aplikimet e ngritura nga vala e hipotekës AI e viteve të kaluara, zona me përdorimin më praktik sot është fotografia e diskutueshme. Kamera është një tipar thelbësor i çdo telefoni, dhe AI është qëllimi ynë më i mirë në përmirësimin e tij.
