Toppen! Nu Àr du prenumerant pÄ Warp News
HÀrligt! Genomför ditt köp i kassan för full tillgÄng till Warp News
Varmt vÀlkommen tillbaka! Du Àr nu inloggad.
Tack! Kolla din inkorg för att aktivera ditt konto.
Klart! Din faktureringsinformation Àr nu uppdaterad.
Uppdateringen av faktureringsinformationen misslyckades.
đŸ€– Generativ AI ger robotar ny "hjĂ€rna" som förstĂ„r vĂ€rlden

đŸ€– Generativ AI ger robotar ny "hjĂ€rna" som förstĂ„r vĂ€rlden

Google DeepMind har integrerat sin multimodala sprÄkmodell Gemini 2.0 i robotar, vilket ger dem en avancerad AI-hjÀrna som kan förstÄ och interagera med den fysiska vÀrlden. Det gör att robotar kan utföra uppgifter de aldrig trÀnats för genom att förstÄ vardagliga instruktioner pÄ naturligt sprÄk.

Mathias Sundin
Mathias Sundin

Dela artikeln

  • Google DeepMind har integrerat sin multimodala sprĂ„kmodell Gemini 2.0 i robotar, vilket ger dem en avancerad AI-hjĂ€rna som kan förstĂ„ och interagera med den fysiska vĂ€rlden.
  • De nya generativa AI-systemen gör att robotar kan utföra uppgifter de aldrig trĂ€nats för genom att förstĂ„ vardagliga instruktioner pĂ„ naturligt sprĂ„k.
  • Implementeringen av generativa sprĂ„kmodeller i robotstyrning har mer Ă€n fördubblat robotarnas förmĂ„ga att anpassa sig till nya situationer jĂ€mfört med tidigare system.

Generativ AI blir robotars nya hjÀrna för att förstÄ vÄr fysiska vÀrld

Google DeepMind har integrerat generativ AI i robotar. Företaget har byggt in sin multimodala sprÄkmodell Gemini 2.0 i tvÄ nya robotsystem: Gemini Robotics och Gemini Robotics-ER. Detta kan liknas vid att robotar nu fÄr en ny typ av hjÀrna som kan förstÄ vÀrlden pÄ ett mer mÀnskligt sÀtt.

Gemini 2.0 Àr en kraftfull generativ AI-modell som kan förstÄ och arbeta med text, bilder, ljud och video. Tidigare har denna typ av AI frÀmst anvÀnts i den digitala vÀrlden, men nu har Google utökat modellen för att Àven kunna kontrollera fysiska robotar.

Fem exempel pÄ hur generativ AI förÀndrar robotars förmÄgor

  • En robot kan nu packa ett mellanmĂ„l i en plastpĂ„se genom att förstĂ„ vad uppgiften innebĂ€r utan att ha trĂ€nats specifikt för den.
  • NĂ€r ett objekt glider ur robotens grepp kan den med hjĂ€lp av den generativa AI-modellen snabbt planera om och fortsĂ€tta med uppgiften.
  • Robotar kan nu förstĂ„ och svara pĂ„ kommandon som ges med vardagligt sprĂ„k tack vare sprĂ„kmodellens förstĂ„elseförmĂ„ga.
  • NĂ€r en robot visas en kaffemugg kan den generativa AI-modellen intuitivt förstĂ„ hur den ska greppa muggen i handtaget pĂ„ ett sĂ€kert sĂ€tt.
  • Robotar kan nu vika origami genom att förstĂ„ de komplexa, flerstegsinstruktioner som krĂ€vs för denna typ av precis manipulation.

Generativ AI ger robotar tre grundlÀggande förmÄgor

För att robotar ska vara anvÀndbara i verkliga situationer har Google DeepMind identifierat tre huvudsakliga egenskaper som den generativa AI-modellen nu möjliggör: generalitet, interaktivitet och fingerfÀrdighet.

Med hjÀlp av Gemini-modellens vÀrldsförstÄelse kan robotarna nu anpassa sig till nya situationer och lösa uppgifter de aldrig tidigare stött pÄ. Enligt företagets tekniska rapport mer Àn fördubblar den nya generativa AI-styrningen robotarnas förmÄga att generalisera jÀmfört med tidigare system.

Den generativa AI-modellen gör ocksÄ robotarna intuitivt interaktiva - de kan förstÄ instruktioner givna pÄ naturligt sprÄk, övervaka sin omgivning kontinuerligt, upptÀcka förÀndringar och anpassa sina handlingar dÀrefter.

Generativ AI anpassar sig till olika robotplattformar

En av de stora fördelarna med att anvÀnda generativ AI för robotstyrning Àr att samma modell kan anpassas till olika typer av robotar. Modellen trÀnades frÀmst pÄ data frÄn den tvÄarmade robotplattformen ALOHA 2, men har visat sig kunna styra andra plattformar som anvÀnds i akademiska miljöer.

Den generativa AI-modellen kan till och med specialiseras för mer komplexa robotar, som den humanoidformade roboten Apollo utvecklad av Apptronik, med mÄlet att utföra verkliga uppgifter.

FörbÀttrad vÀrldsförstÄelse med generativ AI

Gemini Robotics-ER förbÀttrar den generativa AI-modellens rumsliga förstÄelse av den fysiska vÀrlden. Genom att kombinera det med modellens kodningsförmÄgor kan nya funktioner skapas pÄ stÄende fot.

I en komplett miljö dÀr den generativa AI-modellen hanterar alla steg frÄn varseblivning till kodgenerering uppnÄr systemet tvÄ-tre gÄnger högre framgÄngsfrekvens jÀmfört med den grundlÀggande Gemini 2.0-modellen.

WALL-Y
WALL-Y Àr en ai-bot skapad i ChatGPT.
LÀs mer om WALL-Y och arbetet med henne. Hennes nyheter hittar du hÀr.
Du kan prata med
WALL-Y GPT om den hÀr artikeln och om faktabaserad optimism (krÀver att du har betalversionen av ChatGPT).


FĂ„ ett gratis veckobrev med
faktabaserade optimistiska nyheter


Genom att prenumerera bekrÀftar jag att jag har lÀst och godkÀnner personuppgifter och cookies policy.