గూగుల్ డీప్ మైండ్ గురువారం రెండు కొత్త ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) మోడళ్లను ఆవిష్కరించింది, ఇది రోబోట్లను వాస్తవ ప్రపంచ పరిసరాలలో విస్తృతమైన పనులను చేసేలా చేస్తుంది. జెమిని రోబోటిక్స్ మరియు జెమిని రోబోటిక్స్-ఎర్ (మూర్తీభవించిన రీజనింగ్) గా పిలువబడేవి, ఇవి ప్రాదేశిక మేధస్సు మరియు చర్యలను ప్రదర్శించగల అధునాతన దృష్టి భాషా నమూనాలు. పర్వత వీక్షణ-ఆధారిత టెక్ దిగ్గజం కూడా జెమిని 2.0-శక్తితో పనిచేసే హ్యూమనాయిడ్ రోబోట్లను నిర్మించడానికి అప్ప్ట్రోనిక్తో భాగస్వామ్యం కలిగి ఉందని వెల్లడించింది. ఈ మోడళ్లను మరింత అంచనా వేయడానికి కంపెనీ కూడా పరీక్షిస్తోంది మరియు వాటిని ఎలా మెరుగుపరుచుకోవాలో అర్థం చేసుకోండి.
గూగుల్ డీప్మైండ్ జెమిని రోబోటిక్స్ AI మోడళ్లను ఆవిష్కరించింది
A బ్లాగ్ పోస్ట్డీప్మైండ్ రోబోట్ల కోసం కొత్త AI మోడళ్లను వివరించింది. గూగుల్ డీప్మైండ్లోని సీనియర్ డైరెక్టర్ మరియు రోబోటిక్స్ అధిపతి కరోలినా పారాడా, భౌతిక ప్రపంచంలోని ప్రజలకు AI సహాయపడటానికి, వారు “మూర్తీభవించిన” తార్కికతను ప్రదర్శించాల్సి ఉంటుందని – భౌతిక ప్రపంచాన్ని పరస్పరం మరియు అర్థం చేసుకునే సామర్థ్యం మరియు పనులను పూర్తి చేయడానికి చర్యలు చేసే సామర్థ్యం.
జెమిని రోబోటిక్స్, రెండు AI మోడళ్లలో మొదటిది, ఇది జెమిని 2.0 మోడల్ను ఉపయోగించి నిర్మించిన అధునాతన దృష్టి-భాష-చర్య (VLA) మోడల్. ఇది “భౌతిక చర్యలు” యొక్క కొత్త అవుట్పుట్ మోడలిటీని కలిగి ఉంది, ఇది రోబోట్లను నేరుగా నియంత్రించడానికి మోడల్ను అనుమతిస్తుంది.
భౌతిక ప్రపంచంలో ఉపయోగకరంగా ఉండటానికి, రోబోటిక్స్ కోసం AI మోడళ్లకు సాధారణత, ఇంటరాక్టివిటీ మరియు సామర్థ్యం అనే మూడు ముఖ్య సామర్థ్యాలు అవసరమని డీప్మైండ్ హైలైట్ చేసింది. సాధారణత అనేది విభిన్న పరిస్థితులకు అనుగుణంగా ఉండే మోడల్ సామర్థ్యాన్ని సూచిస్తుంది. జెమిని రోబోటిక్స్ “కొత్త వస్తువులు, విభిన్న సూచనలు మరియు కొత్త పరిసరాలతో వ్యవహరించడంలో ప్రవీణుడు” అని కంపెనీ పేర్కొంది. అంతర్గత పరీక్ష ఆధారంగా, పరిశోధకులు AI మోడల్ను సమగ్ర సాధారణీకరణ బెంచ్మార్క్లో పనితీరును రెట్టింపు చేస్తుంది.
AI మోడల్ యొక్క ఇంటరాక్టివిటీ జెమిని 2.0 యొక్క పునాదిపై నిర్మించబడింది మరియు ఇది రోజువారీ, సంభాషణ భాష మరియు వివిధ భాషలలో పదజాలం చేసిన ఆదేశాలను అర్థం చేసుకోవచ్చు మరియు ప్రతిస్పందించవచ్చు. మోడల్ తన పరిసరాలను నిరంతరం పర్యవేక్షిస్తుందని, పర్యావరణం లేదా సూచనలలో మార్పులను కనుగొంటుందని మరియు ఇన్పుట్ ఆధారంగా దాని చర్యలను సర్దుబాటు చేస్తుందని గూగుల్ పేర్కొంది.
చివరగా, జెమిని రోబోటిక్స్ భౌతిక వాతావరణం యొక్క ఖచ్చితమైన తారుమారు అవసరమయ్యే చాలా సంక్లిష్టమైన, బహుళ-దశల పనులను చేయగలదని డీప్మైండ్ పేర్కొన్నారు. AI మోడల్ రోబోట్లను కాగితపు ముక్కను మడవటానికి లేదా ఒక బ్యాగ్లో అల్పాహారాన్ని ప్యాక్ చేయగలదని పరిశోధకులు తెలిపారు.
రెండవ AI మోడల్, జెమిని రోబోటిక్స్-ఎర్ కూడా ఒక దృష్టి భాషా నమూనా, కానీ ఇది ప్రాదేశిక తార్కికంపై దృష్టి పెడుతుంది. జెమిని 2.0 యొక్క కోడింగ్ మరియు 3 డి డిటెక్షన్ నుండి గీయడం, వాస్తవ ప్రపంచంలో ఒక వస్తువును మార్చటానికి సరైన కదలికలను అర్థం చేసుకునే సామర్థ్యాన్ని AI మోడల్ ప్రదర్శిస్తుంది. ఒక ఉదాహరణను హైలైట్ చేస్తూ, మోడల్ కాఫీ కప్పును చూపించినప్పుడు, సురక్షితమైన పథం వెంట హ్యాండిల్ ద్వారా తీయటానికి రెండు వేళ్ల పట్టు కోసం ఒక ఆదేశాన్ని సృష్టించగలిగిందని పారాడా చెప్పారు.
అవగాహన, రాష్ట్ర అంచనా, ప్రాదేశిక అవగాహన, ప్రణాళిక మరియు కోడ్ ఉత్పత్తితో సహా భౌతిక ప్రపంచంలో రోబోట్ను నియంత్రించడానికి AI మోడల్ పెద్ద సంఖ్యలో దశలను చేస్తుంది. ముఖ్యంగా, రెండు AI మోడళ్లలో రెండూ ప్రస్తుతం పబ్లిక్ డొమైన్లో అందుబాటులో లేవు. డీప్మైండ్ మొదట AI మోడల్ను హ్యూమనాయిడ్ రోబోట్గా అనుసంధానిస్తుంది మరియు సాంకేతికతను విడుదల చేయడానికి ముందు దాని సామర్థ్యాలను అంచనా వేస్తుంది.