日前,谷歌DeepMind推出了两款基于Gemini 2.0的新AI模型,旨在通过利用大语言模型的推理能力,完成复杂的现实世界任务,帮助机器人适应复杂环境。 第一款模型名为Gemini Robotics。据官方介绍,这是一个视觉-语言-动作模型。第二款模型是Gemini Robotics-ER(即具身推理)。该模型具备增强的空间理解(jiě)能(néng)力(lì),能(néng)让(ràng)机(jī)器(qì)人(rén)专(zhuān)家(jiā)利(lì)用(yòng)Gemini的(de)具(jù)身(shēn)推(tuī)理(lǐ)(ER)能(néng)力(lì)运(yùn)行(xíng)自(zì)有(yǒu)程(chéng)序(xù)。 谷(gǔ)歌(gē)DeepMind认(rèn)为(wèi),要(yào)成(chéng)为对人类有用的机器人AI模型,必须具备三大核心特质:通用性,能适应不同场景;交互性,能快速理解并响应指令或环境变化;以及灵巧性,能完成类似人手般精细的操作。新发布的这两款模型能让多种机器人执行比以往更广泛的现实任务。