在持续推动Gemini人工智能服务之际,The Information网站取得消息指称,谷歌计划推出以Project Jarvis为称的代理(agent)服务,或许将与Anthropic近期提出的Computer Use功能竞争。
依照知情人士透露说法,以“Project Jarvis”为称的代理服务,将能借由识别设备屏幕上的截图内容,在使用者进行下一步操作之前即可做好交互反应的准备。 “Project Jarvis”的名称,预期就是从《钢铁侠》剧情中的人工智能服务“Jarvis”衍生。
而此功能预计最快会在今年12月开放预览,但现阶段主要是与Chrome在内的网页浏览器配合使用,主要能对应内容研究、购物、航班预订等操作,同时预期会并入成为Gemini应用功能之一。
在此之前,Google已经在Pixel 9系列手机推出独占功能Pixel Screenshots,可帮忙记住手机截图内容背后待办事项,其中藉由Gemini人工智能技术识别用户存放在手机内的截图内容,并且自动纪录相关元数据资料,例如截图何时产生、使用哪一款App等,同时也会自动产生截图说明与相关细节摘要, 甚至可依照截图内容提供合适处理建议,例如在特定日期转账给指定对象。
此次传出的Project Jarvis,似乎会以Pixel Screenshots功能背后相关技术,结合Gemini人工智能模型加快识别用户当前操作行为,并且在用户实际做出下一步操作之前给予合适建议,或是以更快速度执行用户所需操作。
目前Google已经让Gemini对应更多语言界面,同时也将Gemini人工智能功能整合至Google Meet、Google Photos、Gmail等常见服务,让用户能藉由人工智能加快各类服务使用效率。