苹果介绍 Ferret-UI 多模态大语言模型:更充分理解手机屏幕内容

苹果公司近日发布研究论文,展示了 Ferret-UI AI 系统,可以理解应用程序屏幕上的内容。它将移动UI的视觉元素和语言元素结合起来,不仅能“看懂”屏幕上的内容,还能理解用户的指令和问题,进而执行任务或提供信息。Ferret-UI的能力不止于看和识别,它还能进行推理。例如,它可以通过分析屏幕上的元素来推测一个应用的功能,或者理解和参与与屏幕内容相关的对话。

上一篇:

下一篇:

联系我们

联系我们

在线咨询: QQ交谈

邮件:iyangqi#qq.com

工作时间:周一至周五,9:30-17:30,节假日休息

分享本页
返回顶部