SeeAct:识别网页元素执行任务
SeeAct 简介 SeeAct 是一个基于 GPT-4V 的通用网络代理,它融合了视觉感知能力和自然语言处理能力,能够在各种网站上识别网页元素并执行多样化的任务。例如,它可以在苹果官网上比较不同型号的iPhone并提供购买建议,或者在旅游...
SeeAct 简介 SeeAct 是一个基于 GPT-4V 的通用网络代理,它融合了视觉感知能力和自然语言处理能力,能够在各种网站上识别网页元素并执行多样化的任务。例如,它可以在苹果官网上比较不同型号的iPhone并提供购买建议,或者在旅游...