精易论坛

标题: 微软免费的OmniParser V2会不会分走大漠的一杯羹? [打印本页]

作者: qq1056123185    时间: 2025-2-21 09:07
标题: 微软免费的OmniParser V2会不会分走大漠的一杯羹?
2月17日,根据微软官网,微软日前发布视觉Agent解析框架OmniParser最新版本V2,可将OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,转化为“计算机使用智能体”(Computer Use Agent)。相比前代版本,OmniParser V2在检测更微小可交互元素时精度更高、推理速度更快。具体而言,V2通过使用更大规模的交互元素检测数据集和图标功能描述数据进行训练,并通过缩小图标描述模型的输入图像尺寸,推理延迟较前代降低60%。

作者: 十点半之后    时间: 2025-2-21 09:22
不支持中文吧
作者: 红尘旧梦i    时间: 2025-2-21 09:40
微软的东西,正常情况下是不支持中文的,帮助文档都是英文的,全靠你自己翻译
作者: 啊森哥哥    时间: 2025-2-21 11:03
于我们而言  又有什么关系呢...  
哪个能完成需求就用哪个.
作者: lijiahao123    时间: 2025-2-21 11:13
大漠:要走的人留不住留下的都是高质量
作者: awlwdska    时间: 2025-2-21 13:38
蹲蹲,能自动写代码或者操作重复性流程吗
作者: 时创智联    时间: 2025-3-28 18:25
观望一下,毕竟现在AI本身也还不那么成熟




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4