75.8 mIoU,表现明显优于此前方法;在新提出的 V-VGD 任务中,X2SAM 在多个设置下都显著超过此前强基线方法。 这些结果说明,X2SAM 不仅能处理单张图片中的分割任务,也能更好地理解视频中的目标变化、语言指令和视觉提示。
当前文章:http://fx0o7.wenkepu.cn/r353/i0qcbn.html
发布时间:11:46:03