基于贝叶斯方法的情境视觉研究
在视觉研究领域,如何在观察场景中的移动物体间分配视觉注意力,是将视觉置于现实世界的关键问题。本文将探讨如何在贝叶斯框架下设计考虑这一问题的计算模型,并通过对眼动追踪的人类受试者进行实验来验证该模型。
1. 引言
在对人类和机器人等主动生物体或智能体进行建模时,一个主要问题是如何将视觉“置于”现实世界中。为了在世界中导航,需要一种将注意力引导到单个物体上的方法,然后根据需要编码额外信息。注意力不仅将各种视觉处理限制在视野的特定空间区域,还考虑基于对象的信息,其局限性表现为能同时处理的离散对象数量。
Pylyshyn的FINST(实例化手指)理论提出了一种机制,通过有限数量的视觉索引(手指、内部指针)实现基于对象的个体化、跟踪和访问。这些视觉索引赋予被索引项目处理优先级,使焦点注意力能够转移到可能移动的索引项目上,而无需先通过空间扫描来寻找它们。本文将讨论这种机制如何在多假设跟踪的贝叶斯框架中找到计算对应物,以及如何融入通用的视觉注意力模型。
2. 视觉推理的背景与概述
该模型的设计基于生物视觉的功能架构。视觉控制的神经通路可简化为两条信息通路:动作通路和感知通路。
动作通路主要处理视觉信息以完成现实世界中的动作,主要基于空间信息,但在视觉运动任务中也能处理基于对象的信息。它主要涉及中颞叶(MT)区域进行运动分析、V3区域进行动态形式分析以及内侧上颞叶(MST)区域进行目标追踪。
感知通路主要关注对象识别和视觉感知,涉及V4区域进行与颜色相关的形状分析以及下颞叶皮质(IT)区域进行对象的高级视觉感知。
这两条通路并非相互独立,而是相互协作以提供对世界的
超级会员免费看
订阅专栏 解锁全文

1132

被折叠的 条评论
为什么被折叠?



