统计模型与多维数据分析方法探讨

21、考虑Garmize和Rychlak(1964年)报告的列联表,表中数据显示了不同的人在通过角色扮演进入某种情绪后,对罗夏墨迹图片给出特定解读的频率。(a) 使用序数和度量模型对这些数据进行展开分析,并尝试不同方法避免退化问题。(b) 讨论可以对数据进行哪些预处理或加权处理,注意到数据中有很多零值和极低的频率。(c) 查看对数据应用权重会对展开分析结果产生什么影响。

  • (a) 可使用相关统计软件按要求对数据用不同模型展开并尝试加约束条件等方法避免退化;
  • (b) 可对零值和低频数据进行平滑处理、去除稀疏数据等预处理,或根据数据重要性等加权;
  • (c) 应用权重可能改变数据点间距离,影响展开结果的结构和解释。

22、考虑展开的向量模型。(a) 首先,构建一个二维平面上的配置X(X为一系列二维坐标点的集合)。然后,为若干人定义偏好向量pi(i = 1, …),这些向量是从原点E = (0, 0) 穿过X中的另一个点 (x1i, x2i) 的直线。最后,通过将X中的点投影到理想向量上,为每个人i构建偏好量表。(b) 从心理学角度讨论每个人i的坐标yi1和yi2的含义。这些“权重”表达了什么?(提示:X的维度对理想直线的方向有多大贡献?)(c) 在模型(16.2)中,yi1和yi2应该如何限制?(提示:注意diag(YY′)上的约束。如何解释这样约束后的坐标?)(d) 展开这样构建的偏好数据,并将解决方案与最初的X和Y进行比较。(e) 向X和Y添加随机误差,并针对不同的误差水平重复上述研究。讨论缩放过程的稳健性。(f) 构建一个不适合对象空间X的偏好向量。无论如何,在偏好向量模型中可以做些什么来表示它?(提示:考虑增加展开空间的维度。)

  • (a) 按要求构建配置X、定义偏好向量并构建偏好量表;
  • (b) 从心理学角度,坐标$ y_{i1} $和$ y_{i2} $可能表示个体在不同维度上对理想直线方向的重视程度,即维度对理想直线方向的贡献大小;
  • (c) 需根据$ \text{diag}(YY’) $的约束来确定$ y_{i1} $和$ y_{i2} $的限制,约束后的坐
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值