网络内分类与多任务特征选择技术解析
在数据分析和机器学习领域,网络内分类和多任务特征选择是两个重要的研究方向。下面将详细探讨相关的方法、参数影响以及性能评估。
网络内分类方法及参数影响
在网络内分类中,有一种基于局部结构相似性的新方法。该方法与其他常见方法不同,其他方法通常基于网络中相邻节点可能具有相同类型的原则,或者仅使用节点邻域内的标签分布进行分类,而此方法则根据节点与网络中其他节点的局部结构相似性对节点进行分类。
为了评估节点之间的结构相似性,提出了一种使用随机游走的新方法。该方法通过考虑网络中节点的标签不确定性和节点度,扩展了边缘化图核。
数据特点及分类效果
不同数据集具有不同的特点,对分类结果产生影响:
- AIDS数据 :由于与氢原子的键被省略,数据存在噪声。
- Protein和WebKD数据集 :节点度为分类提供的信号较弱,不同方法的分类结果相当。
参数对分类准确性的影响
-
参数α和β :在Mutagenicity数据集中,参数α和β控制关系分类器中标签不确定性和相似性的影响。通过增加具有不确定标签的节点相对于已知标签节点的重要性(即使用α < 1),有时可以提高分类准确性。这可能是因为使用这样的值可以使方法更平滑地收敛。而RL - CDRN方法的效果较差,可能是因为在该框架中相当于使用α →∞(假设随机游走长度限制为1)。
| RL α \ RL β | 0.25 | 0.50 | 0.75 | 1.00 |
超级会员免费看
订阅专栏 解锁全文

3277

被折叠的 条评论
为什么被折叠?



