一种基于 CDC 的适用于高维数据的因果推断算法

时间:2023-02-15 18:53:12
作者:李洪飞,万亚平,2,阳小华,2,耿家兴
关键字:耦合相关系数,最大信息系数,最小二乘回归,因果推断
DOI:10.3969/j.issn.1673-629X.2020.01.007
查看次数:661

如需要完整文档点击下方 "点击下载文档" 按钮

一对观测变量之间的因果关系的推断是科学中的基本问题,基于观测数据分析提出因果关系的方法对于产生假设和加速科学发现具有实用价值。 利用传统的因果推断算法从高维数据中学习因果网络结构和提高学习准确率是目前研究的难点。 在引入耦合相关系数(copula dependence coefficient,CDC)的基础上,提出了一种适用于高维数据的两步骤因果推断算法。 首先该算法利用优于最大信息系数的 CDC 对变量间的关联度进行检测,寻找目标节点的父子节点集;然后使用非线性最小二乘独立回归算法,为图中的目标节点与其父子节点之间标注因果方向;最后迭代所有的节点完成完整的因果网络结构。 实验结果表明,该算法提高了高维数据下因果网络结构学习的准确率。 同时在大样本数据集中,该算法的时间复杂度优于传统算法,对异常值具有鲁棒性。

如需要完整文档点击下方 "点击下载文档" 按钮

一种基于 CDC 的适用于高维数据的因果推断算法
《一种基于 CDC 的适用于高维数据的因果推断算法》
完整文档 下载到本地,方便收藏和查阅
文件号:061456
一种基于 CDC 的适用于高维数据的因果推断算法
点击下载文档
一种基于 CDC 的适用于高维数据的因果推断算法

点击下载 文件号:061456(点击复制) 公众号(点击复制)

x