近日,以智能科学系系统研究室09级博士生韩磊为第一作者的论文(Lei Han, Guojie Song*, Gao Cong, Kunqing Xie, "Overlapping Decomposition for Causal Graphical Modeling")被数据挖掘与知识发现领域顶级会议The 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(ACM SIGKDD 2012)录用。
       论文针对大规模的关联图模型,提出了一种重叠分解的理论方法,以传统的单个图模型为基础,分析了其理论模型的渐进性,指出了其在大规模变量的环境下精度受损的问题。论文对传统的单个图模型理论做出了扩展,推导出了其单步节点扩大的理论性质,并从统计学的渐进性分析角度给出了严谨的精度分析。基于上述理论,论文又提出了一种自底向上的贪心策略,采用单步节点扩大的理论,逐步从一些初始的种子子图扩展,最终收敛得到原始图的重叠子图划分结构并求得各个子图中的变量之间的关联关系。该项研究结果对大规模图模型的因果关联发现与推理方面做出了基础理论贡献。