一、选题背景和意义:
随着信息时代的到来,统计学与机器学习发展迅速,并衍生出许多新的研究方向。关系与逻辑推理,概率论,统计学,人工智能与机器学习等学科的交融愈加密切。逻辑是一种形式化的语言,故而有了许多形式化方法和学习方法来发展概率逻辑学。例如概率关系模型,随机逻辑程序等等。本课题研究的贝叶斯逻辑程序就是一种将一阶逻辑理论和统计学中贝叶斯网相结合的产物。
贝叶斯网是统计学中用概率模型表示和推理的最重要,有效和的框架之一。贝叶斯网是一种有向无圈图,它确定了一个有限随机变量集合上的联合概率分布。贝叶斯网主要包含定性和定量的组成部分。定性部分刻画了局部的随机变量之间的逻辑关系,而定量部分则是确定了这些随机变量的概率密度,即局部条件概率。贝叶斯网在社会发展中有许多重要应用,例如遗传信息的研究,疾病诊断等等。
但是,贝叶斯网具有明显的局限性,因为它本质是特定命题表示,所以对于许多问题不能制定出一般和普适的概率规则。于是人们开始寻找新的方法升级和贝叶斯网有关的技术。贝叶斯逻辑程序就是在这样的背景下发展起来的。
研究贝叶斯逻辑程序具有重要意义。贝叶斯逻辑程序统一了贝叶斯网和一阶逻辑理论,既克服了贝叶斯网的命题特征,又区别于单纯的逻辑程序,形成一种优美而有效的信息表示框架。它能够制定特定问题的普适性规则,帮助人们解决许多科学发展和生产中的问题,例如构建家族血型的遗传模型,并适用于不同的家族之中。因此,通过对该领域理论的研究和算法的学习,并结合相应的数据集,可以编写出合适于特定问题的贝叶斯逻辑程序,有效总结出问题的信息结构。
二、课题关键问题及难点:
本课题研究的关键问题是如何编写给定基准测试数据集的贝叶斯逻辑程序。难点主要存在于如下方面。
第一,理论学习上的难度。要求将已学过统计学,逻辑和图论的知识充分结合,熟练掌握贝叶斯逻辑程序的相关概念和理论,形成一套新的知识体系;与此同时,需要结合数理统计等学科的知识,充分理解掌握编写贝叶斯逻辑程序的算法核心思想和框架,在实际编程之前进行深入的理论学习。
第二,实践操作上的难度。首先需要学习使用Prolog (Programming of Logic)编写程序,Prolog是一种面向演绎推理的逻辑型程序设计语言,特点是描述性强,需要充分结合逻辑的知识进行学习练习,提高编程能力。其次需要一定的时间进行数据采集,即在有关网站上寻找合适的数据构成基准测试数据集用于后续编程。在编程环节中,要求用Prolog成功实现相应的数据集的贝叶斯逻辑程序,这要求成功将文献中的算法理论框架转化为编程代码,对编程能力有一定要求。
三、文献综述(或调研报告):
