聚类分析是数据挖掘技术的一项重要内容,本书详细阐述了作者在聚类分析中所作的研究工作,涉及聚类的相关概念、面向复杂数据的聚类算法的提出,重点讲述了聚类算法在大气污染和复杂网络中的具体应用。本书适用于从事数据挖掘的科技工作者及工程技术人员,也适用于大气污染、复杂网络等数据分析人员。
1绪论
1.1引言
1.2聚类分析概述
2理论基础与相关工作
2.1定义和术语
2.2相似性计算
2.3经典聚类方法
2.4其他聚类方法
2.5聚类算法常见的问题
2.6当前聚类研究热点
2.7常用聚类质量评价方法
3使用kNN发现簇密度主干的聚类算法
3.1研究背景
3.2CLUB算法
3.3实验分析
3.4小结
4基于本体的大气污染源建模
4.1研究背景
4.2相关知识
4.3大气污染领域的本体建模
4.4基于大气领域本体模型的规则推理
4.5小结
5基于连续隐马尔可夫的兰州PM10污染提前24小时预测研究
5.1研究背景
5.2相关预测方法分析
5.3马尔可夫链简介
5.4隐马尔可夫模型介绍
5.5基于CHMM的提前24小时预测模型
5.6实验及预测结果分析
5.7小结
6EPC:基于环境污染特征的抽样数据聚类算法
6.1研究背景
6.2环境污染抽样数据的特点
6.3相关理论及概念
6.4EPC算法
6.5实验分析
6.6小结
7结论与展望
7.1结论
7.2展望
参考文献