c#发展

首页 » 常识 » 预防 » 基于Python的实现Apriori算法
TUhjnbcbe - 2024/9/9 17:09:00

目录

1.实验综述1

2.实验原理1

2.1Apriori算法原理2

2.2Apriori算法性能3

3.实验环境搭建及运行3

3.1Gutenburg数据集的模式挖掘3

3.2DBLP数据集3

4.实验结论--GutenBerg--林肯演讲集:挖掘常用词共同出现4

4.1Sentence模式:以句子作为Basket进行挖掘4

4.2推广!Paragraph模式:以段落作为Basket进行挖掘8

4.3推广!选取多个最小支持度11

5.实验结论--DBLP--论文团队与主题12

5.1问题描述及数据集选取12

5.2任务1--寻找活跃支持者13

5.3任务2--寻找团队13

5.4任务3-主题与团队13

6.算法性能分析14

6.1针对Sentence模式的时间复杂度实证研究14

6.2效率改进--多支持度14

7.试验总结15

1.实验综述

关联分析常常用于从大规模数据库中寻找元素的隐含关系,是数据仓库中数据挖掘的最常用的方法。本实验旨在实现基本的数据挖掘算法(Apriori算法),选取部分数据集数据进行挖掘。在探寻数据隐含关系的同时,试图评估数据挖掘算法的性能和特性。

本报告主要包括以下部分:

1.实验原理(包括算法详细描述、算法特点等)

2.实验环境搭建(数据集的选取、挖掘的问题、编程环境简述)

3.实验发现

4.算法性能分析

本报告的核心亮点:

1.实现了Apriori算法,并对算法效率进行了实证性研究,应用了潜在解决方案。

2.进行了多粒度的数据挖掘(选取了句子和段落作为两种篮子,并比较二者区别)。

3.探索了多个支持度值的应用可能。

4.进行了多数据集的应用(GutenBergDBLP),对每个数据集进行了多个问题多个角度的研究探讨。

1
查看完整版本: 基于Python的实现Apriori算法