Matlab实现模糊聚类之IsoData算法111

2023-06-20 17:55•Java教程•阅读 4455

第一部分是本科时候学数据挖掘时积累的。

一.数据挖掘基础

1.数据挖掘三个研究方向：统计学、数据库和机器学习。

2.数据库系统和文件系统区别：都有存储，但前者查询处理和事务处理（原子性）以及并发控制；在磁带盘上的话只能顺序访问。

3.并不是所有的东西都是数据挖掘,比如查询处理，专家系统、统计程序或者小型的数学计算。

4.数据挖掘其实应该叫知识挖掘。

5.空间数据库：GIS，遥感，医学影像，里面存储的是一些矢量。

6.流数据：连续的有序的变化的快速的，主要应用于网络监控，股票市场，流媒体等，在线看视频后并没有在本地保存，不是以文件形式存在的。

7.风险预测；广告投放。

操作性数据库的数据往往都归档了，已经存储在磁盘。

并发控制主要是对写操作进行的，数据仓库不需要写操作，所以不需要事务处理、恢复和并发控制等机制。

二.isodata算法原理