|
楼主 |
发表于 2005-9-10 13:39
|
显示全部楼层
回复:(xingxia)[分享]数据挖掘综述
本帖最后由 wdhd 于 2016-8-31 15:08 编辑
总结和方向
总结
Chap 1:引言
概念;结果,技术,方法;本书三层框架- 所涉及的技术,技术和工具,趋势
Part I :支持数据挖掘的技术
Chap 2:数据库系统
数据模型;数据库体系结构;数据库功能;数据库和数据挖掘的结合
Chap 3:数据仓库
数据仓库定义、技术、功能;开发数据仓库;数据仓库、数据库管理和数据挖掘的关系
Chap 4:其他支持的技术:统计、机器学习、可视化、并行处理、和决策支持
Chap 5:数据挖掘不同的体系结构:技术;功能;Client/Server
Part II :数据挖掘技术和工具
Chap 6:数据挖掘过程
例子(偏差分析/关联规则/分类等);数据挖掘的原因;数据挖掘步骤;用户接口方面
Chap 7:数据挖掘的结果(任务),方法和技术
结果-聚集/分类等;方法论-自顶而下/自下而上/混合;技术-决策树/神经网络/逻辑归纳
Chap 8:逻辑归纳inductive logic programming
演绎逻辑编程;逻辑归纳编程;ILP作为数据挖掘技术及其缺陷
Chap 9:数据挖掘工具
研究原型-新的功能模型/新的信息服务/结果可理解性/可度量性/大规模项目;商业工具
Part III :数据挖掘趋势
Chap 10:挖掘分布式、异质、遗留数据库
新的研究领域;问题;需要做的工作
Chap 11:多媒体数据挖掘
多媒体数据库简介;在多媒体数据上的数据挖掘 – 文本/图象/视频/音频数据;方向
Chap 12:Web数据挖掘
Web数据管理;Internet数据库和数字图书馆;WEB数据挖掘 – Internet数据库(构建数据仓库和多媒体数据挖掘)/用户浏览模式
Chap 13:数据挖掘的安全和隐私问题
推论问题inference problem;处理推论问题的方法;逻辑归纳和推论;隐私问题
Chap 14:数据挖掘的元数据
元数据简介;挖掘元数据;利用元数据挖掘数据
挑战
不完全和不精确的数据
标记数据,计算机处理,存储数据库,创建数据仓库,数据清洁,解决不确定性,格式化数据
不充分的工具和资源
数据挖掘工具不成熟
剪除结果和理解结果的能力
prune mining result,可视化,数据的可理解性
多语言挖掘 : 处理多种语言的工具
数据挖掘算法的可度量性
数据挖掘项目管理上的支持
Part III分布式,异质,遗留数据库/多媒体数据/WEB数据/安全和隐私问题/元数据挖掘
方向
数据理解
不完全和不精确的数据
多语言挖掘
多策略学习
可度量性Scalability (大规模数据)
更好的数据挖掘技术
数据挖掘理论 (艺术 – 理论)
技术综合
分布式,异质,和遗留数据库挖掘
多媒体数据挖掘
WEB挖掘
元数据挖掘
数据挖掘的安全和隐私
归纳和建议
数据挖掘是多技术的综合: 数据管理,机器学习,统计推理,高性能计算,决策支持,可视化
好的数据是数据挖掘的关键
数据挖掘研究处于初级阶段 (98) : 期望不同的方法论和OO设计和分析技术的应用
如 UML应用在数据挖掘上
实际数据挖掘应用的开发有助于对数据挖掘的理解
数据挖掘项目需要管理和交流
利用各种数据挖掘产品和原型的商业和研究的材料
数据挖掘是一个机遇,也是一个挑战
|
|