CSDN博客

img monmars

数据挖掘软件开发关键技术分析

发表于2008/10/1 10:24:00  570人阅读

 1.数据挖掘算法

  数据挖掘算法既难亦不难,不难在于有很多可以参考的书籍和论文.难度在于对这些参考资料需要理解吃透.公开的资料往往细节上描述不够,公开的源码算法不够先进,有的还有错.请高手又有价格和售后服务问题.最好能够自己吃透,这样一来后续算法的优化也有保证. 推荐参考的算法有: 小波聚类,Logistic   回归,FP-Growth等算法.

2. 界面设计

界面设计需要大量的计算机图形学的知识,数据挖掘的结果需要丰富的展现层次.采用类似Excel或Chart的控件一来有版权纠纷,二来界面的提高收到制约. 难点在于三维图形表现,视见变换,渲染等

3.编译器

数据挖掘产品如果要提供用户很强的定制能力,必须提供独立的内置编译器.一个象样的编译器的工作量是巨大的,何况还需要经过大量的测试,这些测试最好采用自动测试工具.最好采用根据BNF规则自动生成编译器,方便以后语法规则的修改

4.架构设计

我们开发双机模型数据挖掘软件套件时发现其实这块实际上是和国外产品相距最大的.其他部分理论相对固定,只有这块对设计人员的要求是最高的,项目开始时,划分了十几个模块,分三到五层设计,对每个模块甚至提供了一系列的设计模式.可是对于一万行以下的小模块还能够把握得住.对五万行以上的模块就不行了,只能保证大体不脱缰而已.甚至有些大的模块破坏了项目初期的层次划分,不得不重新设计.即使这样,还需要不断地采用XP敏捷开发原则,对代码重构.以保证代码的可维护性. 我们觉得这个环节实际上对开发人员水平的提高至关重要. 建议学习架构设计,模式设计,敏捷开发等知识

5.其他

建议采用能够找到的最先进的主流开发工具和平台.对开发中遇到的物质和精神阻力有足够的准备.如国家在最近一年遇到的种种意想不到的天灾和美国百年不遇的金融危机的打击. 建议对上述不利的准备措施*2,对开发时间和经费*3,有空去烈士纪念碑看看也许会有些精神动力. 不过黄山上的迎客松生于贫瘠,却傲于霜雪.

6.最重要

最好避开国内的竞争,做国内外差距大的产品.感觉做到这样,实际上国产数据库管理系统也是有可能完成的

 

0 0

相关博文

我的热门文章

img
取 消
img