[list] [*]如果楼主这里的GP指的是Greenplum的话那我给你的回答是非常肯定的,不过这里面有一个前置条件就是以Greenplum为基础建设的数据仓...
2016-05-06 11:34 回复了该问题个人的一点建议供楼主参考: 首先理解下楼主的描述,楼主希望将新增的N条数据归入已经聚好的M个类中,这里面的关键前提是已有的类信息不会发生变化,只是按已有的类信...
2016-04-29 10:59 回复了该问题顶二楼,顺便补充如下: 1)任何聚类算法都有其适用的数据类型范畴,就你的案例而言选择什么样的算法首先要看你会将文本数据预处理成什么格式和类型的数据,要处理的数据...
2016-04-25 15:37 回复了该问题关于此问题建议楼主考虑如下几个方面: 1 用户行为分析的范畴是比较广的,楼主分析的是哪一类用户行为?通信行为?投资行为?消费行为?, 因为针对不同行为所涉及...
2016-04-25 15:21 回复了该问题说个类比的例子,供楼主参考: 比如你想吃一道菜剁椒鱼头,可能存在如下三种情况: 1)你不知道这道菜需要什么原材料,你选择直接去饭店的...
2016-04-25 13:26 回复了该问题回答之前需要楼主明确两个小问题: 1 按你问题的理解:这里的直接数据挖掘你想表达的是什么含义?那对应的非直接或间接数据挖掘你是如何理解的。 2 数据挖掘技术的核...
2016-04-25 12:50 回复了该问题这个问题建议楼主可以这样考虑: 1 简单来说数据集市的产生要以数据仓库作为基础,建立数据仓库的目的是提供面向主题的、集成稳定的、随时间不断变化的数据集合,数据仓...
2016-03-29 23:26 回复了该问题顶二楼!小补两句: 1 楼主可以考虑参照一下之前几年的预算报告,之前预算报告对预算结果有影响的关键点的可能会对你制订预算具有参照作用,同时可以考虑使用之前预算报...
2016-03-25 01:21 回复了该问题目前支持聚类分析的工具比较多,不过在考虑具体使用什么工具之前建议楼主先考虑几个问题: 1 这里的数据准备好具体是一个什么情况? 数据是什么类型? ...
2016-03-25 00:36 回复了该问题一点小建议: 1 进行数据分析挖掘最好有一个具体的应用分析目标,在没有应用分析目标的情况下单纯为分而分很多情况下得到的结果的针对性会比较差。 2 确定一个应用分...
2016-03-21 13:27 回复了该问题楼主这个问题涉及的方面比较多,我简单说两句,供参考: 1 分类和回归本质上都是通过对已有数据的训练结果形成决策知识为预测型的应用目标服务的。 2 回归往往面对的...
2016-03-21 12:41 回复了该问题一点建议,请参考: 1 网络爬虫属于搜索引擎的技术范畴,属于搜索引擎采集数据的关键手段,是下一步根据采集内容建立摘要和索引的基础,说白点就是模拟浏览器对URL的...
2016-03-21 11:13 回复了该问题可以考虑两个选择。 1 将excel文件转换成CSV文件进行处理。 2 升级datastage的版本,新版本里有直接对excel文件进行处理的stage。
2016-03-08 11:33 回复了该问题