philbert

始于: 2016-02-17

辽宁省 沈阳市

发私信

542

总声望

25

次被推荐

15

粉丝

他的回答
排序:

0
投票

关于GREENPLUM 临时表问题

建议楼主使用EXECUTE来对临时表操作。

2016-05-08 14:08 回复了该问题
0
投票

GP也适合做数据仓库吗?和hive相比有什么优势?

[list] [*]如果楼主这里的GP指的是Greenplum的话那我给你的回答是非常肯定的,不过这里面有一个前置条件就是以Greenplum为基础建设的数据仓...

2016-05-06 11:34 回复了该问题
4
投票

如何针对新到来的数据聚类进行优化?

个人的一点建议供楼主参考: 首先理解下楼主的描述,楼主希望将新增的N条数据归入已经聚好的M个类中,这里面的关键前提是已有的类信息不会发生变化,只是按已有的类信...

2016-04-29 10:59 回复了该问题
0
投票

请问怎样将job运行日志保存在文件中

建议楼主明确下此处你说JOB的归属者是谁? 系统?ETL工具?

2016-04-25 17:21 回复了该问题
0
投票

用r语言做文本挖掘的聚类,发现用k平均值法聚类的效果很差,大部分被分到了一类去。有什么好的聚类算法吗?

顶二楼,顺便补充如下: 1)任何聚类算法都有其适用的数据类型范畴,就你的案例而言选择什么样的算法首先要看你会将文本数据预处理成什么格式和类型的数据,要处理的数据...

2016-04-25 15:37 回复了该问题
0
投票

对用户行为分析,进行用户画像再聚类,有哪些应用实例或者好的算法

关于此问题建议楼主考虑如下几个方面: 1 用户行为分析的范畴是比较广的,楼主分析的是哪一类用户行为?通信行为?投资行为?消费行为?,   因为针对不同行为所涉及...

2016-04-25 15:21 回复了该问题
0
投票

如何用通俗易懂的语言解释数据挖掘到底是做什么的?求大神分享

说个类比的例子,供楼主参考:        比如你想吃一道菜剁椒鱼头,可能存在如下三种情况:        1)你不知道这道菜需要什么原材料,你选择直接去饭店的...

2016-04-25 13:26 回复了该问题
0
投票

请教 :在数据挖掘的分析方法中,直接数据挖掘包括什么?

回答之前需要楼主明确两个小问题: 1 按你问题的理解:这里的直接数据挖掘你想表达的是什么含义?那对应的非直接或间接数据挖掘你是如何理解的。 2 数据挖掘技术的核...

2016-04-25 12:50 回复了该问题
0
投票

请教个问题 做数据挖掘的时候 数据放到数据集市 数据集市的建模 是不是要和 挖掘程序相关

这个问题建议楼主可以这样考虑: 1 简单来说数据集市的产生要以数据仓库作为基础,建立数据仓库的目的是提供面向主题的、集成稳定的、随时间不断变化的数据集合,数据仓...

2016-03-29 23:26 回复了该问题
1
投票

能请教各位个问题么,如果要预测未来五年的预算,用什么算法比较好 谢谢

顶二楼!小补两句: 1 楼主可以考虑参照一下之前几年的预算报告,之前预算报告对预算结果有影响的关键点的可能会对你制订预算具有参照作用,同时可以考虑使用之前预算报...

2016-03-25 01:21 回复了该问题
2
投票

请教一下,聚类分析有什么好的工具吗?数据已经准备好了,就想找个工具分析一下,求指教!

目前支持聚类分析的工具比较多,不过在考虑具体使用什么工具之前建议楼主先考虑几个问题: 1 这里的数据准备好具体是一个什么情况?    数据是什么类型?     ...

2016-03-25 00:36 回复了该问题
1
投票

进行人群的聚类分析(要把人群分类)。但是个人感觉对性别、年龄、学历等等因素聚类也不对啊,这些因素并不怎么相关。不知道这种想法是否正确,或者哪位大神有更好的人群背景分类方法

一点小建议: 1 进行数据分析挖掘最好有一个具体的应用分析目标,在没有应用分析目标的情况下单纯为分而分很多情况下得到的结果的针对性会比较差。 2 确定一个应用分...

2016-03-21 13:27 回复了该问题
1
投票

数据挖掘 分类 和 回归 是不是一回事?哪一部分 机器学习和神经网络应用的比较多? 拜求大神赐教

楼主这个问题涉及的方面比较多,我简单说两句,供参考: 1 分类和回归本质上都是通过对已有数据的训练结果形成决策知识为预测型的应用目标服务的。 2 回归往往面对的...

2016-03-21 12:41 回复了该问题
1
投票

如何用爬虫爬取航空网站?航空公司的票务信息,能够实时抓取的那种?

一点建议,请参考: 1 网络爬虫属于搜索引擎的技术范畴,属于搜索引擎采集数据的关键手段,是下一步根据采集内容建立摘要和索引的基础,说白点就是模拟浏览器对URL的...

2016-03-21 11:13 回复了该问题
0
投票

datastage 如何抽取excel 数据

可以考虑两个选择。 1 将excel文件转换成CSV文件进行处理。 2 升级datastage的版本,新版本里有直接对excel文件进行处理的stage。

2016-03-08 11:33 回复了该问题

改版

反馈