kettle只是一个工具!来方便做ETL操作! 至于你说的问题,用Kettle也是可以实现的,先在源库里面看看哪些数据被修改了,然后再目标库里面做相应修改就行了...
2015-10-01 21:54 回复了该问题这个主要是看namenode节点上的$HADOOP_HOME下的etc/hadoop下的slaves文件。 看看是不是配置了其他的slave的节点。
2015-10-01 21:51 回复了该问题[code]<dependency> <groupId>org.apache.phoenix</groupId> <...
2015-09-28 13:30 回复了该问题确认下sql server2012是不是也是enterprise manager 另外,可以考虑SQL 备份,然后再导入的方式可以避免这种错误。
2015-09-28 13:02 回复了该问题提供其中一种思路(使用关联分析法): 设这四种路径的情况为四个集合: set1: {A,B,C,D} set2: {B,C,E} set3: {A,D,B,C...
2015-09-28 10:37 回复了该问题难度这个问题,比较难回答,会者不难。简单的说一下可能涉及到的东西。 1.linux :基于开源的东西,就不要想windows了,老老实实用linux,即使出了问...
2015-09-28 09:19 回复了该问题如果SQL功底好的话,又想入门,可以尝试下Hive的相关工作,比如Hive开发工程师,Hive分析师,大数据报表工程师。 hive的基础就是SQL,当然面向个性...
2015-09-28 09:06 回复了该问题个人建议:如果你会SQL,可以先从Hive入手。如果你会点开发,可以从Python,R入手。 另外,算法,统计知识什么的也是不可缺少的。 建议书籍: 《深入浅出...
2015-09-25 14:34 回复了该问题如果真有那么大的数据量的,可以换一种思路,所谓的大数据,包括map/reduce的思想,其实就是“分而治之”,比如你把100000万亿的数据分成1万份,然后根据...
2015-09-25 14:28 回复了该问题如果你是安装apache hadoop,直接删除就可以了,如果你是采用的cloudra的hadoop版本,需要使用cloudra的卸载。 另外,记得删除$HAD...
2015-09-25 14:17 回复了该问题默认就在它的logs目录下: [attach]6219[/attach]
2015-09-25 14:13 回复了该问题这个还是要看个人的喜欢: 1.报表工程师:利用HQL来生成各种各样的报表 2.大数据产品工程师:利用大数据来做一些产品。 3.ETL工程师:利用HQL来做ETL...
2015-09-25 14:07 回复了该问题