重新绑定一下talbe,可能是关联问题,你看看是不是因为你的kettle之前绑定了一个表名,后来这个表被你删掉了。或者没有权限?
2015-09-24 08:13 回复了该问题实战中的多少页?不应该啊。除非他重写了实现的处理。
2015-09-24 08:12 回复了该问题其实mongodb非常简单,数据结构其实就是一个BsonDocument,你可以理解为Json。再理解,其实就是一个字典。熟悉一下Json格式就可以了,我一会在...
2015-09-24 08:03 回复了该问题kettle的etl包就是一个文件,你可以直接在服务器上使用kettle的shell命令来执行 [attach]6136[/attach] [att...
2015-09-24 08:00 回复了该问题不管你是什么环境,如果想学习hadoop,推荐是使用docker,轻松构建各种环境,而且系统资源消耗极少,在我的课程里面是有介绍的 [url]http://ww...
2015-09-23 09:22 回复了该问题hadoop只是一个分布式文件系统,虽然是有map/reduce来做计算,但是处理的数据量是海量的,每执行一次数据处理,都要很长时间,因此它不适合来做可视化的数...
2015-09-23 08:09 回复了该问题其实你已经决定好了,只是想找个人确认一下。 个人建议还是贴合业务。技术变更太快,而且是开源技术,hadoop没出来几年,现在又开始搞spark。做技术就是比较辛...
2015-09-23 08:05 回复了该问题不好意思,这个目前我这没有。我这边现在只是应用了实时计算。数据分析这块没有,你可以关注下SparkR,里面应该有你想要的答案
2015-09-22 17:36 回复了该问题在天善的资料下载里面有相关的电子书: 链接地址如下:[url]http://www.flybi.net/article/506[/url] 有空的时候可以多来天...
2015-09-22 17:35 回复了该问题由于hadoop是拿Java来实现的,所以可以使用JPS命令来查看hadoop的服务器进程,如下图所示 [attach]6076[/attach] 在一...
2015-09-22 17:33 回复了该问题实际上这就是一个ETL的过程,最终拿到自己想要的数据格式。 处理数据不要局限于工具,开发语言,重点是数据本身。 工具类的你可以采用ETL工具,SSIS,kett...
2015-09-22 17:29 回复了该问题没听过日志汇聚的概念,不好意思,可以进一步跟我交流。看场景应该是与日志有关。 在大数据的场景下,我们一般分析都采用日志分析,比如用户行为分析,用户来源分析等等,...
2015-09-22 17:26 回复了该问题一般情况下,ETL在同步数据的时候,是一次性把数据加载到内存,然后插入到数据库中,这种效率极低。建议采用ETL导出txt文件,然后将txt上传到阿里云上,然后通...
2015-09-22 17:18 回复了该问题简单来说,Hadoop是一种分布式存储和计算技术,其依赖于底层的分布式文件系统来存储数据和MapReduce框架来实现分布式计算。 NoSQL 是一套分布式...
2015-09-22 08:14 回复了该问题