天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

搭建hbase的时候发现hadoop2.6.0需要重新编译本地库想问问如何操作

是有提示的那个信息吧。如果你是构建学习环境，不用理会它，是可以正常使用的，如果你是集群环境，直接编辑就可以，附带ubuntu的编译步骤： 1、安装JDK sud...

2015-09-25 13:59 回复了该问题

2

投票

大数据与传统数据仓库项目比的优势和劣势在什么地方

优势： 1.非结构化数据：在大数据的场景下，存放大量的非结构化数据，针对不同的业务场景来做分析应用 2.处理数据量更大，在大数据的数据仓库里面采用分布式来存放数...

2015-09-25 13:54 回复了该问题

1

投票

请问 SparkContext的 textfile 如何使用正确的中文编码加载内容？好像默认没有这类参数，中文好像加载进来都乱码了。。。求大神支招。。

中文乱码的问题有很多种，主要是看是哪种类型的乱码，如果是字符乱码，可以采用utf8转码的方式，如果是url请求的方式乱码，可以采用urldecode的方式来解码...

2015-09-25 13:22 回复了该问题

4

投票

我想知道一下现在什么版本的Hadoop用的最多，版本如何选择

在比较大的公司，比如BAT的公司，应该是hadoop的1.x版本比较多，原因如下： 1.比较早的接触了hadoop的版本，从hadoop 0.x不断地升级演练。...

2015-09-25 13:20 回复了该问题

1

投票

各位大神！菜鸟求助应该如何学习hadoop

具体要看业务场景，其实hive的入门学习是很容易的，只要会点SQL，就可以应用Hive的简单操作。但是如果要是深入学习的，hive的内容还是很多的比如UDF...

2015-09-25 13:15 回复了该问题

1

投票

当了一年多Linux运维，会写shell，学过点数据库，想做数据分析方面工作，有可能吗？

给你看一张，我保存很久的图片，如果你觉得5年内，你能搞定，年薪百万不成问题如果不能，安安静静的整点网络运维，CDN，路由器，SDN，网络部署，机房搭建等等。...

2015-09-25 11:21 回复了该问题

1

投票

我在写一个服务，前端要看一张在hdfs里的图片，我应该传什么数据给前端啊？传图片名称+二进制数组吗？

如果是服务的话，建议你生成一个token给客户端，然后客户端采用[url]http://127.0.0.1/image?token=11111111111111...

2015-09-25 11:14 回复了该问题

1

投票

最近使用hadoop的HDFS，作为系统的文件服务器,在多个客户端上传文件，多个客户端只能下载他自己上传的文件，但是下载不了其它客户端上传的文件，请问是什么问题？

没有遇到过这种情况啊。按道理来讲，端口是开放的，每个客户端都是可以访问的。你看一下是不是hadoop的权限问题。在hdfs-site.xml文件里面追加 [...

2015-09-25 11:09 回复了该问题

2

投票

如何在较短时间内系统地学习大数据并从事研发工作？

不知道你所说的大数据研发是哪一类的研发，如果是hadoop的研发，可以简单的说一下观点：Hadoop开发工程师(偏向技术开发）：这类工作可能要求的Java会比较...

2015-09-25 10:59 回复了该问题

0

投票

有没有知道happybase的？就是python访问hbase，我想问问能不能筛选某一列等于特定值的行并打印出来

虽然没用过happybase，但是这种方式应该可以的啊。还有问题继续留言，我给你解答[code]import happybase connection = h...

2015-09-25 10:54 回复了该问题

0

投票

请教下，大家平时做数据挖掘时，当知道一年内3-7月数据，如何根据这些月份的走势估算全年数据呢？

这个数据量有点少，只能做简单的平滑预测。用Excel就能做。如果你有过去几年，十几年的数据，那可能考虑的东西就比较多了，比如考虑季节因素，大环境影响等等。

2015-09-25 10:49 回复了该问题

4

投票

大数据一般都会用到哪些技术，最终成果物是什么？？

现在一提大数据基本上就是hadoop，而hadoop的工作又分这么几大类 1.Hadoop运维及其相关：主要是做Hadoop的集群安装，部署与维护等等。这类工作...

2015-09-25 10:46 回复了该问题

2

投票

怎样实现数据库（MySQL、Oracle）的分布式事务操作？有什么开源项目的支持吗？

简单说下MySQL。在大数据量的情况下， 1.读写分离：数据库很大的瓶颈在于I/0，所以采用读写分离，减少I/O操作 2.分库分表：根据业务ID，比如UserI...

2015-09-25 10:39 回复了该问题

1

投票

大家好，根据业务我需要在hadoop中把ip转化成实际的地址省份，现在调用的是淘宝的接口，但发现速度实在太慢了，有没有什么好的建议。

这个说实话，我也没有什么特别好的建议，有开源的IP地址库，但是更新不及时。另外跟蓝讯CDN等网络提供商也聊过，使用他们的IP地址库的服务，人民币30多万。所...

2015-09-25 09:31 回复了该问题

1

投票

hadoop有没有比较好的监控工具,我想监控到某个JOB情况，比如执行时间等等

hadoop本身就自带任务监控的。http://namenode:50070

2015-09-24 08:14 回复了该问题

牟瑞

他关注的

他的粉丝

他的回答
排序:
时间 投票