天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

spark怎样读取本地文件?

示例代码： sc.textFile("file:///path to the file/")

2016-05-12 13:32 回复了该问题

0

投票

spark streaming如何将结果写到指定目录下的txt文本吗

示例： spark.repartition(1).saveAsTextFile("out.txt")

2016-05-12 13:30 回复了该问题

0

投票

SSAS 处理失败，高级关系引擎中存在错误。无法根据数据源视图中的关系访问联接操作所要求的“test”表，怎么解决

这个应该是数据库访问的权限问题

2016-05-12 13:27 回复了该问题

0

投票

关于如何部署cube问题

线上的SSAS是可以配置http方式访问的这样就可以使用[url=http://ip]类似http://localhost:8088/msmdpump.dll...

2016-05-12 09:37 回复了该问题

0

投票

怎样提高mysql的import速度？

1.借助第三方 maatkit - parallel restore maatkit - parallel dump [url]https://www.pe...

2016-05-12 09:29 回复了该问题

1

投票

对于聚合的key，在reduce阶段事怎样排序的呢？

从map到reduce中间经历copy，sort，merge几个环节。其中sort阶段是发生在 buffer阶段。从map结果的partition中读取...

2016-05-12 09:20 回复了该问题

0

投票

hive用tez, spark引擎吗?对比过mr的执行结果吗?

小编的问题啊！ TEZ是分布式DAG的运行框架，能无缝运行MR程序，并能减少MR的中间产物，加速MR的运行。通过数据流API，开发者可以非常灵活运用。hive ...

2016-05-06 23:49 回复了该问题

0

投票

请问一下kafka的开发工程一般都是怎么建的呢

1.你要先在服务器上部署kafka单节点或者部署分布式的kafka集群。其中分布式的kafka集群是需要zookeeper的环境在本地建立java程序...

2016-05-06 09:26 回复了该问题

1

投票

关于今晚胡老师分享的话题，有一些疑问

1.其实是可以将cube和大表同时建立。例如你可以选择使用kylin来完成cube的建设，同时在hive上保留一个大表。kylin本身也是读取hive的仓库表结...

2016-05-04 16:35 回复了该问题

1

投票

问个问题啊，hadoop可以做批量处理吗，就是先将数据使用hive进行处理，后将结果导入到数据库，这样的过程会丢失数据吗

hadoop中的MapReduce就是批处理机制使用hive来完成数据的处理，是方便开发者使用类sql的方式来处理数据，在这个过程中，只要不对原始数据进行条件...

2016-05-03 17:29 回复了该问题

0

投票

spark java里怎么把生成的sparse vector 加到dataframe作为新的一列？谁知道的啊。。

参考： http://stackoverflow.com/questions/36803207/size-of-the-sparse-vector-in-the...

2016-05-03 17:26 回复了该问题

0

投票

大数据架构层是否已经成熟，国外目前都是Hadoop架构，国内我之前接触的像宝洁，华为等也已经做好了，其他私企，国企的情况怎么样？

一般有点规模的互联网企业都选择围绕hadoop来自建数据平台，例如点评、美团、小米等小点的大数据创业公司也会选择使用这类的开源技术国企内部的则会区分：移动通...

2016-05-03 17:20 回复了该问题

0

投票

你们有接入过redis的数据到hive么？有什么现成的工具或是datax的插件么？

我们在这个方面是自己去写java代码来完成redis的数据消费

2016-05-03 16:00 回复了该问题

1

投票

hadoop升级怎么做？谁有笔记或者资料？

重要，做任何一个升级的时候都要记得备份核心数据两种方式： 1.hadoop自带的升级命令 2.搭建一个新版本的hadoop集群，然后把数据分优先级逐步拷贝过去

2016-05-03 15:51 回复了该问题

1

投票

HIVE为什么不直接在HDFS上呢？在HBASE上和在HDFS上，有什么区别？

二者差异不大。因为hbase的数据也是存放在hdfs上。hive的核心是做了一个sql解析引擎。让擅长sql编程的人员能操作hdfs文件。一般情况下是使用ha...

2016-04-26 13:03 回复了该问题

Bob

他关注的

他的粉丝

他的回答
排序:
时间 投票