天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

java.lang.ClassNotFoundException: kafka.serializer.StringDecoder对应的jar包是存在类的，但是找不到类，这是为什么？

NoClassDefFoundError: kafka/serializer/StringDecoder的原因是缺少以下jar包： spark-streamin...

2017-04-26 13:34 回复了该问题

0

投票

hadoop启动jar 报地址错误怎么解决？

设置下这个linux机器的hostname=hadoop

2017-04-19 13:35 回复了该问题

0

投票

大数据Hadoop开发需要哪些数学基础知识？

你是做程序开发，还是想做算法模型？ hadoop本身是可以用各种语言编写程序进行批处理运行，所以只需要编程基础，例如python java 如果是想用rha...

2017-04-07 15:40 回复了该问题

0

投票

现阶段，请问一下 hadoop和spark分别用什么版本合适呢？

一般建议使用cloudera公司的产品，目前是5.* 这些是企业版本，修复了很多bug，所以使用起来更加方便下载地址：[url]http://archiv...

2017-03-30 14:00 回复了该问题

0

投票

做大数据大家比较关心哪个方面？优先保证hadoop整个集群的正常运转？快速开发map/reduce？保证数据分析的速度？保证数据分析的准确性？

1.能不能达到领导的目标和期望 2.从技术、人力等方面的投入产出是否符合现状 3.整套体系运行起来后的维护人力、时间方面是否是可承受范围 4.对现有的运营效率是...

2017-03-30 13:55 回复了该问题

0

投票

大数据实时解决方案

1.在数据源方面则尽量去实时收集。可以让他们主动向你的消息队列中写入数据，也可以部署flume去主动收集他们的日志数据。 2.数据进入到消息队列以后，用flum...

2017-03-28 15:53 回复了该问题

0

投票

主流的数据分析语言

常用的算法包都是齐全的现有的大数据技术都具有python的运行环境，例如hadoop，spark等

2017-03-28 14:18 回复了该问题

0

投票

请教下SSRS能否实现车企中比较简单的BI

做好SSAS，多维数据模型中的维度和度量值组 SSRS也是可以做到类似的呈现效果

2017-03-28 14:17 回复了该问题

0

投票

各位大神，麻烦问下，用shell调hive脚本的时候，select * from test中的* 怎么处理的

hive -e 'SELECT * from test_table'

2017-03-14 13:32 回复了该问题

0

投票

大批量往hbase写数据会导致RegionServer 挂掉。请问怎么优化？求帮助。

增加wal的缓存大小增大hbase-site.xml中写入的内存占比

2017-03-14 13:31 回复了该问题

1

投票

hive的启动问题。

检查${HIVE_HOME}/conf/hive-site.xml中的以下四个属性对应的值： <name>javax.jdo.option.Conn...

2017-03-14 13:29 回复了该问题

0

投票

国内大多互联网公司的大数据工程师实习都是需要大数据项目经验，怎么样在自己研究方向不是数据科学和ml相关的情况下接触到hadoop，spark相关项目呢？

多学习，cloudera公司的官网上就有包含所有大数据技术的虚拟机，供学习使用。多逛大数据的问答社区主动参与到其他的项目，哪怕是打杂都是可以的。学习这些项目...

2017-03-14 13:24 回复了该问题

0

投票

数据仓库从MySQL向大数据平台迁移的方案

数据仓库建议选择使用hive，用hql语句也能完成update delete的操作。如果仓库是在hive上，那原来的ETL操作都改为使用hql脚本吧。这个查...

2017-03-14 13:22 回复了该问题

0

投票

有人能大概的解释下类似于hadoop spark这些东西预编译和源码安装的区别主要是在哪

源代码安装方式是需要你主动编译项目，大部分都是maven 进行编译，在这个过程中需要下载很多相关的jar包，很耗费时间。而且在编译过程中还需要check本机的系...

2017-03-14 13:20 回复了该问题

0

投票

请问下，在SSIS中的数据流任务中的数据源用存储过程返回一个select结果集和用视图返回一个select结果集有区别吗？

只是不是特别复杂的逻辑，那用视图和存储过程是基本一致的。如果复杂度高，那么用视图进行查询会稍微慢些在你的这个场景中，建议你用视图来处理吧。

2017-03-14 13:15 回复了该问题

Bob

他关注的

他的粉丝

他的回答
排序:
时间 投票