天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

请问，hive上给用户授权创建数据库的命令是什么呢？

设置集群的参数： hive.security.authorization.enabled=true hive.security.authorization.cr...

2016-07-07 17:15 回复了该问题

0

投票

hbase数据库每天都会录入很多数据，我现在停止录入数据了，怎么查看我最后录入的一条数据，有知道的大神指导一下，我的Hbase 版本是0.94.14

在0.94/0.96等版本中这个确实不是很好处理，你根据rowkey扫描来做吧。设置Startkey，endkey()来达到获取最后一条的效果。如果是在0...

2016-07-06 19:20 回复了该问题

0

投票

问下hdfs用户的默认密码是多少？我装cdh的时候没设置密码啊

试试你安装时登录Linux的用户和密码

2016-07-06 19:04 回复了该问题

0

投票

SSIS外部源首行记录为空导入到数据库表中失败

SSIS在读取excel文件时会根据首行来判断数据类型及长度。尝试进行如下做法：在excel源上右键—属性，编辑excel的链接字符串：在原有的链接字符...

2016-07-06 19:03 回复了该问题

0

投票

怎么可以把map的键值对当中的字符串转换为整数类型{"15001764382":"2","15317001287":"3"}？？？？？

改下map端输出的值类型,例如改为IntWritable 然后在map函数中对value值进行转换，然后context.writer()输出

2016-07-06 08:40 回复了该问题

1

投票

问大神们一个问题，怎么将Spark SQL查询的结果保存为txt文件？比如val sqldata=hiveContext.sql("select * ......")

使用rdd中的方法： saveAsTextFile("文件")

2016-07-05 13:05 回复了该问题

0

投票

运行greenplum 的 gpcheckos时报错 platform.memory mistach (value 8167837696 should == 8134156288)。该怎么修改呀？

可能是你的shared_buffers 设置过大造成的。

2016-07-05 12:56 回复了该问题

0

投票

pg_xlog 目录里保存的二进制log文件数数量是wal_keep_segments参数决定的么？我设置 wal_keep_segments ＝ 256，但是实际却有322个，求解

wal_keep_segments是只日志文件的最小量。此配置的详细说明可参看： [url]http://www.runoob.com/manual/Post...

2016-07-05 12:54 回复了该问题

1

投票

请教个问题，大数据分析是怎么把传统RDBMS中的数据导到hadoop的，写代码实时获取数据？还是直接导库？

使用sqoop直接导库的数据到hadoop吧然后可以使用hive写sql进行查询

2016-07-05 12:38 回复了该问题

1

投票

大数据商业化是否分历程，国内市场大数据商业化目前在什么阶段，其应用场景集中在什么地方。大数据未来发展趋势，商业成熟会在什么时间发生，以及到时的市场规模？

个人观点：国内大数据商业起步在2014年就开始了，2015年是很多大数据公司获得融资的时间窗口目前的应用场景主要是：帮助企业构建一体化的大数据平台，包含分析...

2016-07-01 08:43 回复了该问题

0

投票

请教～mongo能直接读取hive的数据吗？

能的。给你一个官网的示例： https://www.mongodb.com/blog/post/using-mongodb-hadoop-spark-part...

2016-07-01 08:38 回复了该问题

0

投票

请教个问题，比如我在本机WINDOWS下安装ECLIPSE ，而NN和DN在另外2台LINUX服务器上面，我能在本机的ECLIPSE上直接运行WORDCOUNT程序么？不打包，还是说eclipse必须安在linux上面才能直接运行？

如果想不打包就运行java程序，则需要在eclipse中配置hadoop的插件。建议你在Linux环境中开发hadoop的MR程序

2016-07-01 08:36 回复了该问题

0

投票

spark部署选型问题

我们在实际使用过程中使用yarn来进行spark的任务调度。参考:https://spark.apache.org/docs/1.6.0/running-...

2016-06-28 13:41 回复了该问题

1

投票

如果以后从事的方向是ETL，那么需要我应着重从哪个方面开始学习，希望大神能指点一个大致学习方向，谢谢。ps：我现在所从事的工作是系统运维，日常工作用得的有linux基础，shell脚本编写，mysql基本语句命令

从你最擅长的方式入手：努力学习sql编程，包括调优、各种函数使用等，这会极大地提升你做数据处理时的效率其次了解下数据处理的工具，例如kettle，datas...

2016-06-28 13:19 回复了该问题

0

投票

问下有人做过网站或者app或者游戏的用户分析吗？比如拉新数量，留存数量这类的

从你这个问题上，没看出是想问什么？是想学点这个方面经验，还是想认识些人呢？做移动互联网都会关注这几个指标：UV、拉新、注册转化率、留存等这些数据指标都是运营...

2016-06-28 13:14 回复了该问题

Bob

他关注的

他的粉丝

他的回答
排序:
时间 投票