天善智能-商业智能和大数据在线社区，用心创造价值

1

投票

问下大神,怎么在hive里面计算两个日期的月份差

months_between()等函数，还有其他的实现方式，例如get到两个日期的月份，做减法。。。具体的参考一下Hive手册中的Date Function ...

2016-08-27 11:00 回复了该问题

0

投票

有谁知道spark是否可以直接从eclipse下的程序直接提交到linux上部署的yarn集群执行吗

目测需要打包上传。。。

2016-08-27 10:58 回复了该问题

0

投票

请教个问题，想问下大家大数据目前在哪些方向用得比较好？产生的价值比较大

以互联网为例的电商、社交、游戏、广告、推荐都用的比较多比较好。目测除了某些传统行业还没有完全把数据价值发挥出来，其他行业都用上了吧。有些传统行业由于数据太小不...

2016-08-27 10:57 回复了该问题

0

投票

一个服务器就是一个节点吗那节点到底是什么啊一个节点就是一个Master或者worker吗

可以说一个服务器就是一个节点。比如在当前比较流行的M-S（Master-Slave）架构下，以Hadoop和Spark为例，我们说一个主节点（Master节点...

2016-08-27 10:54 回复了该问题

0

投票

hive 大表join小表，结果大于小表的总数量是怎么回事？有谁知道吗？

还要看你用的什么join方式，跟Seng总说的数据字段是否重复也有关系。

2016-08-27 10:50 回复了该问题

0

投票

求推荐一本全面点的基础统计学教材，谢谢大家

推荐《统计学》原书第5版 William Mendenhall、Terry Sincich著。

2016-08-27 10:49 回复了该问题

0

投票

大神，请教一下，namenode主备数据不一样了，怎么处理

重新做主备

2016-08-24 22:10 回复了该问题

0

投票

各位大神，小白想问一个问题，访问hbase的话如果屏蔽语言之间的差别的用什么方式比较好？

想通过不同的语言去访问HBase？Hadoop提供的Streaming的那集中语言方式不知道是否可行。

2016-08-24 22:08 回复了该问题

0

投票

hadoop 这个错误怎么解决啊

在yarn-site.xml的设置中，有一个minimum-allocation的设置，错误提示是Server3这个机器不满足这个设置，如果你没有设置，那就是s...

2016-08-24 22:06 回复了该问题

1

投票

spark平台直接搭建比较好还是在Hadoop基础上比较好

看用途，如果只是为了实验，可以直接做Spark，文件采用本地读写就行。但如果有Spark on Yarn等需要做，或者数据需要存储在HDFS，就需要在Hado...

2016-08-24 21:54 回复了该问题

0

投票

各位大神请问一下有没有人知道hbase是否可以删除特定时间戳的数据

操作方法：Delete(byte[] row, long timestamp) 如果没有进一步的操作，使用该构造函数将删除行键指定的行中，所有列族中所有列的时间...

2016-08-22 00:48 回复了该问题

0

投票

请问一下，Hadoop架构中有没有开发测试环境？还是说开发测试是直接在生产系统中做的呢？

一般在企业会存在两个以上的环境，除了生产系统之外，还会有专门用于测试的环境，这些集群环境一般都是在操作系统、组件版本上都严格保持一致。

2016-08-22 00:42 回复了该问题

0

投票

请教下各位高人，如何获取在线旅游网站的一些数据（比如查询数据或交易数据等）？可以买得到吗？

一般交易数据肯定是获取不到的，这是关乎在线旅游网站的运营状况的。其他的信息基本靠爬虫，或者看是否有渠道购买数据。

2016-08-18 19:45 回复了该问题

0

投票

请教个Hadoop2.7的问题，我原来跑了个单机的，现在要扩展成分布式的，怎么把原来单机的格式化掉？

楼上说的改配置存放目录时对的，还要注意的是，在变成分布式集群格式化HDFS之前，需要删除之前单机Hadoop的namenode信息，这个信息在单机Hadoop时...

2016-08-18 19:43 回复了该问题

0

投票

这是什么问题

没有设置JAVA_HOME环境变量，就是JDK的安装目录，把它添加到/etc/profile中，然后执行source /etc/profile使其全局生效就可以...

2016-08-18 19:41 回复了该问题

MarsJ

他关注的

他的粉丝

他的回答
排序:
时间 投票