Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

0

粉丝

他的回答
排序:

1
投票

大数据时代,小型企业的优势是什么?

小企业: 船小好调头 根据外界反应能快速调整 能在现有的大数据技术之上提供更加精细化的服务,例如现在的云计算业务不错的帮助手段。

2015-11-30 13:28 回复了该问题
3
投票

A. Hadoop + Hive B. GreenPlum + PostGreSQL 大数据存储,这两个方案各有什么特点啊

 A. Hadoop + Hive  支持新增节点,过程中不需要重启 支持jdbc访问hive数据库 支持sql的方式获取数据 在技术过程中,数据是以批量的方式...

2015-11-30 13:25 回复了该问题
0
投票

旅游行业的市场需求分析怎么做?一般从哪些方面入手,大家帮忙分析下,谢谢

遇见同行了啊。 这样的问题太宽,不好回答啊

2015-11-27 12:12 回复了该问题
1
投票

spark里有什么工具可以通过监控mysql日志变化,来获取数据么???

建议是用flume 的agent来监控mysql的日志。 flume接收数据后可直接写到hdfs或kafka消息队列 然后使用spark从hdfs或kafka队...

2015-11-27 12:09 回复了该问题
0
投票

大神,数据挖掘分这三个方向吗:数据仓库(ETL)、建模(机器学习)、数据分析(统计学)?我之前是做程序开发的,想转数据挖掘,将来希望从事偏编程方面的数据挖掘,该从哪学起,有培训班吗?

ETL只是数据抽取的一个技术方案。 数据挖掘还是需要些分析、统计学、算法方面的技术基础。 如果是想学,建议了解下matlab、weka、R语言等。 这些都是在工...

2015-11-27 12:08 回复了该问题
1
投票

用R学习机器学习,理解算法后,是应该用package还是自己写?

如果你的数据样本不大,可以直接使用R语言包。 如果是海量数据,那就有些吃力了。能在大数据运算的有RHadoop,mahout,spark-MLlib等。 RHa...

2015-11-27 12:05 回复了该问题
0
投票

tableau采购价格大概在多少?预计需要tableau server以及五十以内的用户?

这个你可以直接咨询国内的一些代理厂家,类似元鼎科技,安信之类的。

2015-11-25 13:22 回复了该问题
1
投票

有人遇到这个问题吗,启动hiveserver2的时候报错FATAL conf.Configuration: bad conf file: top-level element not <configuration>, hive和hadoop的配置文件找了一遍没找到问题 再说hive和hadoop都能正常启动

这是一个配置文件错误问题.仔细检查你的xml配置文件。 错误出自源代码: if (!"configuration".equals(root....

2015-11-25 13:16 回复了该问题
2
投票

应该怎么去设计一个推荐系统,需要考虑哪些因素?

从以下几个方面来考虑:1.系统的并发问题 如果并发过高,则需要前端架设负载均衡。 编程语言推荐用java,因为并发量大,请求量也大,就势必会用到大数据的相关组件...

2015-11-25 13:14 回复了该问题
0
投票

想问一下,一般10个节点的Hadoop爬虫集群,一般配置什么性能的路由器哇?有建议的型号不?

你得看看这10个节点每天的数据吞吐能力。 购买思科产品吧 Cisco3750 cisco3560

2015-11-24 13:45 回复了该问题
2
投票

可以使用交换机的组播技术优化 hadoop 数据传输吗?

Hadoop集群的数据传输不能简单地理解是加快速度。 集群里面的数据在内部是数据块 你上传的一个文件,有可能会被分割为好几个数据块。   组播技术在Hadoop...

2015-11-24 13:40 回复了该问题
1
投票

求教对Hbase的scan方法的理解?

scan方法是有好几种场景的: 1.如果只是根据rowkey进行查询,速度是最高的。当然rowkey查询也支持几个模式:单个或多个rowkey固定查找,rowk...

2015-11-24 13:35 回复了该问题
2
投票

请问数据管理方面用什么配合? 如何把海量excel结构化数据文件导入到hadoop里面去

excel到Hadoop: 1.将excel转存为csv,然后上传到Hadoop中。如果多个excel,可以用程序进行批处理转换 2.利用Hadoop的mapr...

2015-11-20 13:30 回复了该问题
2
投票

谈谈你对Hive on Spark的理解?

hive.execution.engine=spark 表示将hive的引擎设置为spark。 在hiveContext.sql()也是利用spark引擎来完成...

2015-11-18 17:40 回复了该问题
1
投票

hbase存储图片存在哪里呢?

如果只是存储图片,那建议使用图形数据库 Neo4j 来处理。这个处理会有优势些

2015-11-18 17:30 回复了该问题

改版

反馈