天善智能-商业智能和大数据在线社区，用心创造价值

1

投票

大数据时代，小型企业的优势是什么？

小企业：船小好调头根据外界反应能快速调整能在现有的大数据技术之上提供更加精细化的服务，例如现在的云计算业务不错的帮助手段。

2015-11-30 13:28 回复了该问题

3

投票

A. Hadoop + Hive B. GreenPlum + PostGreSQL 大数据存储，这两个方案各有什么特点啊

A. Hadoop + Hive 支持新增节点，过程中不需要重启支持jdbc访问hive数据库支持sql的方式获取数据在技术过程中，数据是以批量的方式...

2015-11-30 13:25 回复了该问题

0

投票

旅游行业的市场需求分析怎么做？一般从哪些方面入手，大家帮忙分析下，谢谢

遇见同行了啊。这样的问题太宽，不好回答啊

2015-11-27 12:12 回复了该问题

1

投票

spark里有什么工具可以通过监控mysql日志变化，来获取数据么？？？

建议是用flume 的agent来监控mysql的日志。 flume接收数据后可直接写到hdfs或kafka消息队列然后使用spark从hdfs或kafka队...

2015-11-27 12:09 回复了该问题

0

投票

大神，数据挖掘分这三个方向吗:数据仓库（ETL）、建模（机器学习）、数据分析（统计学）？我之前是做程序开发的，想转数据挖掘，将来希望从事偏编程方面的数据挖掘，该从哪学起，有培训班吗？

ETL只是数据抽取的一个技术方案。数据挖掘还是需要些分析、统计学、算法方面的技术基础。如果是想学，建议了解下matlab、weka、R语言等。这些都是在工...

2015-11-27 12:08 回复了该问题

1

投票

用R学习机器学习，理解算法后，是应该用package还是自己写？

如果你的数据样本不大，可以直接使用R语言包。如果是海量数据，那就有些吃力了。能在大数据运算的有RHadoop，mahout，spark-MLlib等。 RHa...

2015-11-27 12:05 回复了该问题

0

投票

tableau采购价格大概在多少？预计需要tableau server以及五十以内的用户？

这个你可以直接咨询国内的一些代理厂家，类似元鼎科技，安信之类的。

2015-11-25 13:22 回复了该问题

1

投票

有人遇到这个问题吗，启动hiveserver2的时候报错FATAL conf.Configuration: bad conf file: top-level element not <configuration>, hive和hadoop的配置文件找了一遍没找到问题再说hive和hadoop都能正常启动

这是一个配置文件错误问题.仔细检查你的xml配置文件。错误出自源代码： if (!"configuration".equals(root....

2015-11-25 13:16 回复了该问题

2

投票

应该怎么去设计一个推荐系统，需要考虑哪些因素？

从以下几个方面来考虑：1.系统的并发问题如果并发过高，则需要前端架设负载均衡。编程语言推荐用java，因为并发量大，请求量也大，就势必会用到大数据的相关组件...

2015-11-25 13:14 回复了该问题

0

投票

想问一下，一般10个节点的Hadoop爬虫集群，一般配置什么性能的路由器哇？有建议的型号不？

你得看看这10个节点每天的数据吞吐能力。购买思科产品吧 Cisco3750 cisco3560

2015-11-24 13:45 回复了该问题

2

投票

可以使用交换机的组播技术优化 hadoop 数据传输吗？

Hadoop集群的数据传输不能简单地理解是加快速度。集群里面的数据在内部是数据块你上传的一个文件，有可能会被分割为好几个数据块。组播技术在Hadoop...

2015-11-24 13:40 回复了该问题

1

投票

求教对Hbase的scan方法的理解？

scan方法是有好几种场景的： 1.如果只是根据rowkey进行查询，速度是最高的。当然rowkey查询也支持几个模式：单个或多个rowkey固定查找，rowk...

2015-11-24 13:35 回复了该问题

2

投票

请问数据管理方面用什么配合？如何把海量excel结构化数据文件导入到hadoop里面去

excel到Hadoop： 1.将excel转存为csv，然后上传到Hadoop中。如果多个excel，可以用程序进行批处理转换 2.利用Hadoop的mapr...

2015-11-20 13:30 回复了该问题

2

投票

谈谈你对Hive on Spark的理解？

hive.execution.engine=spark 表示将hive的引擎设置为spark。在hiveContext.sql()也是利用spark引擎来完成...

2015-11-18 17:40 回复了该问题

1

投票

hbase存储图片存在哪里呢？

如果只是存储图片，那建议使用图形数据库 Neo4j 来处理。这个处理会有优势些

2015-11-18 17:30 回复了该问题

Bob

他关注的

他的粉丝

他的回答
排序:
时间 投票