小企业: 船小好调头 根据外界反应能快速调整 能在现有的大数据技术之上提供更加精细化的服务,例如现在的云计算业务不错的帮助手段。
2015-11-30 13:28 回复了该问题A. Hadoop + Hive 支持新增节点,过程中不需要重启 支持jdbc访问hive数据库 支持sql的方式获取数据 在技术过程中,数据是以批量的方式...
2015-11-30 13:25 回复了该问题建议是用flume 的agent来监控mysql的日志。 flume接收数据后可直接写到hdfs或kafka消息队列 然后使用spark从hdfs或kafka队...
2015-11-27 12:09 回复了该问题ETL只是数据抽取的一个技术方案。 数据挖掘还是需要些分析、统计学、算法方面的技术基础。 如果是想学,建议了解下matlab、weka、R语言等。 这些都是在工...
2015-11-27 12:08 回复了该问题如果你的数据样本不大,可以直接使用R语言包。 如果是海量数据,那就有些吃力了。能在大数据运算的有RHadoop,mahout,spark-MLlib等。 RHa...
2015-11-27 12:05 回复了该问题这个你可以直接咨询国内的一些代理厂家,类似元鼎科技,安信之类的。
2015-11-25 13:22 回复了该问题这是一个配置文件错误问题.仔细检查你的xml配置文件。 错误出自源代码: if (!"configuration".equals(root....
2015-11-25 13:16 回复了该问题从以下几个方面来考虑:1.系统的并发问题 如果并发过高,则需要前端架设负载均衡。 编程语言推荐用java,因为并发量大,请求量也大,就势必会用到大数据的相关组件...
2015-11-25 13:14 回复了该问题你得看看这10个节点每天的数据吞吐能力。 购买思科产品吧 Cisco3750 cisco3560
2015-11-24 13:45 回复了该问题Hadoop集群的数据传输不能简单地理解是加快速度。 集群里面的数据在内部是数据块 你上传的一个文件,有可能会被分割为好几个数据块。 组播技术在Hadoop...
2015-11-24 13:40 回复了该问题scan方法是有好几种场景的: 1.如果只是根据rowkey进行查询,速度是最高的。当然rowkey查询也支持几个模式:单个或多个rowkey固定查找,rowk...
2015-11-24 13:35 回复了该问题excel到Hadoop: 1.将excel转存为csv,然后上传到Hadoop中。如果多个excel,可以用程序进行批处理转换 2.利用Hadoop的mapr...
2015-11-20 13:30 回复了该问题hive.execution.engine=spark 表示将hive的引擎设置为spark。 在hiveContext.sql()也是利用spark引擎来完成...
2015-11-18 17:40 回复了该问题