牟瑞

大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我!

始于: 2013-06-09

发私信

1967

总声望

308

次被推荐

16

粉丝

他的回答
排序:

1
投票

问个技术问题,hive和Hbase什么版本可以结合,我用最新版的hiVe建表出错

看一下官方文档:[url]https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration[/...

2015-11-30 15:56 回复了该问题
0
投票

请问,每天产生10G的数据分析算大数据吗?

一般程度上所说的大数据是TB/PB以上,但是你的这种应用场景,你的这种应用场景在传统的数据库或者数据存储上也是可以处理的,但是随时数据的不断收集、增长,需要关注...

2015-11-30 15:47 回复了该问题
0
投票

各位大师 有没有做过验证码识别的 我想吧验证码 按像素直接输入到神经网络 不加任何处理 然后 输出就是验证码位数的一个数组 这样行吗? 大师们

当然不行啊。图像识别一个很大的问题,是去噪!机器学习只是解决了概率的问题,样本的去噪效果不好,概率就很低的。所以,先对识别码进行各种去噪,然后才能机器学习。

2015-11-30 09:58 回复了该问题
0
投票

小型传统企业如何实现数据的绝对安全?

都公网隔离了还不安全么?mongodb是集群么?定期备份,尽量保证数据不丢失。

2015-11-27 16:31 回复了该问题
0
投票

kettle 在Linux下用crontab定时调度job时为什么生成的日志表为空,手动执行不为空

/project/log_analysis/pdi/pan.sh -file=/project/log_analysis/kettle_files/201506...

2015-11-27 13:34 回复了该问题
0
投票

请问 Kettle 中如何做批量 zip 解压

调用shell控件,写个脚本

2015-11-26 11:24 回复了该问题
0
投票

使用kettle把excel文件导入到数据库时,怎么自动建立一张目标表

如果一定要用kettle解决的话,写个shell,自动解析excel,然后创建目标表。或者重写kettle的控件。

2015-11-26 07:57 回复了该问题
0
投票

众筹产品的商业价值是什么?

拿别人的钱,办自己的事情,赔了大家的,赚了自己的。

2015-11-26 07:56 回复了该问题
0
投票

请教大家一个问题 ,电商后台 一种商品的定价有三个条件 这个怎么在后台能更好的表现出来 例如: 衣服 条件有 颜色 型号 款式 谢谢了

这是问定价原则?还是后台存储?如果是定价原则,那肯定是多方面的。 如果是后台存储,存储这类数据nosql的列示数据库可能效果会比较好。mongodb,hbase...

2015-11-26 07:54 回复了该问题
0
投票

数据仓库的的备份机制是如何制定的呢?

可以采用增量备份的方式,每天或者每周备份一次。 数据量如果非常大,可以考虑应用Hadoop。将数据存储在HDFS上,使用Hive做数据仓库。 hadoop的优点...

2015-11-26 07:50 回复了该问题
0
投票

BigSql 怎么建立存储过程?

我想问下。这个是什么工具啊?

2015-11-26 07:45 回复了该问题
1
投票

求大神解答,远程执行HIVE操作的问题

启动Hive远程服务接口: bin/hive --service hiveserver 然后通过B机器远程调用就可以了。在hive的lib下,有python的扩...

2015-11-26 07:44 回复了该问题
0
投票

请教个storm的问题,storm的spout可以设置并行度,如果设置为2,那么我就有两个执行器执行spout,如果我的spout是在消息队列里获取消息进行处理,那么这两个执行器的spout是否是并发?

用的是什么消息队列服务器?这个要看部署策略,并发读取也会有先后,一个spout拿到10个消息,另外一个spout拿另外10个消息。一般情况是拿到一个消息,扔到b...

2015-11-25 09:05 回复了该问题
0
投票

哪位大神能解释下 为什么我start-dfs.sh 就zkfc起不来 别的 namenode,datanode,journalnode 全部都起来了

上传点日志什么的,不然没有办法定位问题

2015-11-25 08:58 回复了该问题
1
投票

在windows下有没有类似Handoop的分布式计算的框架软件?

一般涉及到的windows的没有必要采用分布式计算啊。核心计算软件为windows开发的也没有关系的,可以采用C/S的方式。 windows只有在Windows...

2015-11-25 08:56 回复了该问题

改版

反馈