Bob

同程旅游大数据+BI 架构师

始于: 2015-09-29

江苏省 苏州市

发私信

250

总声望

142

次被推荐

0

粉丝

他的回答
排序:

0
投票

Hbase1.1.2和和Hive1.2.1可以集成吗?

示例hive sql:CREATE TABLE hbasetable(key int, value int) STORED BY 'org.apache.had...

2015-11-18 17:24 回复了该问题
2
投票

hive如何按某一字段分组取最大(小)值所在行的数据?

hive中有row_number() 函数可以做到. 在hive 0.13上的版本中应该有,此版本中提供了几个窗口函数

2015-11-18 17:20 回复了该问题
0
投票

怎么用c实现一个python类然后让python脚本可以import并继承?

这个应该很难做到了,一般都是通过动态库来调用的。

2015-11-18 17:18 回复了该问题
1
投票

SSIS 中如何快速 Load 一个大文件(1.7G,740000条数据)到数据库中

建议在数据库中完成。1.服务器的内存要调大些 2.直接将数据装载到sql表中。在此过程中不做任何的业务逻辑处理。可以使用ssis,也可以使用t-sql的bluk...

2015-11-18 16:56 回复了该问题
2
投票

请问有在windows上装过Hive ODBC 驱动的吗? 想请教下 如果windows上只装了RPD的client Hive的驱动要怎么装

直接去msdn上下载 HIVE ODBC驱动安装   https://www.microsoft.com/en-us/download/details.aspx...

2015-11-16 14:19 回复了该问题
1
投票

批量插入数据过慢,有啥好的方法

建议把程序计算这部分的任务都封装到存储过程中。 数据库服务器上执行这些操作会比程序单条循环 快

2015-11-13 13:09 回复了该问题
3
投票

如何自动部署Analysis Services2008项目?

1.使用SSIS+ SQL Agent代理来完成自动部署 2.使用C#编程,通过ascmd.net来访问cube,并完成部署功能

2015-11-13 13:07 回复了该问题
2
投票

有大神 可以说下 Bulk Insert , Open Rowset(bulk...) , 以及 BCP 导入的区别么?

 Open Rowset:通过OLE DB接口访问远程数据的一次性临时方法。如果你对ole db频繁引用,那还是建议用链接服务器。 可以在from 中直接把op...

2015-11-13 13:04 回复了该问题
2
投票

Hfile的blocksize问题?

2.如果使用HColumnDescripter把blocksize块大小改成576KB,是不是表示每个Data块的大小为576KB? 是的。HColumnDes...

2015-11-13 12:49 回复了该问题
1
投票

请教个hbase的问题,并发情况下,如果对get-put保证原子性,是要自己在代码里实现吗?

hbase本身有行级别锁。你可以在客户端获取行锁来执行判断逻辑,但是如果是高并发的情况还是有可能导致死锁并牺牲服务器资源。 因此,原子性还是需要在代码中实现。 ...

2015-11-13 11:12 回复了该问题
2
投票

如何给一个博客程序设计mongodb数据库?

mongodb是自动分片,可以不需要参考mysql的分表。 mongodb的文档大小是16m,这个在存储你的文章或附件时需要考虑下。 最简单的内嵌结构: {  ...

2015-11-10 13:34 回复了该问题
1
投票

laravel自带队列和redis实现队列哪个效率高,考虑到高并发,大流量

队列方面只用过MQ和kafka。 kafka分布式集群可支持大流量、高并发的读写。在数据持久化方面做的还不错。   这些消息队列在性能上是OK的,经过很多互联网...

2015-11-10 13:03 回复了该问题
1
投票

编译后的hadoop,master上 Hadoop jar提交作业,居然只在master本地执行,有谁遇到过么,可能原因?

检查core-site.xml 中 fs.default.name的value是否为hdfs://namenode ip:9000.如果配置为[url=http...

2015-11-10 09:49 回复了该问题
1
投票

HBase行键的问题?

如果你一直向这个表里面插入数据,确实会让表底层数据进行split操作。 创建表的时候默认会有一个region,如果这个region存储数据超过一个范围,则会进行...

2015-11-10 09:40 回复了该问题
1
投票

Python初学者在GitHub应该从哪里开始学习?

1.认真学习Python.org的内容 2.从github 上去下载一些python源代码项目,认真细致地学习别人的编程思想。 3.多做学习笔记。将一些精美的代...

2015-11-08 17:55 回复了该问题

改版

反馈