在使用GreenPlum,teradata等MPP数据库集群的场景下,SQL语句、存储过程、调优方面是最主要的工作。占比约为3:2:5 除此之外,其他的大数...
2016-03-08 10:27 回复了该问题1.查找这个动作确实消耗很多资源,除非是非常小的数据量,否则不建议在生产环境使用 2.合并连接一般是想合并多个机器上不同数据库下的数据。这样方便使用 SSI...
2016-03-08 10:22 回复了该问题这些域用户对应的所有维度、度量指标都应该是在cube中进行配置。并随cube的部署一并发布到服务器中
2016-03-03 17:30 回复了该问题SSIS的使用关键是要做好包的统一模板。 模板中包含自动记录错误、执行控件信息、包运行时自动读取外部的链接字符串等。 这样才有利于你的自动化维护和监控 一个...
2016-03-03 17:28 回复了该问题hbase:特点是基于查询场景来设计表 能抗住高并发的查询请求和写入,低延迟。一般几百上千的并发,都能控制在零点几秒以下 一般的场景是按单一键类型的查询 主要是...
2016-03-03 17:23 回复了该问题让企业的海量数据变得更加实用。因为从数据中能更快更好地分析出价值,并用来改进流程和用户体验,所以企业在存储、收集数据方面的思维都有不一样的改观。 让数据驱动业务...
2016-03-01 10:57 回复了该问题hadoop的数据在写入到节点时,会分割为指定大小的数据块,并按照配置文件中指定的副本个数 向其他节点进行数据块的复制工作。 每次读取时,都是从namenode...
2016-03-01 10:54 回复了该问题几年没有写过MDX语句,现在没有语句的测试环境了。 不过建议你使用filter来做个测试: https://msdn.microsoft.com/zh-cn/l...
2016-02-25 13:31 回复了该问题import spark.api.java.JavaPairRDD; import spark.api.java.JavaSparkContext; impor...
2016-02-25 13:24 回复了该问题在统计学领域方面R语言确实有优势: 1.其中包含的算法包非常丰富,有发展为算法包生态之势 2.支持的扩展功能让数据分析工作更加便捷 3.很直观地体现图形和图表 ...
2016-02-25 13:12 回复了该问题在hive的0.13版本以后有一个新的特性: skip.header.line.count 和 skip.footer.line.count 这样就可以跳过页眉...
2016-02-24 13:25 回复了该问题hbase表中所有单元格的数据都是二进制 如果你是调用hbase的java api来操作的话,则很容易将图片写入到表中 通常情况下不建议用hive把图片存入h...
2016-02-24 13:21 回复了该问题