天善智能-商业智能和大数据在线社区，用心创造价值

0

投票

在整个大数据行业里面。关于SQL语句、存储过程和SQL性能调优占的比重为多少？

在使用GreenPlum，teradata等MPP数据库集群的场景下，SQL语句、存储过程、调优方面是最主要的工作。占比约为3:2:5 除此之外，其他的大数...

2016-03-08 10:27 回复了该问题

0

投票

SSIS里的查找与合并联接分别哪些场景用比较合适？

1.查找这个动作确实消耗很多资源，除非是非常小的数据量，否则不建议在生产环境使用 2.合并连接一般是想合并多个机器上不同数据库下的数据。这样方便使用 SSI...

2016-03-08 10:22 回复了该问题

0

投票

sqlserver2012处理BI时日志文件增长过快

设置数据库的恢复模式为简单模式。这样会大幅度减少日志文件。

2016-03-04 10:37 回复了该问题

0

投票

BI啊，数据分析啊，数据挖掘啊，数据仓库啊ETL 啊，有什么值得考的证吗

微软有这个方面的考证 SAP也有类似的考证

2016-03-03 17:31 回复了该问题

0

投票

Excel 访问SSAS CUBE（透视表）后如何不同的用户显示不同的默认维度成员？

这些域用户对应的所有维度、度量指标都应该是在cube中进行配置。并随cube的部署一并发布到服务器中

2016-03-03 17:30 回复了该问题

1

投票

请问SSIS中一般包的使用怎么规划比较好？一个包只处理一个表吗？

SSIS的使用关键是要做好包的统一模板。模板中包含自动记录错误、执行控件信息、包运行时自动读取外部的链接字符串等。这样才有利于你的自动化维护和监控一个...

2016-03-03 17:28 回复了该问题

2

投票

hbase hive分别适合那些使用场景

hbase：特点是基于查询场景来设计表能抗住高并发的查询请求和写入，低延迟。一般几百上千的并发，都能控制在零点几秒以下一般的场景是按单一键类型的查询主要是...

2016-03-03 17:23 回复了该问题

0

投票

有哪些开源的基于hadoop的可视化数据挖掘工具?

1.mahout 2.R + RHadoop 3.MOA 4.MLlib spark

2016-03-01 11:03 回复了该问题

1

投票

大数据最核心的价值是什么？

让企业的海量数据变得更加实用。因为从数据中能更快更好地分析出价值，并用来改进流程和用户体验，所以企业在存储、收集数据方面的思维都有不一样的改观。让数据驱动业务...

2016-03-01 10:57 回复了该问题

0

投票

hdfs集群中的每个datanode中的数据是否是相同的？

hadoop的数据在写入到节点时，会分割为指定大小的数据块，并按照配置文件中指定的副本个数向其他节点进行数据块的复制工作。每次读取时，都是从namenode...

2016-03-01 10:54 回复了该问题

1

投票

MDX 查询语句求助？

几年没有写过MDX语句，现在没有语句的测试环境了。不过建议你使用filter来做个测试： https://msdn.microsoft.com/zh-cn/l...

2016-02-25 13:31 回复了该问题

0

投票

谁有Hbase+Spark的技术方案？麻烦分享下，谢谢。

import spark.api.java.JavaPairRDD; import spark.api.java.JavaSparkContext; impor...

2016-02-25 13:24 回复了该问题

1

投票

R语言优势有哪些，跟其他语言相比

在统计学领域方面R语言确实有优势： 1.其中包含的算法包非常丰富，有发展为算法包生态之势 2.支持的扩展功能让数据分析工作更加便捷 3.很直观地体现图形和图表 ...

2016-02-25 13:12 回复了该问题

1

投票

从hdfs上加载文件创建 hive表文件的第一行列名怎样做才能不被当成数据加载进来

在hive的0.13版本以后有一个新的特性： skip.header.line.count 和 skip.footer.line.count 这样就可以跳过页眉...

2016-02-24 13:25 回复了该问题

1

投票

如何通过hive把图片存入hbase中，麻烦大神们说详细一些

hbase表中所有单元格的数据都是二进制如果你是调用hbase的java api来操作的话，则很容易将图片写入到表中通常情况下不建议用hive把图片存入h...

2016-02-24 13:21 回复了该问题

Bob

他关注的

他的粉丝

他的回答
排序:
时间 投票