内心召唤:@春宇 普元的工具据说可以,有接触吗? 邱明伟:不行的,他们是SQL要按照一定的规则来写才可以。 杨宝军:sql解析是补救方式,关键是开发工具本事带元...
2016-04-12 12:17 回复了该问题春宇:data lineage分析难点在于对程序的解析,然后把解析后的结果结构化。 邱明伟:SQL能解析吗? 春宇:因为datastage, cognos都是I...
2016-04-12 12:16 回复了该问题老头子:全库全表搜索某个值。 巩庆昌:类似明细查询是吗@老头子 老头子:比如,我前台报表的一个条件要去匹配a表里的5个字段 都没有 再匹配B表里的5个字段 再...
2016-04-12 12:11 回复了该问题逆光:@海辉 你错了,数据中心永远不是数据的提供者。只是数据的传递者。通过建立视图区,以前我们这样做过。
2016-04-12 12:07 回复了该问题逆光:@大连-教育-王东 分企业,有些企业IT部门处于弱势,有些企业处于强势,其实你数据梳理出来是给业务部门看的,建议业务部门牵头更好一点。 王东:@逆光 结论...
2016-04-12 11:07 回复了该问题逆光:@巩庆昌 没有什么好办法,只能自己多干点,或者可以通过变通的方式来搞,比如建立一个数据的视图区,确定数据稳定再加载。
2016-04-12 11:07 回复了该问题逆光:@吃柚不吃橙 这么说吧,我们先制定标准,收集业务指标基本信息,包括:指标名称、计量单位、数据精度、数据频度、统计口径、数据要求接入时间等指标项,然后在考虑...
2016-04-12 11:05 回复了该问题逆光:@硕 一般通过测试,我们都是用ETL转换,因为数据抽取是一个长期的,不能总该,另外就是加强业务人员的责任心,统一规范。还有个办法,也可以考虑用Excel做...
2016-04-12 11:04 回复了该问题[b]逆光:[/b]说实话,就是大家提出一些建议,然后领导拍板@邱明伟 ,通常就是我说的,完整性,及时性,以及数据质量这三个方面。然后根据自己企业情况,把这三个...
2016-04-12 10:59 回复了该问题[b]同程吴文波:[/b]flume只是承担了从负载集群收集日志,没有直接到达hdfs。在flume到达hdfs之间架设kafka消息队列的原因是,日志数据可以...
2015-12-14 11:38 回复了该问题[b]同程吴文波:[/b]@陈宏 在后台监控发现资源下线了,那推荐系统中进行人工干预。 [b]陈宏:[/b]协同过滤训练的结果集和最新在线的产品不一样 [b]陈...
2015-12-14 11:37 回复了该问题[b]同程吴文波:[/b]公共号里面想办法去实现微信的一些接口程序,里面会返回城市等一些地理等数据 [b]同程吴文波:[/b]好好看下微信的api。
2015-12-14 11:36 回复了该问题[b]卢育峰:[/b]影响算法的的特征主要还在产品标签和用户行为上,属性前面大致说啦。
2015-12-14 11:02 回复了该问题[b]吴君-51随意行-客流专家:[/b]@轩子 搜索引擎是大数据非常有挑战的路,集成多个算法为一体,实时与离线结合的工程。而且他本身是业务系统,所以还可以深...
2015-12-14 11:01 回复了该问题[b]Neal_泥偶:[/b]关联推荐的话很难说谁做的好谁做的差,理论上说LinkedIn做的应该是最好的,Netflix是最能吹的,Amazon只是做的最早的...
2015-12-14 11:00 回复了该问题