[b]同程吴文波:[/b]@霹雳小胖 调度你可以使用Linuxshell,可以自己去写,但是一般情况调度都是打包为工作流程序。
2015-12-14 10:59 回复了该问题[b]卢育峰:[/b]可以通过浏览器识别、visit trace 以及网站互通别的网站登陆的uid(前提其他网站要开启过去同一个标示)来打通用户问题。另外匿名的...
2015-12-14 10:58 回复了该问题[b]同程吴文波:[/b]会的。@铮 如果是单产品的销量预测,则在线上直接部署R脚本。如果是大型数据模型计算,则需要将r的算法转为spark或Java脚本。 [...
2015-12-14 10:57 回复了该问题[b]人民日报媒体技术-牟瑞:[/b]大数据+是需要成本的。。。 [b]Seng:[/b]大数据的生态链不完整 [b]盛开的石头:[/b]自建 [b]Alex:...
2015-11-29 00:02 回复了该问题Seng: 企业要不要上大数据平台,该如何评估? 目前的系统能不能满足业务需求,人员配套是否有?所以传统的BI人群, 包括我,估计会比较喜欢sqlon大数据。 ...
2015-11-29 00:00 回复了该问题[b]汪尚:[/b]企业用户标签的建立分三种,第一是基本标签,如年龄、性别,第二是统计标签,比如消费金额、消费频次等,第三是预测标签,如流失概率、客户偏好等。三...
2015-11-22 11:11 回复了该问题[b]面包君:[/b]好问题!!! [b]林桐:[/b]面包君你们是怎么解决的,我也想听听。 [b]面包君:[/b]这个问题也是我们在实际数据处理会遇到的。...
2015-11-22 11:09 回复了该问题[b]第二个寒字:[/b]会员购买金额、购买频次、退货频次、退货金额、购物品牌数、退货品牌数与最近购物时间,您说的这些频次,金额,这些数据收集的工作量会很大,您...
2015-11-22 11:05 回复了该问题[b]汪尚:[/b]其实数据质量差是普遍现象,我们应该更关心基于现有的数据如何把预测效果做的更好。数据质量的处理一般通过数据探索发现清除数据质量差的记录的规则,...
2015-11-22 11:02 回复了该问题[b]面包君:[/b]关联出来的结果肯定要经过和运营、产品的人碰过之后得出的结论,数据方面的比如我们做关联分析的时候,置信度、支持度要大于多少,以及最终做出的分...
2015-11-22 10:53 回复了该问题[b]汪尚:[/b]如果是线上的话,还有一个方面可以衡量,就是用户消费的关联度。 [b]瘦蚂蚱:[/b]消费关联度是什么含义? [b]汪尚:[/b]这个关联度,...
2015-11-22 10:51 回复了该问题[b]深圳-供应链-王静:[/b]我个人觉得这种监控系统前台界面不属于BI,因为没有DW,可能是开发的应用系统直接连接生产数据库,也就是您所说的触发器触发记录数...
2015-11-16 16:18 回复了该问题[b]广州~BI~冬:[/b]@老头子,对于ORACLE数据库来说,如果有一个上百万的大维表,每天抽取全量数据,用SCD类型2的策略来保存,一般需要旧表和新表一...
2015-11-16 16:17 回复了该问题[b]贾岩:[/b]@我的哆啦不能没有A梦 ETL服务支持,这个服务也包含ETL产品公司提供的后期升级之类的服务,但是不多,主要是我们维护人员的工作,因为业务...
2015-11-16 16:15 回复了该问题[b]北京~BIEE~罐头:[/b]我认为ETL的重要性是毋庸置疑的。其实说ETL重要 是因为里面涉及到太多的业务逻辑和计算逻辑,数据的准确性 是及其重...
2015-11-16 16:12 回复了该问题