不知道你是否有权限推广你这个模型,如果有权限,最简单的检验方式就是A/B Test,将目标用户分为两组,测试组合对照组,然后去评估你的模型。如果没有,那可能就采...
2016-04-06 17:59 回复了该问题这个取决于你的JDK的版本和操作系统,如果都是64位的,那内存是没有限制的。。服务器有多大的内容,默认都能吃下多大的内存,当然为了避免资源过度紧张,一般最大设置...
2016-04-06 17:48 回复了该问题可以变通的方式实现! 在输出的时候输出到一个临时表中。然后调用SQL组件,然后执行 SET foreign_key_checks = 0 从临时表导入数据 SE...
2016-04-06 17:46 回复了该问题可以把临时表变成固定的表A,每次直接Load数据到这个表A中,以后使用的过程中,直接主表与A表做关联查询,两边都是主键,查询也不慢。
2016-04-06 17:43 回复了该问题看具体的报错信息啊。尤其是查看socket的端口是否相通,在客户端telnet或者nc一下
2016-04-06 17:38 回复了该问题看你的数据要求精度,如果要求的不是很高,这种方式也是可以的。 如果要求的很好,实时处理什么的,可以采用阶段累加的方式计算相应的指标。一般也都是需要写脚本就计算。...
2016-04-06 17:34 回复了该问题蒙特卡洛方法没有怎么研究过。。但是检验样本是否符合正态分布的方式有很多种: Q-Q图,P-P图,峰态系数/偏态系数等等。为何一定要使用蒙特卡洛?
2016-04-06 17:22 回复了该问题不太明白要干嘛。 分类变量如果是自变量的话,是可以转换成哑(数值)变量参与聚类分析的。 类似于:男,女-〉0,1,类似于这种的啊。
2016-04-06 17:14 回复了该问题这个太具体的到业务了。可以自定义一套转码规范。比如,根据药品的名称,厂家,类型,批号等等,来定义一套标准编码规范。然后根据规范开发代码就行了。
2016-02-16 10:50 回复了该问题用的什么数据库?跟Kettle没有多大关系。 如果是sqlserver,可以参考触发器或者CDC 如果是mysql可以考虑监听bin.log或者采用双主数据库写...
2016-02-16 10:47 回复了该问题兴趣是最好的老师,如果你对网页设计感兴趣。为何要转去做大数据架构?而且还是0基础。 个人建议:遵循你的兴趣,继续深入学习网页设计,学点PHP,学点HTTP协议,...
2016-02-14 14:53 回复了该问题你用哪个命令启动的?是start-all.sh?还是start-dfs.sh?
2016-02-14 14:50 回复了该问题mysql多大的数据量?没有搞个MySQL的集群? 真要实时性可以考虑监听mysql的bin LOG
2016-01-30 20:52 回复了该问题