您好!建设挖掘所需的数据集市有两种情况: 第一,在模型训练阶段,需要把挖掘建模所需要的数据提供到集市中,此时集市中的数据只要是做挖掘的所需的数据就可以了,和挖掘...
2016-03-29 10:57 回复了该问题这个使用编码的方式处理。即为病例等信息设置编码值,这样可以让别人看到的都是数字,看不出什么意思。这个是可以使用SmartMining的重新编码节点实现。
2016-03-10 19:26 回复了该问题您应该是给自己公司做吧。这个主要看数据量,如果一张表最多只有百万条的数据量,可以使用我们的免费版,不用任何费用。如果有几千万条记录,桌面版就可以搞定。那么十几万...
2016-03-10 19:23 回复了该问题两者区别主要在于建设成本和安全性上。 私有云更安全,因为建设在企业内部的局域网内,不会把数据放到别人的平台上,企业自己更可控更安全。但是相对建设成本比公有云高一...
2016-03-10 19:17 回复了该问题针对这个问题,最好的办法是改变数据获取方式。原来是要把所需数据都提前抽取过来,这样用得到的和用不到的都抽取过来了。这样必然会把患者信息泄漏给竞争对手。因此要想防...
2016-03-10 19:09 回复了该问题大数据、数据挖掘、人工智能三者的关系可以简单的理解为:大数据是原材料,数据挖掘是加工厂,而人工智能是数据产品尤其是基于数据挖掘技术建立的专家系统的...
2016-03-10 19:01 回复了该问题logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回...
2016-03-10 17:52 回复了该问题您好!这个思路没有问题。也正如您所说的第五步至关重要。而第三步和第四步的核心就是对学生进行画像,建设学生完善的标签库。这个是推荐的基础和学生基本信息保证。在学生...
2016-01-07 11:32 回复了该问题其实,可以简单的理解,多维分析是数据的多维度视图,是数据的一种探索分析手段,和图形化可视化探索数据异曲同工,你可以把多维分析作为数据挖掘可视化探索的一部分。而数...
2016-01-07 11:18 回复了该问题给您两种选择方案,一个是开源的,使用hadoop的框架,借助其mapreduce分布式计算框架进行分布式挖掘,它都是基于java实现的,可以解决TB级以上的数据...
2015-12-06 09:31 回复了该问题请使用这个工具,这个是最易用的挖掘工具 下载地址:[url]http://pan.baidu.com/s/1o6B0GdW[/url] 学习资料:[url]ht...
2015-12-02 18:36 回复了该问题这个不是技术问题,而是研究条件的问题。像用于深度学习研究的语音或者图像都很好找,但是用于深度学习研究的文本语义可就不好造了,这个只能根据用户打字习惯进行学习,具...
2015-11-25 23:29 回复了该问题