高级大数据开发(spark实时流式计算)

玖富

2017-04-14 10:38

15-30 K

投递简历

北京/3-5年经验/本科 /全职

高级大数据开发(spark实时流式计算)

 

岗位职责  

1、理解线上业务和金融行业数据,设计重构实时数据处理引擎

2、响应实时数据处理需求,实时采集提取数据,实时动态呈现报表

3、参与业务分析、特征变量提取、数据挖掘建模等相关工作  
4、负责实时大数据平台及实时风控相关模块的设计开发维护工作


任职要求:  

1、精通Hadoop2、Spark/Streaming、Kafka、Redis、Flume、Presto

2、熟练Spark SQL、Hbase、Druid、Hive等使用

3、精通Java/Python语言中一种;

4、精通分布式并发编程

5、熟悉常规的机器学习算法:降维(PCA、SVD)、SVM、逻辑回归(Logistics Regression)、决策树(GBDT、RandomForest)、关联规则(Apriori、FP-Growth)、聚类(K-Means)等等优先

6、互联网公司3年以上实时数据处理、实时数据平台设计开发经验


数据伯乐温馨提示 :
如在投递及面试过程中遇到招聘方的任何收费行为(如培训费、体检费、资料费、置装费、押金等),则存在诈 骗风险,请您务必提高警惕!

改版

反馈