位置：文档库 > 求职简历 > 中级大数据开发工程师简历模板

中级大数据开发工程师简历模板

萧亚轩上传于 2023-10-28 10:45

《中级大数据开发工程师简历模板》

一、个人信息

姓名：张XX

性别：男

年龄：30岁

联系电话：138XXXX1234

电子邮箱：zhangxx@example.com

求职意向：中级大数据开发工程师

期望薪资：18K-25K/月

工作地点：北京/上海/深圳

到岗时间：1个月内

二、教育背景

2013.09-2017.06 清华大学计算机科学与技术专业本科

主修课程：数据结构、算法设计、数据库原理、分布式系统、机器学习、大数据技术原理

GPA：3.8/4.0（专业前10%）

荣誉奖项：国家奖学金（2016）、校级优秀毕业生（2017）

三、工作经历

2017.07-2020.12 某知名互联网公司大数据开发工程师

工作职责：

1. 负责公司核心业务线（日活5000万+）的实时数据仓库建设，基于Hadoop/Spark生态搭建Flink流处理平台，日均处理数据量超10PB

2. 主导用户行为分析系统重构，将原有Hive批处理升级为Flink实时计算，使关键指标延迟从15分钟降至30秒内

3. 开发实时风控系统，集成Kafka+Flink+Redis架构，实现每秒5万条交易数据的实时风险检测，误报率降低至0.3%

4. 优化HBase集群存储方案，通过预分区和BloomFilter优化，将查询响应时间从800ms降至120ms

5. 构建数据质量监控平台，使用Prometheus+Grafana实现100+数据指标的自动化监控告警

项目成果：

• 主导的实时计算平台支撑公司6大业务线，日均处理请求量超20亿次

• 开发的用户画像系统使广告点击率提升18%，年增收超3000万元

• 优化后的数据管道使ETL作业运行效率提升40%，年节省服务器成本120万元

2021.01-至今某金融科技公司高级大数据工程师

工作职责：

1. 设计并实施基于Kubernetes的混合云大数据平台，支持Spark/Flink/Presto等多引擎混合部署

2. 构建实时反洗钱系统，整合多源异构数据（银行交易、身份信息、设备指纹），实现毫秒级风险判定

3. 开发数据湖治理工具，实现元数据自动采集、血缘分析、数据质量检测，管理数据资产超5PB

4. 优化ClickHouse集群性能，通过分区表和物化视图设计，使复杂查询响应时间从12秒降至1.5秒

5. 搭建AI模型训练平台，集成TensorFlow/PyTorch框架，支持千亿参数模型的分布式训练

项目成果：

• 构建的实时风控系统拦截可疑交易超200亿元/年，误拦率低于0.05%

• 开发的数据血缘系统提升数据治理效率60%，减少30%的数据质量问题

• 设计的混合云架构使资源利用率提升35%，年节省云成本280万元

四、技术技能

编程语言：Java（5年）、Python（4年）、Scala（3年）、SQL（精通）

大数据生态：Hadoop（HDFS/YARN）、Spark（Core/SQL/Streaming）、Flink（DataStream/CEP）、Kafka、HBase、Hive、Presto、ClickHouse

云计算平台：AWS（EMR/S3/Kinesis）、阿里云（MaxCompute/DataWorks）、腾讯云（TDW/TSF）

数据治理：Atlas元数据管理、Debezium数据变更捕获、Airflow工作流调度

机器学习：TensorFlow、PyTorch、Scikit-learn、Spark MLlib

开发工具：IntelliJ IDEA、Git、Maven、Docker、Kubernetes

监控系统：Prometheus、Grafana、ELK Stack、Zabbix

五、项目经验

项目1：实时用户画像系统（2022.03-2022.09）

项目角色：技术负责人

项目描述：构建支持千万级QPS的实时用户标签系统，整合APP行为、交易记录、设备信息等20+数据源

技术方案：

• 数据采集：Flume+Kafka采集多端日志，日均处理数据量800亿条

• 实时计算：Flink SQL实现标签计算逻辑，支持UDF扩展

• 存储方案：HBase+Redis分层存储，热数据缓存命中率95%

• 服务接口：gRPC协议提供毫秒级标签查询服务

项目成果：系统支撑6大业务线实时决策，标签更新延迟

项目2：金融风控数据中台（2021.06-2022.01）

项目角色：核心开发

项目描述：构建支持反欺诈、反洗钱、信用评估的金融级数据中台

技术方案：

• 数据集成：使用DataX实现15个异构数据源的同步，日增量数据量2TB

• 实时计算：Flink CEP实现复杂事件模式检测，支持毫秒级响应

• 特征工程：Spark MLlib构建1000+风险特征，模型训练效率提升3倍

• 服务化：Dubbo框架提供特征查询API，平均响应时间80ms

项目成果：系统上线后风险识别准确率提升25%，年减少损失超5000万元

项目3：智能物流调度系统（2020.03-2020.11）

项目角色：技术架构师

项目描述：构建基于实时交通数据的智能配送路径优化系统

技术方案：

• 数据采集：Kafka消费高德地图实时路况数据，更新频率1分钟

• 路径计算：Spark GraphX实现Dijkstra算法，支持10万级节点计算

• 预测模型：LSTM神经网络预测30分钟内路况变化，准确率85%

• 可视化：ECharts实现动态路径展示，支持交互式调整

项目成果：系统使配送效率提升18%，单均配送成本降低12%

六、专业认证

• Cloudera Certified Associate (CCA) Spark and Hadoop Developer（2018）

• AWS Certified Big Data - Specialty（2019）

• 阿里云ACE大数据工程师认证（2020）

• Oracle Certified Professional, Java SE 8 Programmer（2017）

七、自我评价

1. 具备5年大数据开发经验，熟悉从数据采集到价值输出的全链路技术实现

2. 精通实时计算框架（Flink/Spark Streaming），有PB级数据处理和千万级QPS系统设计经验

3. 擅长性能优化，在存储引擎调优、计算资源调度、网络传输等方面有深入实践

4. 具备良好的技术视野，持续关注大数据领域前沿技术（如湖仓一体、流批一体、AI工程化）

5. 拥有金融、物流、互联网等多行业项目经验，能快速理解业务需求并提供技术方案

6. 具备优秀的团队协作能力，曾担任技术负责人带领8人团队完成核心系统重构

八、培训经历

2022.05 参加Databricks官方培训《Delta Lake与湖仓一体架构设计》

2021.11 参与Apache Flink社区Meetup，分享《Flink CEP在金融风控中的应用》

2020.08 完成Udacity《大数据架构师》纳米学位课程

2019.03 参加AWS Big Data技术峰会，获得"最佳实践案例奖"

关键词：中级大数据开发工程师、Hadoop、Spark、Flink、实时计算、数据仓库、HBase、Kafka、Python、Java、数据治理、金融风控、用户画像、技术优化、混合云架构

简介：本文是一份中级大数据开发工程师的求职简历模板，涵盖个人信息、教育背景、5年+工作经历（含2段完整项目经验）、技术技能树、专业认证、自我评价等内容。重点展示了在实时计算、数据仓库建设、性能优化等方面的实践经验，包含3个百万级用户规模的项目案例，突出PB级数据处理能力和千万级QPS系统设计经验，适用于互联网、金融等行业的大数据技术岗位申请。

立即下载

求职简历相关