位置：文档库 > 求职简历 > 深度学习架构师简历模板

深度学习架构师简历模板

AgileCoachX 上传于 2023-08-24 13:45

《深度学习架构师简历模板》

一、个人信息

姓名：张XX

性别：男

年龄：32岁

联系电话：+86 138-XXXX-XXXX

电子邮箱：zhangxx@dl-architect.com

所在地：北京市海淀区

求职意向：深度学习架构师

期望薪资：45K-60K/月（可协商）

到岗时间：1个月内

二、教育背景

2012.09-2016.06 清华大学计算机科学与技术博士

研究方向：深度学习模型优化与并行计算

主修课程：机器学习理论、神经网络架构设计、高性能计算、分布式系统

毕业论文：《基于动态图优化的深度学习框架加速研究》

2008.09-2012.06 浙江大学计算机科学与技术学士

GPA：3.8/4.0（专业前5%）

荣誉：国家奖学金（2次）、ACM-ICPC亚洲区银奖

三、工作经历

2020.03-至今百度深度学习研究院高级深度学习架构师

职责与成果：

1. 主导PaddlePaddle框架的分布式训练模块重构，支持千亿参数模型训练，训练效率提升40%

2. 设计并实现动态图与静态图混合编译系统，减少模型部署延迟35%

3. 带领5人团队开发自动化模型压缩工具链，支持FP16/INT8量化，模型体积压缩率达80%

4. 与硬件部门合作优化TensorCore利用率，在A100 GPU上实现3.2TFLOPS/W能效比

5. 发表3篇CCF-A类论文，申请5项发明专利（2项已授权）

2018.07-2020.02 阿里巴巴达摩院深度学习工程师

职责与成果：

1. 参与M6多模态大模型研发，负责视觉-语言交叉注意力机制设计，模型在VQA任务上准确率提升8%

2. 优化推荐系统深度学习模型，通过特征交叉层重构使CTR预测AUC提升0.03

3. 开发分布式训练监控系统，支持万卡集群训练任务调度与故障自动恢复

4. 构建模型服务化平台，支持ONNX/TensorRT模型动态加载，QPS提升3倍

2016.07-2018.06 腾讯AI Lab 机器学习研究员

职责与成果：

1. 研发图像分类深度学习框架，在ImageNet数据集上Top-5准确率达96.2%

2. 设计轻量化目标检测模型，在移动端实现25FPS实时检测，mAP达42.3%

3. 开发自动超参优化工具，使模型训练时间从72小时缩短至18小时

4. 参与微信语音识别系统升级，通过TDNN-LSTM混合架构降低WER 12%

四、技术专长

1. 深度学习框架：

- PyTorch（核心贡献者，提交12个PR）

- TensorFlow（高级认证工程师）

- PaddlePaddle（框架源码级优化）

- MXNet/Keras（项目实践经验）

2. 模型架构设计：

- 卷积神经网络（CNN）：ResNet/EfficientNet/ConvNeXt优化

- 循环神经网络（RNN）：LSTM/GRU变体设计

- 注意力机制：Transformer/Swin Transformer实现

- 图神经网络（GNN）：GraphSAGE/GAT应用

3. 分布式训练：

- 数据并行：Ring All-Reduce优化

- 模型并行：管道并行/张量并行实现

- 混合精度训练：FP16/BF16自动转换

- 梯度压缩：Quantization-aware Training

4. 模型优化：

- 量化：PTQ/QAT/动态量化

- 剪枝：结构化/非结构化剪枝

- 蒸馏：知识蒸馏策略设计

- NAS：可微分架构搜索实现

5. 硬件加速：

- GPU：CUDA/TensorCore优化

- NPU：华为昇腾/寒武纪适配

- FPGA：HLS高层次综合

- ASIC：TPU架构理解

五、项目经验

项目1：超大规模预训练模型研发（2021-2022）

角色：技术负责人

技术栈：PyTorch、Megatron-LM、Deepspeed

成果：

- 构建1750亿参数多模态大模型

- 实现3D并行训练（数据/管道/张量并行）

- 开发渐进式预训练策略，训练成本降低40%

- 模型在GLUE基准上平均得分91.2

项目2：实时视频分析系统（2020）

角色：架构设计师

技术栈：TensorRT、ONNX Runtime、gRPC

成果：

- 设计流式处理架构，支持8路1080P视频同时分析

- 开发动态批处理模块，吞吐量提升2.8倍

- 实现模型热更新机制，无需中断服务

- 端到端延迟控制在150ms以内

项目3：自动驾驶感知系统（2019）

角色：核心开发者

技术栈：Caffe2、CUDA、ROS

成果：

- 开发多传感器融合检测框架

- 优化点云处理流水线，FPS从12提升至35

- 设计轻量化BEV感知模型，参数量减少65%

- 通过ISO 26262功能安全认证

六、专业技能

编程语言：Python（5年+）、C++（3年+）、CUDA（2年+）

开发工具：Git/Github、Docker、Kubernetes、Jenkins

数据可视化：Matplotlib、Seaborn、TensorBoard

系统调试：Nsight Systems、Py-Spy、Perf

英语能力：CET-6（628分）、IEEE论文写作经验

七、获奖与认证

2022：KDD Cup深度学习赛道冠军

2021：NVIDIA GTC中国区技术演讲嘉宾

2020：百度技术学院"最佳架构师"奖

2019：ACM SIGKDD深度学习研讨会论文奖

2018：TensorFlow开发者专家（TFDE）认证

八、论文与专利

论文：

1. "Dynamic Graph Optimization for Large-Scale Deep Learning Training"（ICLR 2022）

2. "Efficient Multi-Modal Fusion with Cross-Attention Mechanism"（NeurIPS 2021）

3. "Hardware-Aware Neural Architecture Search for Edge Devices"（CVPR 2020）

专利：

1. 一种基于动态图优化的深度学习训练方法（ZL202110XXXXXX.X）

2. 混合精度训练的梯度压缩装置及方法（ZL202011XXXXXX.5）

3. 多模态大模型的渐进式预训练系统（申请号：202210XXXXXX.2）

九、自我评价

1. 具有8年深度学习领域研发经验，从算法设计到系统优化的全栈能力

2. 主导过3个千万级用户规模的AI系统落地，具备工程化思维

3. 持续跟踪SOTA论文，每周阅读5+篇顶会论文并复现关键方法

4. 优秀的跨团队协调能力，曾同时管理4个技术小组

5. 对AI for Science有浓厚兴趣，参与过蛋白质结构预测项目

十、参考人（可提供）

1. 李XX 百度技术副总裁邮箱：lixx@baidu.com

2. 王XX 阿里达摩院院长电话：+86 139-XXXX-XXXX

3. 陈XX 清华大学教授微信：ChenProfessor

关键词：深度学习架构师、PyTorch、TensorFlow、分布式训练、模型优化、预训练模型、计算机视觉、自然语言处理、GPU加速、专利发明

简介：本文为深度学习架构师求职简历模板，涵盖教育背景、工作经历、技术专长、项目经验等核心模块。申请人具有清华大学博士学历，8年AI研发经验，主导过超大规模预训练模型研发，精通PyTorch/TensorFlow框架优化，熟悉分布式训练与模型压缩技术，发表3篇CCF-A类论文，持有5项发明专利，寻求深度学习架构师职位。

立即下载

求职简历相关