位置: 文档库 > 求职简历 > 深度学习架构师简历模板

深度学习架构师简历模板

AgileCoachX 上传于 2023-08-24 13:45

《深度学习架构师简历模板》

一、个人信息

姓名:张XX

性别:男

年龄:32岁

联系电话:+86 138-XXXX-XXXX

电子邮箱:zhangxx@dl-architect.com

所在地:北京市海淀区

求职意向:深度学习架构师

期望薪资:45K-60K/月(可协商)

到岗时间:1个月内

二、教育背景

2012.09-2016.06 清华大学 计算机科学与技术 博士

研究方向:深度学习模型优化与并行计算

主修课程:机器学习理论、神经网络架构设计、高性能计算、分布式系统

毕业论文:《基于动态图优化的深度学习框架加速研究》

2008.09-2012.06 浙江大学 计算机科学与技术 学士

GPA:3.8/4.0(专业前5%)

荣誉:国家奖学金(2次)、ACM-ICPC亚洲区银奖

三、工作经历

2020.03-至今 百度深度学习研究院 高级深度学习架构师

职责与成果:

1. 主导PaddlePaddle框架的分布式训练模块重构,支持千亿参数模型训练,训练效率提升40%

2. 设计并实现动态图与静态图混合编译系统,减少模型部署延迟35%

3. 带领5人团队开发自动化模型压缩工具链,支持FP16/INT8量化,模型体积压缩率达80%

4. 与硬件部门合作优化TensorCore利用率,在A100 GPU上实现3.2TFLOPS/W能效比

5. 发表3篇CCF-A类论文,申请5项发明专利(2项已授权)

2018.07-2020.02 阿里巴巴达摩院 深度学习工程师

职责与成果:

1. 参与M6多模态大模型研发,负责视觉-语言交叉注意力机制设计,模型在VQA任务上准确率提升8%

2. 优化推荐系统深度学习模型,通过特征交叉层重构使CTR预测AUC提升0.03

3. 开发分布式训练监控系统,支持万卡集群训练任务调度与故障自动恢复

4. 构建模型服务化平台,支持ONNX/TensorRT模型动态加载,QPS提升3倍

2016.07-2018.06 腾讯AI Lab 机器学习研究员

职责与成果:

1. 研发图像分类深度学习框架,在ImageNet数据集上Top-5准确率达96.2%

2. 设计轻量化目标检测模型,在移动端实现25FPS实时检测,mAP达42.3%

3. 开发自动超参优化工具,使模型训练时间从72小时缩短至18小时

4. 参与微信语音识别系统升级,通过TDNN-LSTM混合架构降低WER 12%

四、技术专长

1. 深度学习框架:

- PyTorch(核心贡献者,提交12个PR)

- TensorFlow(高级认证工程师)

- PaddlePaddle(框架源码级优化)

- MXNet/Keras(项目实践经验)

2. 模型架构设计:

- 卷积神经网络(CNN):ResNet/EfficientNet/ConvNeXt优化

- 循环神经网络(RNN):LSTM/GRU变体设计

- 注意力机制:Transformer/Swin Transformer实现

- 图神经网络(GNN):GraphSAGE/GAT应用

3. 分布式训练:

- 数据并行:Ring All-Reduce优化

- 模型并行:管道并行/张量并行实现

- 混合精度训练:FP16/BF16自动转换

- 梯度压缩:Quantization-aware Training

4. 模型优化:

- 量化:PTQ/QAT/动态量化

- 剪枝:结构化/非结构化剪枝

- 蒸馏:知识蒸馏策略设计

- NAS:可微分架构搜索实现

5. 硬件加速:

- GPU:CUDA/TensorCore优化

- NPU:华为昇腾/寒武纪适配

- FPGA:HLS高层次综合

- ASIC:TPU架构理解

五、项目经验

项目1:超大规模预训练模型研发(2021-2022)

角色:技术负责人

技术栈:PyTorch、Megatron-LM、Deepspeed

成果:

- 构建1750亿参数多模态大模型

- 实现3D并行训练(数据/管道/张量并行)

- 开发渐进式预训练策略,训练成本降低40%

- 模型在GLUE基准上平均得分91.2

项目2:实时视频分析系统(2020)

角色:架构设计师

技术栈:TensorRT、ONNX Runtime、gRPC

成果:

- 设计流式处理架构,支持8路1080P视频同时分析

- 开发动态批处理模块,吞吐量提升2.8倍

- 实现模型热更新机制,无需中断服务

- 端到端延迟控制在150ms以内

项目3:自动驾驶感知系统(2019)

角色:核心开发者

技术栈:Caffe2、CUDA、ROS

成果:

- 开发多传感器融合检测框架

- 优化点云处理流水线,FPS从12提升至35

- 设计轻量化BEV感知模型,参数量减少65%

- 通过ISO 26262功能安全认证

六、专业技能

编程语言:Python(5年+)、C++(3年+)、CUDA(2年+)

开发工具:Git/Github、Docker、Kubernetes、Jenkins

数据可视化:Matplotlib、Seaborn、TensorBoard

系统调试:Nsight Systems、Py-Spy、Perf

英语能力:CET-6(628分)、IEEE论文写作经验

七、获奖与认证

2022:KDD Cup深度学习赛道冠军

2021:NVIDIA GTC中国区技术演讲嘉宾

2020:百度技术学院"最佳架构师"奖

2019:ACM SIGKDD深度学习研讨会论文奖

2018:TensorFlow开发者专家(TFDE)认证

八、论文与专利

论文:

1. "Dynamic Graph Optimization for Large-Scale Deep Learning Training"(ICLR 2022)

2. "Efficient Multi-Modal Fusion with Cross-Attention Mechanism"(NeurIPS 2021)

3. "Hardware-Aware Neural Architecture Search for Edge Devices"(CVPR 2020)

专利:

1. 一种基于动态图优化的深度学习训练方法(ZL202110XXXXXX.X)

2. 混合精度训练的梯度压缩装置及方法(ZL202011XXXXXX.5)

3. 多模态大模型的渐进式预训练系统(申请号:202210XXXXXX.2)

九、自我评价

1. 具有8年深度学习领域研发经验,从算法设计到系统优化的全栈能力

2. 主导过3个千万级用户规模的AI系统落地,具备工程化思维

3. 持续跟踪SOTA论文,每周阅读5+篇顶会论文并复现关键方法

4. 优秀的跨团队协调能力,曾同时管理4个技术小组

5. 对AI for Science有浓厚兴趣,参与过蛋白质结构预测项目

十、参考人(可提供)

1. 李XX 百度技术副总裁 邮箱:lixx@baidu.com

2. 王XX 阿里达摩院院长 电话:+86 139-XXXX-XXXX

3. 陈XX 清华大学教授 微信:ChenProfessor

关键词:深度学习架构师、PyTorch、TensorFlow、分布式训练、模型优化预训练模型计算机视觉自然语言处理GPU加速专利发明

简介:本文为深度学习架构师求职简历模板,涵盖教育背景、工作经历、技术专长、项目经验等核心模块。申请人具有清华大学博士学历,8年AI研发经验,主导过超大规模预训练模型研发,精通PyTorch/TensorFlow框架优化,熟悉分布式训练与模型压缩技术,发表3篇CCF-A类论文,持有5项发明专利,寻求深度学习架构师职位。