ARM高性能计算开发工程师简历模板
【ARM高性能计算开发工程师简历模板】
一、个人信息
姓名:张明 | 性别:男 | 年龄:30岁
联系方式:+86 138-XXXX-XXXX | 邮箱:zhangming@arm-hpc.com
地址:北京市海淀区中关村软件园 | 求职意向:ARM架构高性能计算开发工程师
期望薪资:25K-35K/月 | 到岗时间:1个月内
二、教育背景
2012.09-2016.06 清华大学 计算机科学与技术 博士
研究方向:并行计算架构与优化算法
主修课程:计算机体系结构、高性能计算、编译原理、分布式系统
GPA:3.8/4.0(专业前5%)
2008.09-2012.06 复旦大学 计算机科学与技术 学士
荣誉:国家奖学金(2011)、ACM程序设计竞赛亚洲区银奖(2010)
三、专业技能
1. 硬件架构
- 精通ARM Cortex-A系列处理器架构(A72/A76/Neoverse)
- 熟悉ARM SVE(可伸缩矢量扩展)指令集优化
- 掌握ARM TrustZone安全架构与虚拟化技术
2. 软件开发
- 熟练运用ARM Compiler、GCC for ARM、LLVM优化工具链
- 精通OpenMP/MPI并行编程模型,具有混合编程经验
- 掌握NEON/SVE内联汇编与向量化优化技术
3. 性能调优
- 熟练使用Perf、VTune、ARM Streamline等性能分析工具
- 具备Cache优化、分支预测优化、内存访问优化实战经验
- 熟悉ARM Big.LITTLE架构调度策略优化
4. 系统设计
- 有分布式计算框架(如Spark on ARM)移植经验
- 了解异构计算(CPU+GPU+NPU)协同调度设计
- 掌握Linux内核裁剪与实时性优化技术
四、工作经历
2016.07-2020.12 华为技术有限公司 高级软件工程师
项目:鲲鹏920处理器HPC软件栈开发
职责:
- 负责ARMv8架构数学库(BLAS/LAPACK)优化,性能提升40%
- 开发基于SVE指令集的图像处理加速库,延迟降低60%
- 设计动态电压频率调整(DVFS)算法,能效比提升25%
成果:
- 获公司技术突破奖(2019)
- 申请发明专利3项(已授权1项)
2021.01-至今 阿里巴巴达摩院 资深研发工程师
项目:含光800 NPU与ARM CPU协同计算框架
职责:
- 构建ARM平台深度学习推理引擎,支持TensorFlow/PyTorch
- 优化Transformer模型在ARM上的量化部署,吞吐量提升3倍
- 开发异构任务调度器,资源利用率提高50%
成果:
- 发表ISCA 2022论文《SVE-based Quantization for ARM HPC》
- 主导开源项目ArmNN-Optimizer(GitHub星标1.2k+)
五、项目经验
项目1:基于ARM Neoverse的金融风控系统
时间:2022.03-2022.12
角色:技术负责人
技术栈:ARMv8.4-A、SVE2、OpenMP 5.0、Infiniband
实现:
- 设计多核并行风险计算框架,支持10万+指标实时分析
- 优化内存访问模式,使L3 Cache命中率提升至98%
- 集成ARM CMSIS-NN库,推理延迟从12ms降至3.2ms
成果:系统通过金融级安全认证,部署于3家国有银行
项目2:ARM架构气象预报模型加速
时间:2021.06-2021.11
角色:核心开发者
技术栈:WRF模型、ARM Performance Libraries、MPI
实现:
- 将动态核心解耦为静态计算图,并行效率从65%提升至89%
- 开发SVE优化的傅里叶变换内核,单节点性能超x86 15%
- 构建跨节点通信优化层,集群扩展效率保持92%以上
成果:相关优化被WRF官方6.2版本采纳
六、技术博客与开源贡献
1. 个人技术博客(www.armhpc.cn)
- 《ARM SVE编程实战:从入门到精通》系列(12篇)
- 《鲲鹏处理器Cache行填充优化技巧》阅读量5.8万+
- 《NEON指令集在图像处理中的10种妙用》被ARM官方转载
2. 开源项目
- ArmPerfTools:ARM平台性能分析工具集(GitHub贡献者32人)
- SVE-Benchmark:可伸缩矢量扩展基准测试套件(下载量1.2万次)
- 参与LLVM 14.0后端代码生成优化(提交PR 17个)
七、培训与认证
2023.05 ARM Accredited Engineer(ARM认证工程师)
2022.09 华为HCIA-HPC(高性能计算认证)
2021.03 英伟达Deep Learning Institute认证
2019.07 参加ARM DevSummit全球开发者大会并做技术分享
八、自我评价
1. 技术深度:具备从硅芯片到系统软件的完整技术视野,精通ARM架构底层原理与上层应用优化
2. 工程能力:主导过多个千万级用户量的HPC项目落地,擅长解决复杂系统性能瓶颈
3. 创新能力:在SVE指令集应用、异构计算调度等领域提出多项创新性解决方案
4. 团队协作:具有跨部门协作经验,曾同时管理5个技术团队推进项目交付
5. 学习能力:持续跟踪ARM最新架构(如Neoverse V2、SVE3)并快速应用于实际项目
关键词:ARM架构、高性能计算、SVE指令集、并行编程、性能优化、异构计算、深度学习加速、OpenMP、MPI、NEON、系统调优、编译器优化、分布式计算、内存管理、Cache优化
简介:十年ARM生态开发经验,专注于高性能计算领域,涵盖从处理器架构设计到应用层优化的全栈技术能力。主导过金融风控、气象预报等大规模并行计算项目,在ARM SVE指令集优化、异构计算调度等方面取得显著成果,发表多篇顶级会议论文并拥有多项发明专利。