位置: 文档库 > 求职简历 > ARM高性能计算开发工程师简历模板

ARM高性能计算开发工程师简历模板

汽水味心跳2118 上传于 2022-05-09 20:57

【ARM高性能计算开发工程师简历模板】

一、个人信息

姓名:张明 | 性别:男 | 年龄:30岁

联系方式:+86 138-XXXX-XXXX | 邮箱:zhangming@arm-hpc.com

地址:北京市海淀区中关村软件园 | 求职意向:ARM架构高性能计算开发工程师

期望薪资:25K-35K/月 | 到岗时间:1个月内

二、教育背景

2012.09-2016.06 清华大学 计算机科学与技术 博士

研究方向:并行计算架构与优化算法

主修课程:计算机体系结构、高性能计算、编译原理、分布式系统

GPA:3.8/4.0(专业前5%)

2008.09-2012.06 复旦大学 计算机科学与技术 学士

荣誉:国家奖学金(2011)、ACM程序设计竞赛亚洲区银奖(2010)

三、专业技能

1. 硬件架构

- 精通ARM Cortex-A系列处理器架构(A72/A76/Neoverse)

- 熟悉ARM SVE(可伸缩矢量扩展)指令集优化

- 掌握ARM TrustZone安全架构与虚拟化技术

2. 软件开发

- 熟练运用ARM Compiler、GCC for ARM、LLVM优化工具链

- 精通OpenMP/MPI并行编程模型,具有混合编程经验

- 掌握NEON/SVE内联汇编与向量化优化技术

3. 性能调优

- 熟练使用Perf、VTune、ARM Streamline等性能分析工具

- 具备Cache优化、分支预测优化、内存访问优化实战经验

- 熟悉ARM Big.LITTLE架构调度策略优化

4. 系统设计

- 有分布式计算框架(如Spark on ARM)移植经验

- 了解异构计算(CPU+GPU+NPU)协同调度设计

- 掌握Linux内核裁剪与实时性优化技术

四、工作经历

2016.07-2020.12 华为技术有限公司 高级软件工程师

项目:鲲鹏920处理器HPC软件栈开发

职责:

- 负责ARMv8架构数学库(BLAS/LAPACK)优化,性能提升40%

- 开发基于SVE指令集的图像处理加速库,延迟降低60%

- 设计动态电压频率调整(DVFS)算法,能效比提升25%

成果:

- 获公司技术突破奖(2019)

- 申请发明专利3项(已授权1项)

2021.01-至今 阿里巴巴达摩院 资深研发工程师

项目:含光800 NPU与ARM CPU协同计算框架

职责:

- 构建ARM平台深度学习推理引擎,支持TensorFlow/PyTorch

- 优化Transformer模型在ARM上的量化部署,吞吐量提升3倍

- 开发异构任务调度器,资源利用率提高50%

成果:

- 发表ISCA 2022论文《SVE-based Quantization for ARM HPC》

- 主导开源项目ArmNN-Optimizer(GitHub星标1.2k+)

五、项目经验

项目1:基于ARM Neoverse的金融风控系统

时间:2022.03-2022.12

角色:技术负责人

技术栈:ARMv8.4-A、SVE2、OpenMP 5.0、Infiniband

实现:

- 设计多核并行风险计算框架,支持10万+指标实时分析

- 优化内存访问模式,使L3 Cache命中率提升至98%

- 集成ARM CMSIS-NN库,推理延迟从12ms降至3.2ms

成果:系统通过金融级安全认证,部署于3家国有银行

项目2:ARM架构气象预报模型加速

时间:2021.06-2021.11

角色:核心开发者

技术栈:WRF模型、ARM Performance Libraries、MPI

实现:

- 将动态核心解耦为静态计算图,并行效率从65%提升至89%

- 开发SVE优化的傅里叶变换内核,单节点性能超x86 15%

- 构建跨节点通信优化层,集群扩展效率保持92%以上

成果:相关优化被WRF官方6.2版本采纳

六、技术博客与开源贡献

1. 个人技术博客(www.armhpc.cn)

- 《ARM SVE编程实战:从入门到精通》系列(12篇)

- 《鲲鹏处理器Cache行填充优化技巧》阅读量5.8万+

- 《NEON指令集在图像处理中的10种妙用》被ARM官方转载

2. 开源项目

- ArmPerfTools:ARM平台性能分析工具集(GitHub贡献者32人)

- SVE-Benchmark:可伸缩矢量扩展基准测试套件(下载量1.2万次)

- 参与LLVM 14.0后端代码生成优化(提交PR 17个)

七、培训与认证

2023.05 ARM Accredited Engineer(ARM认证工程师)

2022.09 华为HCIA-HPC(高性能计算认证)

2021.03 英伟达Deep Learning Institute认证

2019.07 参加ARM DevSummit全球开发者大会并做技术分享

八、自我评价

1. 技术深度:具备从硅芯片到系统软件的完整技术视野,精通ARM架构底层原理与上层应用优化

2. 工程能力:主导过多个千万级用户量的HPC项目落地,擅长解决复杂系统性能瓶颈

3. 创新能力:在SVE指令集应用、异构计算调度等领域提出多项创新性解决方案

4. 团队协作:具有跨部门协作经验,曾同时管理5个技术团队推进项目交付

5. 学习能力:持续跟踪ARM最新架构(如Neoverse V2、SVE3)并快速应用于实际项目

关键词:ARM架构、高性能计算、SVE指令集、并行编程、性能优化、异构计算、深度学习加速、OpenMP、MPINEON系统调优编译器优化分布式计算内存管理Cache优化

简介:十年ARM生态开发经验,专注于高性能计算领域,涵盖从处理器架构设计到应用层优化的全栈技术能力。主导过金融风控、气象预报等大规模并行计算项目,在ARM SVE指令集优化、异构计算调度等方面取得显著成果,发表多篇顶级会议论文并拥有多项发明专利。