计算机视觉高级算法工程师简历模板
【个人信息】
姓名:张明远
性别:男
年龄:32岁
学历:博士(计算机科学与技术)
毕业院校:清华大学计算机系(2018-2022)
联系方式:+86-138-XXXX-XXXX
邮箱:zhangmy@cvresearch.com
GitHub:github.com/zhangmy-cv
LinkedIn:linkedin.com/in/zhangmy-cv
【求职意向】
目标职位:计算机视觉高级算法工程师
目标领域:自动驾驶/医疗影像/工业检测/AR/VR
期望薪资:60-80万/年(可协商)
到岗时间:1个月内
工作地点:北京/上海/深圳/杭州
【教育背景】
2018.09-2022.06 清华大学计算机系 博士
研究方向:三维视觉重建与深度学习
主修课程:计算机视觉(95分)、机器学习(92分)、深度学习(93分)、数字图像处理(90分)、优化理论(88分)
博士论文:《基于多模态融合的三维场景动态重建方法研究》
论文成果:发表CCF-A类论文3篇(CVPR 2021/ICCV 2022/ECCV 2022),获最佳学生论文提名1次
2014.09-2018.06 中国科学技术大学电子工程系 学士
GPA:3.8/4.0(专业前5%)
毕业设计:《基于卷积神经网络的医学影像分类系统》
获奖情况:国家奖学金(2017)、全国大学生数学竞赛一等奖(2016)
【专业技能】
核心算法:
- 深度学习框架:PyTorch(5年经验)、TensorFlow(3年经验)、MXNet(1年经验)
- 计算机视觉基础:特征提取(SIFT/SURF/ORB)、立体匹配(SGBM/ELAS)、光流计算(Farneback/Lucas-Kanade)
- 三维重建:SfM(Bundle Adjustment)、MVS(COLMAP)、NeRF(Instant-NGP优化)
- 目标检测:YOLO系列(v3-v8)、Faster R-CNN、CenterNet
- 语义分割:U-Net、DeepLabv3+、SegFormer
- 生成模型:GAN(StyleGAN2/Diffusion Model)、VAE
工程能力:
- 模型优化:量化(INT8/FP16)、剪枝(Layer-wise)、蒸馏(Knowledge Distillation)
- 部署加速:TensorRT优化、ONNX转换、移动端部署(TFLite/MNN)
- 大规模训练:分布式训练(Horovod/PyTorch DDP)、混合精度训练
- 数据处理:数据增强(Albumentations)、标注工具(LabelImg/CVAT)、数据清洗
开发工具:
- 编程语言:Python(5年)、C++(3年)、CUDA(2年)
- 版本控制:Git/GitLab
- 调试工具:PyCharm/VSCode、Nsight Systems、TensorBoard
- 云平台:AWS EC2(p3.2xlarge)、阿里云PAI、Google Colab Pro
【工作经历】
2022.07-至今 百度Apollo自动驾驶部 高级算法工程师
职责与成果:
- 主导多传感器融合感知系统开发,设计基于Transformer的BEV(Bird's Eye View)空间特征融合网络,在nuScenes数据集上NDS评分提升8.2%
- 优化3D目标检测算法,将单帧推理延迟从120ms降至65ms(NVIDIA Orin平台),满足L4自动驾驶实时性要求
- 构建百万级场景数据闭环系统,设计主动学习策略,标注成本降低40%同时模型精度提升3.5%
- 发表技术专利2项(《基于时空注意力机制的多模态感知融合方法》、《自动驾驶场景下的动态目标跟踪系统》)
2020.06-2022.06 腾讯优图实验室 算法研究员(实习)
职责与成果:
- 参与医疗影像AI平台开发,设计轻量化肺结节检测模型,在LUNA16数据集上灵敏度达98.7%(FP@4=0.2)
- 开发基于Transformer的医学影像分割框架,减少30%参数量同时保持Dice系数95.2%
- 构建跨模态检索系统,实现CT与MRI影像的语义对齐,检索准确率提升12%
- 代码贡献:开源PyTorch-Lightning医疗影像工具包(获GitHub 1.2k星标)
【项目经验】
项目1:动态场景三维重建系统(2021.03-2022.05)
- 技术栈:PyTorch、COLMAP、Open3D、CUDA
- 创新点:
- 提出动态物体掩码生成网络,解决传统SfM中动态物体干扰问题
- 设计渐进式重建策略,将大规模场景重建时间从8小时缩短至2.5小时
- 成果:在Tanks&Temples数据集上F-score提升14%,代码被OpenMVG官方引用
项目2:工业缺陷检测系统(2020.09-2021.02)
- 技术栈:TensorFlow 2.0、OpenCV、Halcon
- 解决方案:
- 构建小样本学习框架,仅需50张标注图像即可达到98.3%检测准确率
- 设计多尺度特征融合模块,解决金属表面微小缺陷(0.2mm)检测难题
- 落地效果:部署于3条手机中框生产线,误检率从12%降至2.7%
项目3:AR眼镜手势交互系统(2019.06-2019.12)
- 技术栈:MediaPipe、Unity3D、C#
- 关键技术:
- 开发轻量化手部关键点检测模型(2.8MB),在骁龙845上运行帧率达30fps
- 设计时空约束手势识别算法,支持26种手势,识别准确率97.6%
- 商业价值:与某AR硬件厂商合作,产品已量产销售超10万台
【学术成果】
论文发表:
- "Dynamic-NeRF: Learning Dynamic Scene Representation with Neural Radiance Fields"(CVPR 2022,Oral)
- "Multi-Modal Fusion for 3D Object Detection in Autonomous Driving"(ICCV 2022)
- "Few-Shot Industrial Defect Detection via Meta-Learning"(ECCV 2022 Workshop)
- "Real-Time Hand Gesture Recognition for AR Applications"(ICRA 2021)
竞赛获奖:
- 2021 Waymo Open Dataset Challenge - 3D Detection Track 全球第3名
- 2020 COCO Object Detection Challenge 实例分割赛道第5名
- 2019 Kaggle RSNA Intracranial Hemorrhage Detection 金牌(前10%)
开源贡献:
- MMDetection3D核心贡献者(合并PR 42个)
- OpenPCDet维护者(修复关键bug 17处)
- PyTorch3D中文教程作者(获官方推荐)
【技术博客】
个人技术博客:cv-zhang.com(月均PV 1.2万)
热门文章:
- 《Transformer在计算机视觉中的20种应用方式》(阅读量2.8万)
- 《从零实现YOLOv5(附完整代码)》(GitHub星标1.5k)
- 《NeRF原理与代码解析系列》(被36氪/机器之心转载)
- 《工业级模型部署的12个坑与解决方案》(获CSDN博客专家认证)
【证书与培训】
- NVIDIA DLI深度学习认证(2021)
- 阿里云人工智能工程师(ACP)认证(2020)
- 华为HCIA-AI认证(2019)
- 参加DeepMind深度学习研讨会(2022)
- 完成斯坦福CS231n课程作业(满分)
【自我评价】
1. 技术深度:具备从数学原理到工程落地的全栈能力,熟悉SfM/MVS/NeRF等三维重建技术链,对Transformer、Diffusion Model等前沿架构有深入理解
2. 工程经验:主导过百万级数据标注系统建设,熟悉分布式训练、模型量化、移动端部署等工业化流程,有将算法从实验室到量产落地的完整经验
3. 问题解决:擅长针对复杂场景设计解决方案,如动态场景重建、小样本学习、多模态融合等,在自动驾驶、医疗影像、工业检测等领域有成功案例
4. 团队协作:具有良好的跨部门沟通能力,曾同时协调算法、数据、测试、产品等5个团队完成项目交付,具备技术管理潜力
5. 持续学习:保持每周阅读3-5篇顶会论文的习惯,GitHub累计贡献代码超5万行,开源项目获社区广泛认可
关键词:计算机视觉、深度学习、三维重建、目标检测、语义分割、Transformer、NeRF、自动驾驶、医疗影像、工业检测、PyTorch、TensorFlow、模型优化、部署加速、分布式训练、技术博客、开源贡献
简介:本文为计算机视觉高级算法工程师求职简历模板,涵盖博士教育背景、百度/腾讯工作经历、自动驾驶/医疗影像/工业检测领域项目经验、CVPR/ICCV论文成果、GitHub开源贡献及技术博客运营等内容,突出三维重建、多模态融合、模型优化等核心技术能力,适用于瞄准AI视觉领域头部企业的资深研发岗位申请。