Kermit

刘捷–高级计算机视觉算法工程师简历

姓名：刘捷
民族：汉
邮箱：liujie0068@foxmail.com
Github：https://github.com/keeper-jie
住址：浙江省杭州市
出生年月：1998.02
身高：175cm
政治面貌：共青团员
毕业院校：南华大学
学历：硕士
电子简历地址：https://keeper-jie.github.io
核心优势
3年计算机视觉实战经验：覆盖目标检测/分割/分类/跟踪/关键点检测/旋转框检测，应用于图片、视频文件、视频流及端侧部署
开源贡献者：2个Ultralytics框架PR被官方采纳 (链接)
全栈落地能力：数据管理（数据爬虫采集 → 清洗 → CVAT/X-AnyLabeling标注 → 质检 → 训练 → 部署 → 漏检误检迭代优化）→ 算法研发（PyTorch）→ 模型优化部署（RKNN/TensorRT/OpenVINO/Triton）→ 项目交付与管理（系统集成项目管理工程师证书）
前沿探索：具备VLM/LLM/ASR/TTS等前沿模型实践与迁移能力

技术栈：YOLOv8、ResNet、OBB、BoT-SORT
成果：
- 大货车非法加装强光灯检测：创新角度敏感损失 + 数据增强，mAP\@0.5 提升 5.3%，夜间部署日处理图片 10万+，平均推理 0.01s/图
- 非机动车闯红灯检测：CBAM+轨迹过滤，误报率 <1.5%，多服务器部署 50路视频流，精确率 98.5%+

任务：跌倒检测、吸烟/玩手机检测
技术栈：YOLOv8-Pose、STGCN、GSConv优化
成果：
- 视频跌倒检测：YOLOv8-Pose+STGCN实现时空轨迹分析
- 小目标优化：引入GSConv替换标准卷积，AP\@0.5 提升 8.7%
- 部署：云端T4推理 14ms/图，月调用量 50万+，RK3588端侧 28ms/图

基于8000+SEM（电子显微镜）图片生成320K图文问答对资料微调Qwen3 VL 8B多模态大模型，完成数据生成-》训练-》部署-》评测工作，基于测试集相较于baseline提升了16.4%（Qwen3 VL embedding 2B计算回答的语义相似度）
基于半导体图片的模板匹配方法调研：尝试YOLOE，轮廓匹配，直方图匹配，SIFT，ORB，opencv模板匹配( 平方差和(SSD)，标准平方差(SQDIFF_NORMED)，相关(CORR)，标准相关(CORR_NORMED)，相关系数(CCOEFF)，标准相关系数(CCOEFF_NORMED)，直方图匹配（RGB颜色空间， HSV颜色空间，GRAY颜色空间） )，canny，resnet50特征提取+滑框，特征点匹配LightGlue，T-rex2，X-AnyLabeling模板匹配。在半导体测试图片上效果最好的为模板匹配cv2.TM_CCOEFF_NORMED
半导体量测项目图片标注-》核验-》训练-》部署，迭代优化算法效果，针对fin layer大目标修改模型架构适配
UniEM、UniAIMS、YOLOE、SAM-EM、Qwen3-VL、Qwen3-VL-Embedding and Qwen3-VL-Reranker论文精读并云文档记录理解和反思