🧑‍💻
AI 工程师 · 独立开发者

Hi,欢迎来到
不喝浓茶的个人小站

这里记录我在 AI 模型训练、工程实践上的思考与踩坑,偶尔也聊聊独立开发的日常。


ABOUT ME

关于我

我是一名专注于 AI 模型训练与工程落地的工程师,日常与大量数据和各种模型打交道。从数据清洗、模型训练到推理优化、线上部署,这条链路上的每个环节我都踩过不少坑。

写这个博客的初衷很简单——把自己踩过的坑写出来,也许能帮到有同样困扰的人。内容主要围绕深度学习、LLM 微调、MLOps 工程实践,偶尔也会写写独立开发的一些思考。

不定期更新,不追热点,只写真实遇到过的问题。不喝浓茶,也不喝咖啡——能写到深夜,全凭真的有东西想说。如果某篇文章帮到了你,欢迎来聊聊。🙌

常用框架
PyTorch Transformers ONNX TensorRT
擅长方向
LLM 微调 LoRA / QLoRA 模型量化 目标检测
工程工具
MLflow W&B Docker Triton
编程语言
Python Java Shell SQL

BLOG

最近在写

全部文章 →
LoRA 微调踩坑实录:为什么 Loss 不收敛?
用了将近两周把一个 7B 模型调到可用状态,整理了 rank 设置、学习率、数据配比这几个最容易出问题的地方,以及我最后是怎么定位的。
TensorRT 量化:INT8 精度掉了 3 个点怎么办
量化之后推理快了 40%,但 mAP 从 94% 掉到了 91%。记录排查过程:校准数据集的选择、逐层精度分析,以及最后用混合精度找回来的思路。
构建高质量 SFT 数据集的几个原则
数据质量比数据量更重要,这话听了很多遍,但怎么落地?聊聊我在做指令微调数据时用到的清洗策略、多样性控制和难度分层方法。
用 MLflow 管理几十个实验版本的实践经验
跑了太多实验,参数记在文档里根本找不到哪次最好。整理了一套用 MLflow 管理超参、指标对比和模型 artifact 的流程,适合中小规模训练任务。
查看更多文章 →

PROJECTS

做过的项目

部分已落地的 AI 工程项目

🖼️
计算机视觉目标检测

工业缺陷检测模型

基于 YOLOv8 训练的产品表面缺陷检测模型,mAP@0.5 达 94.2%,已部署至产线实时推理。

💬
NLPLLM 微调

垂直领域知识问答

对 Qwen2 进行 LoRA 微调,构建特定行业知识库问答系统,幻觉率较基座模型降低 60%。

📈
时间序列预测

供应链需求预测

基于 Transformer 架构的多变量时序预测模型,相比传统统计方法 MAE 降低 35%。


CONTACT

有问题想聊聊?

无论是文章里没讲清楚的地方、技术上的困惑,还是项目合作,都欢迎联系我。