实习经历
理想汽车|大模型实习生
2026.02—2026.04
智能汽车群组-软件本体-理想同学-理想同学智能体部
车载音乐个性化推荐检索排序系统
- 面向车机端音乐个性化推荐场景,基于用户侧 Query + 用户画像 + 播放场景与歌曲侧内容特征,构建 双塔召回 → ANN 粗排 → Diffusion + DIN 精排 的多阶段推荐链路。
- 基于 Qwen3-Embedding 进行双塔监督微调,离线生成歌曲向量并构建 Faiss IVF-PQ 索引缓存,支撑千万级向量检索。
- 基于全参数微调 Qwen2.5-1.5B 做 Query/Item 文本改写增强,提升语义对齐效果。
- 阶段性效果:NDCG@10 +6.8%、MRR@10 +9.3%、Recall@200 提升至 87.4%,召回延迟稳定控制在 100ms 内。
理想同学音乐 Agent 深度规划
- 围绕搜歌、点播、推荐、切换播放模式、上下文续播等业务场景,采用 back-instruct 方法构造多步任务数据,累计合成高质量训练数据 1W+。
- 协助完成基于 MCP Server 的 Plan-Execute 规划算法设计,开展 SFT、GRPO、GSPO、DAPO 等多种训练方式实验。
- 基于 eagle-3 完成适配音乐 Agent 的投机解码头训练,优化车载端复杂音乐任务下的实时交互体验。
注:以上为企业内部项目,代码未开源。