美团搜索粗排优化的探索与实践
2025.09.26 12:22浏览量:0简介:本文深入探讨美团搜索粗排阶段的优化策略与实践经验,从粗排模型结构、特征工程、排序指标优化等方面展开,结合具体案例与代码示例,为搜索系统性能提升提供可操作的建议。
美团搜索粗排优化的探索与实践
引言
在互联网搜索场景中,粗排(Coarse Ranking)作为精排(Fine Ranking)的前置环节,承担着从海量候选集中快速筛选出高质量候选集的重要任务。美团作为国内领先的本地生活服务平台,其搜索系统每日需处理数亿次请求,粗排性能直接影响用户搜索体验与平台业务指标。本文将从粗排模型结构优化、特征工程改进、排序指标优化三个维度,系统梳理美团搜索粗排的优化实践,为同类业务提供可复用的方法论。
一、粗排模型结构优化
1.1 传统双塔模型的局限性
早期美团搜索粗排采用双塔模型(User Tower & Item Tower),通过分别计算用户与商品的嵌入向量,再通过点积或余弦相似度计算匹配分数。该模型结构简单、计算高效,但存在两大缺陷:
- 特征交互缺失:双塔模型仅能捕捉用户与商品的独立特征,无法建模两者间的复杂交互(如用户历史行为与商品属性的交叉影响)。
- 信息损失严重:为压缩计算量,双塔模型通常使用浅层网络(如2-3层MLP),导致高阶特征提取能力不足。
1.2 动态图卷积网络的引入
为解决上述问题,美团团队引入动态图卷积网络(Dynamic Graph Convolutional Network, DGCN),其核心创新点包括:
- 动态图构建:以用户历史行为序列为节点,构建动态异构图(Heterogeneous Graph),通过图结构捕捉用户兴趣的演化路径。
- 多阶特征交互:利用图卷积操作(GCN Layer)显式建模用户-商品、商品-商品间的多阶交互,例如:
# 伪代码:图卷积层实现def gcn_layer(input, adj_matrix, weight):# input: 节点特征矩阵 [N, D]# adj_matrix: 邻接矩阵 [N, N]# weight: 可学习参数 [D, D']support = torch.mm(input, weight) # 特征变换output = torch.spmm(adj_matrix, support) # 邻域聚合return output
- 轻量化设计:通过稀疏矩阵运算与量化技术,将模型参数量从亿级压缩至百万级,满足线上实时推理需求。
实践效果:在美团到店业务中,DGCN模型相比双塔模型,点击率(CTR)提升12%,转化率(CVR)提升8%,同时QPS(每秒查询量)保持稳定。
二、特征工程改进
2.1 用户行为序列的深度挖掘
用户历史行为是粗排阶段最核心的特征来源。美团团队通过以下技术优化行为序列特征:
- 行为去噪:利用HMM(隐马尔可夫模型)识别并过滤异常行为(如刷单、误点击),提升行为序列的纯净度。
- 时序模式挖掘:引入Transformer架构的注意力机制,捕捉用户兴趣的时序依赖性。例如:
# 伪代码:自注意力机制实现def self_attention(query, key, value):# query, key, value: 行为序列特征 [T, D]scores = torch.bmm(query, key.transpose(1, 2)) / (D ** 0.5) # 缩放点积attn_weights = torch.softmax(scores, dim=-1) # 注意力权重output = torch.bmm(attn_weights, value) # 加权求和return output
- 多模态融合:结合用户搜索词、点击商品图片的视觉特征(通过ResNet提取),丰富行为序列的表征维度。
2.2 商品特征的动态增强
商品特征需兼顾静态属性(如品类、价格)与动态属性(如库存、销量趋势)。美团通过以下方式优化商品特征:
- 实时特征更新:利用Flink流计算框架,每5分钟更新商品销量、评价数等动态特征,确保粗排模型捕捉最新业务状态。
- 特征交叉组合:通过AutoML工具(如Google的TFX)自动搜索高阶特征组合(如“价格×销量”),减少人工特征工程成本。
三、排序指标优化
3.1 多目标排序框架
美团搜索需同时优化CTR、CVR、GMV(成交总额)等多个目标。团队采用多门控专家模型(Multi-Gate Mixture-of-Experts, MMoE),其结构如下:
- 共享底层网络:提取用户与商品的通用特征。
- 多专家网络:每个专家网络专注于一个特定目标(如CTR专家、CVR专家)。
- 门控网络:动态分配各专家网络的权重,实现目标间的自适应平衡。
实践效果:在美团外卖业务中,MMoE模型使CTR提升9%、CVR提升7%、GMV提升6%,显著优于单目标模型。
3.2 排序策略的动态调整
为应对业务波动(如促销活动、季节变化),美团团队设计了一套动态排序策略:
- 在线学习(Online Learning):通过FTRL算法实时更新模型参数,快速适应数据分布变化。
- A/B测试框架:构建多组排序策略并行实验,通过贝叶斯优化自动选择最优策略组合。
四、总结与展望
美团搜索粗排的优化实践表明,通过模型结构创新(如DGCN)、特征工程深化(如行为序列挖掘)、排序指标多目标化(如MMoE),可显著提升搜索系统的性能与业务价值。未来,美团将进一步探索以下方向:
- 图神经网络的端到端优化:将图构建与图推理过程统一为可微分计算,提升模型训练效率。
- 强化学习在排序中的应用:通过奖励函数设计,实现长期用户价值与短期业务指标的平衡。
本文所提方法论已广泛应用于美团到店、外卖、酒店等多个业务线,为搜索系统的精细化运营提供了有力支撑。

发表评论
登录后可评论,请前往 登录 或 注册