标签: 计算机视觉

2 篇文章

thumbnail
TransVLAD: Focusing on Locally Aggregated Descriptors for Few-Shot Learning
This is a PyTorch/GPU Implementation of the paper TransVLAD: Focusing on Locally Aggregated Descriptors for Few-Shot Learning. Our code is mainly based on the unofficial PyTorch implementation of MAE publised before official implementation available. And the few-shot learning setting is based on the meta-baseline repo. We really appreciate their precious works!
thumbnail
GAIIC 2022 赛道一 Rank 1
京东积累了电商零售场景下的海量商品的图文数据,其中商品主图和商品标题是最直观、最容易触达到用户的数据。因此,图文的一致性(即图文匹配)至关重要,要求模型根据图片和文本判断出两种模态数据传递的信息是否一致。通常,商品主图和标题包含大量的商品属性信息。在实际业务中,图片里商品的关键属性与商品标题描述的是否匹配,是影响用户体验的重要因素。本赛题要求参赛队伍利用脱敏后的京东电商平台图文数据,通过商品图片与商品标题在整体以及商品关键属性上的关联程度来判断两者是否匹配。