经验之谈

  • 特征平台需求层次理论

    前言 本文是「算法工程化实践调研」系列的第 1 篇,翻译 Eugene Yan 的技术博客 Feature Stores - A Hierarchy ...

    2023年1月28日 经验之谈
  • 推荐系统(10):样本拼接工程实践

    本文是推荐系统工程系列第十篇,终于来到工程系列的最后一个模块:样本工程。 样本工程是衔接在线服务与离线模型训练的重要一个环节,主要职责是样本拼接和业务相关的ETL处理等,模块位置如...

    2023年1月28日 经验之谈
  • 推荐系统(9):特征工程实践与方案总结

    1 导语 本文是推荐系统工程系列第9篇文章,隔了4个月没有更新,除了没有时间外(其实就是懒),更主要原因是: 特征工程在搜广推/人工智能领域是一个非常重要且庞大的课题,涉及在线与离...

    2023年1月28日 经验之谈
  • 推荐系统(8):如何构建序列特征服务

    1. 什么是序列特征? 推荐系统中的序列特征,大体可以理解为用户的各种行为,比如常见的: 曝光+点击+收藏+转发+评论+关注等。 另一种跟序列比较相关的是session。比如用户可...

    2023年1月28日 经验之谈
  • 推荐系统(7):特征在线服务设计

    1 前言 因为围绕特征服务的周边模块比较复杂,有些模块过往工作中并没有涉及,或者涉及得不够深入,我从个人工作实践总结和技术调研的角度,尝试跟大家理理清楚。主要分为特征 在...

    2023年1月28日 经验之谈
  • 推荐系统(6): 特征平台实践与思考

    1. 什么是特征? 模型,样本数据,特征,是算法工程师们口中老三样了。个人理解,特征是一种对事物特性的表达,从被描述物体角度上可以分为若干个大类: 从模型的使用角度来看,特征又可以...

    2023年1月28日 经验之谈
  • 推荐系统(5):粗排工程实践与思考

    1. 什么是粗排 算法领域并不是我的强项,之前的工作也是侧重粗排工程实践,因此这里只简单介绍下粗排的相关背景。对算法模型结构等更加详细的发展历史,可以参考下阿里专家分享的:阿里粗排...

    2023年1月28日 经验之谈
  • 推荐系统(4):万字长文深入浅出向量检索技术

    1. 深入浅出向量 1.1 什么是向量(embedding)? 在深度学习火热的当下,向量是一个无法逃避的概念,万物皆可embedding。 首先,embedding想要解决的问题...

    2023年1月28日 经验之谈
  • 推荐系统(3):倒排索引在召回中的应用

    1. 什么是倒排索引 倒排索引这个概念,在信息检索领域使用比较广泛。核心的需求是:如何从超大规模的内容库中召回匹配关键字的结果。 比如,在谷歌中搜索包含 ”推荐系统“ 关键字的内容...

    2023年1月28日 经验之谈
  • 推荐系统(2):详解曝光去重实践

    1. 什么是曝光去重|曝光过滤? 为什么需要曝光去重? 在推荐这个场景,特别是信息流&短视频领域,视频和图文都属于快消品,用户会频繁的刷新,挑选符合他们口味的内容,尤其像抖...

    2023年1月28日 经验之谈