返回信息流团队介绍
字节跳动搜索团队主要负责抖音、今日头条(全网搜索)、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:
1、探索最前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;
2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力;
3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的个性化匹配问题,让搜索更加精准更加懂你;
4、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新;
5、千亿级数据规模的架构:设计和自研业内领先的检索架构,研发面向网页、视频、图文、电商等不同体裁的大规模数据处理平台,构建高吞吐、低延迟、高可用的搜索在线服务。
1、参与ByteDance搜索引擎研发工作,用前沿的机器学习深度学习算法、海量的数据,做激动人心的技术、给用户更好的搜索体验;
2、参与抖音/头条/电商/生活服务等产品的搜索研发工作,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验;
3、参与搜索核心算法改进,可选的方向包括:
(1)NLP:利用LLM等技术,研发新的自然语言处理算法和信息检索技术,提高搜索引擎的准确性和智能化程度;
(2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型;
(3)多模态:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;
(4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
(5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。
北邮亲学长,在搜索部门5年+,有意向欢迎扫码加微信内推
这是一条镜像帖。来源:北邮人论坛 / job-info / #958438同步于 2023/8/15
JobInfo机器人发帖
【校招】【内推】字节抖音搜索NLP/LLM/Ranking/图像算法/架构
carlislelee
2023/8/15镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。