BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / overseas / #23080同步于 2023/4/19
Overseas机器人发帖

【社招】清华系大模型公司 大模型工程/算法/搜索/推理/训练等

hrjack
2023/4/19镜像同步0 回复
公司致力于打造中国版openAI,目前已经完成A轮融资。 核心团队由百度、华为、微软、字节、腾讯等知名大厂组成,清华多位大佬鼎力支持,创始人具备从0到公司上市成功经验。 目前团队正在搭建中,核心岗位虚位以待。 微信&电话:15210750729 邮箱:jxiao@hiringby.com 地点:北京 大模型算法专家 岗位职责 1.负责基于海量数据的NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。 2.深入调研和关注大模型/多模态等方向的前沿技术 职位要求 1.参与或者领导过大规模预训练模型落地项目。 2.对预训练大模型充满热情,信仰AGI。 3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。 分布式训练加速研发工程师 岗位职责: 1. 负责分布式机器学习大模型的训练加速,包括但不限于优化常见框架(如Megatron,DeepSpeed),数据读取、网络通信、计算算子等方面。 2. 主导新一代机器学习大规模计算平台的架构设计和实现,以满足业务对高效算力的需求。 职位要求: 1. 熟悉数据并行、模型并行、分布式数据并行等训练模式,具备深入的理论和实践经验。 2. 具备大规模机器学习平台的架构设计经验,熟悉分布式系统和网络架构。 3. 精通常见深度学习框架,包括但不限于TensorFlow、PyTorch、Horovod等,能够快速实现并调试相关算法。 4. 对大规模预训练模型有较好的了解,了解常见预训练模型(如GPT、BERT等)的训练方法和优化技巧。 训练框架专家 职位职责: 1. 设计和实现超大规模语言模型的分布式训练算法,并提高训练效率和稳定性。 2. 优化模型结构,提高模型的精度和泛化能力。 3. 调优训练数据,提高模型训练效果。 4. 跟踪业界最新技术发展,探索新的训练算法和模型优化方法。 职位要求: 1. 精通分布式训练算法,具备超大规模模型训练的实际经验。 2. 精通深度学习算法,熟悉至少一种主流深度学习框架(例如 PyTorch 或 TensorFlow)。 3. 熟悉常用的模型结构和优化方法,例如 CNN、RNN、BERT、GPT等。 4. 熟悉数据调优和数据增强等相关技术。 5. 具备优秀的编程和算法能力,熟练使用 Python 和 C++ 等编程语言。 6. 具备良好的沟通能力和团队协作能力,能够与跨部门团队进行有效沟通和协作。 大模型推理工程师 岗位职责: 1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 职位要求: 1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。 4. 熟悉LLM相关的算法技术以及推理加速方法。 5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。 搜索研发工程师 职位职责: 1. 负责搭建高效的搜索系统,包括但不限于搜索引擎、数据存储、分布式计算、自然语言处理等方面的研发工作。 2. 根据业务需求,持续优化搜索算法和相关技术,提高搜索系统的性能和用户体验。 3. 负责搜索系统的架构设计、性能测试、监控和调优等工作。 4. 与产品和运营团队紧密合作,理解用户需求和行为,为产品和运营提供技术支持和优化建议。 职位要求: 1. 具备扎实的计算机基础知识,熟悉常用数据结构和算法。 2. 熟练掌握至少一门编程语言,例如 C++、Java 等。 3. 熟悉常用的搜索引擎和相关技术,例如 Elasticsearch、Lucene、Solr 等。 4. 具备分布式系统和大规模数据处理的实际经验,熟悉 Hadoop、Spark、Flink 等技术。 5. 具备良好的沟通能力和团队合作精神,能够与不同背景和领域的同事合作开展项目工作。 数据挖掘工程师 职位职责: 1. 设计、开发和优化数据清洗、挖掘和处理流程,以确保数据质量、安全性和多样性。 2. 进行数据质量评估和安全性识别,识别并清除有误的、低质量的和不安全的数据。 3. 进行多样性识别和评估,确保训练数据的多样性,减少模型的过拟合风险。 4. 协同团队开发和优化自动化数据清洗/挖掘和预处理工具,提高数据处理效率和准确性。 职位要求: 1. 熟悉常用的数据清洗和挖掘工具。 2. 熟悉数据质量评估和安全性识别方法和工具,例如数据标注工具、质量评估工具、敏感数据识别工具等。 3. 具有一定的编程能力和经验,熟悉至少一种编程语言,例如 Python、Java 等。 4. 有丰富的数据挖掘和处理经验,能够熟练运用统计学、机器学习等方法。 5. 具备团队协作精神和沟通能力,能够与团队中的其他成员进行高效合作,完成团队目标。
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。