返回信息流Coding Agent的软件工程评测任务,内推简历优先审核~
内推链接:
https://www.talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=45
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #984985同步于 2026/3/18
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【兼职】【线上】大模型编程能力评测,时薪500~1000
study94aqiua
2026/3/18镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
岗位要求(满足其一即可)
- 拥有 5年以上 软件研发经验,具备复杂系统架构设计能力;或是热门repo核心贡献者,是活跃的超级工程师。
- QS排名前100 或 国内双一流 高校计算机/软件工程相关专业背景,拥有 2年以上代码实操经验。
- 热门GitHub核心贡献者,单个项目获得超过100星(需在简历中上传证明链接和截图)
【 在 cos43 的大作中提到: 】
: 必须要5年吗
https://talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=45
岗位职责
- 基于 GitHub 真实 Issue 与 PR,筛选并抽象出高难度的编程任务(如大型框架迭代、深层逻辑 Bug 修复、第三方依赖冲突解决)。
- 编写高质量的 Ground Truth,清晰界定问题的复现步骤与期望行为。
- 环境容器化:
- 使用 Docker 搭建确定性的代码运行环境,解决复杂的 Python/Java/JS 依赖链与环境隔离问题,确保评测的一致性。
- 编写环境配置脚本(setup.py, Dockerfile),确保开源项目在沙箱中顺利构建。
- 验证机制设计:
- 设计“Fail-to-Pass”验证逻辑:编写能够复现 Bug 的新增测试用例以及修复后的验收用例。
- 模拟真实开发者的需求文档,强调上下文检索与代码理解的考察。
岗位要求(满足其一即可)
- 资深实战派: 拥有 5年以上 软件研发经验,具备复杂系统架构设计能力;或是热门repo核心贡献者,是活跃的超级工程师。
- 精英学院派: QS排名前100 或 国内双一流 高校计算机/软件工程相关专业背景,拥有 2年以上代码实操经验。
- 热门GitHub核心贡献者,单个项目获得超过100星(需在简历中上传证明链接和截图)
技术栈要求
- 熟练掌握 主流编程语言及其生态(精通 Python 为必须,熟悉 Java/JavaScript/Go/Rust/C 中至少一种),能够阅读并理解 Django、Scikit-learn、Flask 等中大型开源项目的源码结构;
- 熟悉 自动化测试框架与方法论,精通 pytest、unittest、tox 或 JUnit 等测试工具,具备编写高覆盖率单元测试与回归测试的能力;
- 掌握 Git 协作与版本管理,熟悉 Pull Request 工作流,能够熟练处理 Cherry-pick、Revert 以及分析 git diff / Patch 文件;
- 具备 代码库挖掘(Repository Mining)经验,能从海量 GitHub Issue 中识别出高质量、描述清晰且包含独立测试用例的“黄金问题”;
- 有丰富的 代码调试与重构经验,能够快速定位跨模块、跨类的逻辑错误,理解静态分析(Linting)与动态分析在修复过程中的作用;
- 能编写 环境配置与编排脚本(如 setup.py、requirements.txt、Dockerfile),确保复杂的开源项目能在沙箱环境中顺利构建与运行;
- 对 AST(抽象语法树)与静态代码分析 有一定了解,理解代码补全与代码修改的底层差异。
加分项
- 有 SWE-bench、HumanEval 或 MBPP 等代码评测集的使用或构建经验,理解当前 LLM 在代码生成领域的瓶颈(如上下文窗口、幻觉);
- 熟悉 Web 框架底层、机器学习库内部实现 或其他复杂系统设计,能设计涉及元编程、装饰器或复杂类继承体系的“难题”;
- 有 开源社区贡献经验(如在 GitHub 提交过高质量 PR),熟悉开源项目的 CI/CD 流程(GitHub Actions、Travis CI);
- 熟悉 测试驱动开发(TDD) 模式,能将模糊的自然语言需求转化为精确的可执行测试代码;
- 了解 RAG(检索增强生成)在代码领域的应用,能设计考察模型“跨文件检索”与“依赖关系理解”能力的专用任务;
- 具备 多语言互操作(FFI) 或 语言迁移(如 Python 2 -> 3,Java -> Kotlin)的工程经验;
- 对 软件供应链安全 有所了解,能设计涉及依赖漏洞修复或安全补丁生成的评测场景;
- 具备处理 API 破坏性变更(Breaking Changes) 修复的实战经验;
- 具备双语环境工作的能力。
https://talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=88
时薪200-300
岗位职责
题目构建:结合软件工程、架构、算法等相关经验,为大模型设计高难度、贴合真实工作场景的技术考题
评估标准建设:制定计算机领域大模型的专业能力评估体系与行业标准
模型输出评测:对大模型输出的内容进行多维度评审、纠错与逻辑拆解
岗位要求
在读:硕士及以上学历要求,计算机、软件工程等相关专业,985/211/QS200以内学校优先
在职:本科及以上学历,深耕计算机科学、软件工程、网络安全等相关领域,2年以上相关工作经历
工作方式
1、工作形式:100% 远程协作,采用兼职模式
2、时间与任务:弹性工作制,无每日投入时间硬性要求,按需自主领取任务。
3、作业平台:统一在Talents AI 官网平台(电脑端) 完成任务领取、交付全流程操作。
4、结算规则:报酬按周结算;数据审核合格正常结算,未通过则不予结算。
5、全程支持:平台提供项目说明、及专属顾问支持,助力适配工作要求。
6、质量要求:逻辑严谨、科学可解释、符合真实工作&生活场景