【兼职】【线上】大模型编程能力评测，时薪500～1000

2026/3/18镜像同步4 回复

Coding Agent的软件工程评测任务，内推简历优先审核～内推链接： https://www.talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=45

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

cos43机器人#1 · 2026/3/18

必须要5年吗

study94aqiua机器人#2 · 2026/5/1

岗位要求（满足其一即可） - 拥有 5年以上软件研发经验，具备复杂系统架构设计能力；或是热门repo核心贡献者，是活跃的超级工程师。 - QS排名前100 或国内双一流高校计算机/软件工程相关专业背景，拥有 2年以上代码实操经验。 - 热门GitHub核心贡献者，单个项目获得超过100星（需在简历中上传证明链接和截图）【在 cos43 的大作中提到: 】 : 必须要5年吗

study94aqiua机器人#3 · 2026/5/1

https://talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=45 岗位职责 - 基于 GitHub 真实 Issue 与 PR，筛选并抽象出高难度的编程任务（如大型框架迭代、深层逻辑 Bug 修复、第三方依赖冲突解决）。 - 编写高质量的 Ground Truth，清晰界定问题的复现步骤与期望行为。 - 环境容器化： - 使用 Docker 搭建确定性的代码运行环境，解决复杂的 Python/Java/JS 依赖链与环境隔离问题，确保评测的一致性。 - 编写环境配置脚本（setup.py, Dockerfile），确保开源项目在沙箱中顺利构建。 - 验证机制设计： - 设计“Fail-to-Pass”验证逻辑：编写能够复现 Bug 的新增测试用例以及修复后的验收用例。 - 模拟真实开发者的需求文档，强调上下文检索与代码理解的考察。岗位要求（满足其一即可） - 资深实战派：拥有 5年以上软件研发经验，具备复杂系统架构设计能力；或是热门repo核心贡献者，是活跃的超级工程师。 - 精英学院派： QS排名前100 或国内双一流高校计算机/软件工程相关专业背景，拥有 2年以上代码实操经验。 - 热门GitHub核心贡献者，单个项目获得超过100星（需在简历中上传证明链接和截图）技术栈要求 - 熟练掌握主流编程语言及其生态（精通 Python 为必须，熟悉 Java/JavaScript/Go/Rust/C 中至少一种），能够阅读并理解 Django、Scikit-learn、Flask 等中大型开源项目的源码结构； - 熟悉自动化测试框架与方法论，精通 pytest、unittest、tox 或 JUnit 等测试工具，具备编写高覆盖率单元测试与回归测试的能力； - 掌握 Git 协作与版本管理，熟悉 Pull Request 工作流，能够熟练处理 Cherry-pick、Revert 以及分析 git diff / Patch 文件； - 具备代码库挖掘（Repository Mining）经验，能从海量 GitHub Issue 中识别出高质量、描述清晰且包含独立测试用例的“黄金问题”； - 有丰富的代码调试与重构经验，能够快速定位跨模块、跨类的逻辑错误，理解静态分析（Linting）与动态分析在修复过程中的作用； - 能编写环境配置与编排脚本（如 setup.py、requirements.txt、Dockerfile），确保复杂的开源项目能在沙箱环境中顺利构建与运行； - 对 AST（抽象语法树）与静态代码分析有一定了解，理解代码补全与代码修改的底层差异。加分项 - 有 SWE-bench、HumanEval 或 MBPP 等代码评测集的使用或构建经验，理解当前 LLM 在代码生成领域的瓶颈（如上下文窗口、幻觉）； - 熟悉 Web 框架底层、机器学习库内部实现或其他复杂系统设计，能设计涉及元编程、装饰器或复杂类继承体系的“难题”； - 有开源社区贡献经验（如在 GitHub 提交过高质量 PR），熟悉开源项目的 CI/CD 流程（GitHub Actions、Travis CI）； - 熟悉测试驱动开发（TDD）模式，能将模糊的自然语言需求转化为精确的可执行测试代码； - 了解 RAG（检索增强生成）在代码领域的应用，能设计考察模型“跨文件检索”与“依赖关系理解”能力的专用任务； - 具备多语言互操作（FFI）或语言迁移（如 Python 2 -> 3，Java -> Kotlin）的工程经验； - 对软件供应链安全有所了解，能设计涉及依赖漏洞修复或安全补丁生成的评测场景； - 具备处理 API 破坏性变更（Breaking Changes）修复的实战经验； - 具备双语环境工作的能力。

study94aqiua机器人#4 · 2026/5/1

https://talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=88 时薪200-300 岗位职责题目构建：结合软件工程、架构、算法等相关经验，为大模型设计高难度、贴合真实工作场景的技术考题评估标准建设：制定计算机领域大模型的专业能力评估体系与行业标准模型输出评测：对大模型输出的内容进行多维度评审、纠错与逻辑拆解岗位要求在读：硕士及以上学历要求，计算机、软件工程等相关专业，985/211/QS200以内学校优先在职：本科及以上学历，深耕计算机科学、软件工程、网络安全等相关领域，2年以上相关工作经历工作方式 1、工作形式：100% 远程协作，采用兼职模式 2、时间与任务：弹性工作制，无每日投入时间硬性要求，按需自主领取任务。 3、作业平台：统一在Talents AI 官网平台（电脑端）完成任务领取、交付全流程操作。 4、结算规则：报酬按周结算；数据审核合格正常结算，未通过则不予结算。 5、全程支持：平台提供项目说明、及专属顾问支持，助力适配工作要求。 6、质量要求：逻辑严谨、科学可解释、符合真实工作&生活场景