BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #984985同步于 2026/3/18
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖

【兼职】【线上】大模型编程能力评测,时薪500~1000

study94aqiua
2026/3/18镜像同步4 回复
Coding Agent的软件工程评测任务,内推简历优先审核~ 内推链接: https://www.talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=45
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
cos43机器人#1 · 2026/3/18
必须要5年吗
study94aqiua机器人#2 · 2026/5/1
岗位要求(满足其一即可) - 拥有 5年以上 软件研发经验,具备复杂系统架构设计能力;或是热门repo核心贡献者,是活跃的超级工程师。 - QS排名前100 或 国内双一流 高校计算机/软件工程相关专业背景,拥有 2年以上代码实操经验。 - 热门GitHub核心贡献者,单个项目获得超过100星(需在简历中上传证明链接和截图) 【 在 cos43 的大作中提到: 】 : 必须要5年吗
study94aqiua机器人#3 · 2026/5/1
https://talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=45 岗位职责 - 基于 GitHub 真实 Issue 与 PR,筛选并抽象出高难度的编程任务(如大型框架迭代、深层逻辑 Bug 修复、第三方依赖冲突解决)。 - 编写高质量的 Ground Truth,清晰界定问题的复现步骤与期望行为。 - 环境容器化: - 使用 Docker 搭建确定性的代码运行环境,解决复杂的 Python/Java/JS 依赖链与环境隔离问题,确保评测的一致性。 - 编写环境配置脚本(setup.py, Dockerfile),确保开源项目在沙箱中顺利构建。 - 验证机制设计: - 设计“Fail-to-Pass”验证逻辑:编写能够复现 Bug 的新增测试用例以及修复后的验收用例。 - 模拟真实开发者的需求文档,强调上下文检索与代码理解的考察。 岗位要求(满足其一即可) - 资深实战派: 拥有 5年以上 软件研发经验,具备复杂系统架构设计能力;或是热门repo核心贡献者,是活跃的超级工程师。 - 精英学院派: QS排名前100 或 国内双一流 高校计算机/软件工程相关专业背景,拥有 2年以上代码实操经验。 - 热门GitHub核心贡献者,单个项目获得超过100星(需在简历中上传证明链接和截图) 技术栈要求 - 熟练掌握 主流编程语言及其生态(精通 Python 为必须,熟悉 Java/JavaScript/Go/Rust/C 中至少一种),能够阅读并理解 Django、Scikit-learn、Flask 等中大型开源项目的源码结构; - 熟悉 自动化测试框架与方法论,精通 pytest、unittest、tox 或 JUnit 等测试工具,具备编写高覆盖率单元测试与回归测试的能力; - 掌握 Git 协作与版本管理,熟悉 Pull Request 工作流,能够熟练处理 Cherry-pick、Revert 以及分析 git diff / Patch 文件; - 具备 代码库挖掘(Repository Mining)经验,能从海量 GitHub Issue 中识别出高质量、描述清晰且包含独立测试用例的“黄金问题”; - 有丰富的 代码调试与重构经验,能够快速定位跨模块、跨类的逻辑错误,理解静态分析(Linting)与动态分析在修复过程中的作用; - 能编写 环境配置与编排脚本(如 setup.py、requirements.txt、Dockerfile),确保复杂的开源项目能在沙箱环境中顺利构建与运行; - 对 AST(抽象语法树)与静态代码分析 有一定了解,理解代码补全与代码修改的底层差异。 加分项 - 有 SWE-bench、HumanEval 或 MBPP 等代码评测集的使用或构建经验,理解当前 LLM 在代码生成领域的瓶颈(如上下文窗口、幻觉); - 熟悉 Web 框架底层、机器学习库内部实现 或其他复杂系统设计,能设计涉及元编程、装饰器或复杂类继承体系的“难题”; - 有 开源社区贡献经验(如在 GitHub 提交过高质量 PR),熟悉开源项目的 CI/CD 流程(GitHub Actions、Travis CI); - 熟悉 测试驱动开发(TDD) 模式,能将模糊的自然语言需求转化为精确的可执行测试代码; - 了解 RAG(检索增强生成)在代码领域的应用,能设计考察模型“跨文件检索”与“依赖关系理解”能力的专用任务; - 具备 多语言互操作(FFI) 或 语言迁移(如 Python 2 -> 3,Java -> Kotlin)的工程经验; - 对 软件供应链安全 有所了解,能设计涉及依赖漏洞修复或安全补丁生成的评测场景; - 具备处理 API 破坏性变更(Breaking Changes) 修复的实战经验; - 具备双语环境工作的能力。
study94aqiua机器人#4 · 2026/5/1
https://talents-ai.com/jobs?inviteId=u_687c03f3cd5e4b0591a3b32372bd23c0&jobId=88 时薪200-300 岗位职责 题目构建:结合软件工程、架构、算法等相关经验,为大模型设计高难度、贴合真实工作场景的技术考题 评估标准建设:制定计算机领域大模型的专业能力评估体系与行业标准 模型输出评测:对大模型输出的内容进行多维度评审、纠错与逻辑拆解 岗位要求 在读:硕士及以上学历要求,计算机、软件工程等相关专业,985/211/QS200以内学校优先 在职:本科及以上学历,深耕计算机科学、软件工程、网络安全等相关领域,2年以上相关工作经历 工作方式 1、工作形式:100% 远程协作,采用兼职模式 2、时间与任务:弹性工作制,无每日投入时间硬性要求,按需自主领取任务。 3、作业平台:统一在Talents AI 官网平台(电脑端) 完成任务领取、交付全流程操作。 4、结算规则:报酬按周结算;数据审核合格正常结算,未通过则不予结算。 5、全程支持:平台提供项目说明、及专属顾问支持,助力适配工作要求。 6、质量要求:逻辑严谨、科学可解释、符合真实工作&生活场景