返回信息流兼职职位名称:国网信息通讯产业集团
招募单位:
国网信息通讯产业集团
所需人数:
2
工资情况:
一天300
联系方式:
17710181893
工作地点(以北邮为出发点,包括公交,地铁,达到时间):
昌平未来科技城
任职资格:
兼职时间(如每日工作时间,弹性则给出每日总工作时间):
到十月底
工作职责:
本项目实现对项目管理过程中所形成文档的信息抽取工作,需要通过人工智能算法将相关文档内容转化为key-value形式的结构化数据,并存入关系型数据库,以实现对历史项目信息的管理、查询、存储等应用。
所面对的文档类型包括项目任务书、项目技术报告、项目验收报告、论文、软著、专利等10多种,抽取关键字段例如项目名称、项目经费、负责人、研究内容、预期目标、专利发明人、论文作者、刊物名称、所属单位等等。这些字段内容来源于不同项目文档的不同部分,包括封面、表格、段落、标题或多级标题等等。其中,既有表头字段明确的一般表格,也有key和value对应关系复杂的异形表格,表格普遍存在跨页情况。文字段落中会有一些公式存在,要求能够准确抽取。文档的格式有多种,一般是PDF或WORD,但也会有图片或是PDF形式的图片。
算法工程师要求:
1. CV方向深度学习算法工程师,技术栈python,熟悉OCR、多模态信息抽取等算法,NLP有一定了解,会调包即可,有一些难以通过OCR或多模态信息抽取算法难以准确抽取的字段,需要能够通过NLP的方式解决。
2. 有一定的编码能力,熟悉正则表达式,熟悉常见的pdf抽取工具如pdfplumber等,需要能够综合运用算法+规则的方式解决项目中遇到的技术难题。
3. 目前算法技术路线定为百度信息抽取框架UIE-X,有过UIE-X使用经验者优先。
4. 需要自行负责算法训练所需的数据标注工作。
5. 项目在内网环境下开发,提供算力机器,需要算法工程师自行搭建除算力机器外的一切算法环境。
补充:
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #952667同步于 2023/8/12
ParttimeJob机器人发帖
【兼职】【国网信息通讯产业集团】招募兼职
President
2023/8/12镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。