BYR Achieve · 镜像论坛

【兼职】【实习】【急招】数据库高手！有偿协助整理维护优化数

2025/5/27镜像同步0 回复

目标：实现数据库的自动化解析、维度运算、可视化查询和每日更新 1、解析现有文件，明确数据维度任务分解：现有10Gb.sql和数据库结构文件；（1）数据库结构分析：通过结构文件提取表名、字段名、数据类型、主键、索引、关系等；（2）数据维度分析： - 统计表数量、单表记录数、字段数； - 分析数值型字段的分布（最大值、最小值、均值）、文本型字段的枚举值（如分类标签）； - 检查时间字段范围（如时间序列数据的起止日期）；（3）输出：需要输出ER图和文档，供非技术人员查阅。 2、数据运算与复现模块（1）运算类型：需明确是聚合运算（如求和、分组统计）、衍生字段（如计算比率），还是模型预测（如时间序列预测）；（2）性能要求：10GB 数据在本地处理分块或依赖数据库聚合；（3）实施方案：直接navicat还是用Python脚本、PySpark布式处理等等。 3、交互界面查询模块（1）前端组件： - 维度选择器，联动下拉框，如先选择“时间”，再选择“分类字段”）； - 查询结果：支付分页表格+图表联动；（2）后端：将条件转化为 `SQL`；需防止sql注入，使用参数化查询。 4、可视化与导出（1）提供表格下载：excel、csv （2）可视化：通过预设定或者某种方式，生成柱状图、折线图、复合图形等，通知需支持维度的切换。 5、每日数据更新（1）数据源：从多个网站上爬取数据，需多次访问相同网址；根据解释的基础数据，具体分析；（2）自动化更新数据库，一键或定时运行。（3）可手动更新，日志监控等。 6、数据库维护与优化（1）索引优化：对高频查询字段加索引。（2）查询缓存：启用 `Redis` 缓存热点数据。（3）分区表：按时间分区大表。（4）硬件升级：若本地部署，考虑 `SSD` 和内存扩容。（5）使用者分析，包括浏览记录和IP地址，及用户历史分析。 7、本地 vs. 云端数据库选型 8、迭代：大模型与性能提升、增加新的运算、用户管理系统联系人：张先生电话：18911190131 办公地点：北京市大望路附近

订阅后，新回复会通过你的通知中心匿名送达。