邱鑫宇

邱鑫宇

# 开放机会
Python Scrapy · PySpider 数据采集 · 解析 RPA · 影刀 Headless Chrome SpringBoot RAG · AI 应用 Pandas · 数据分析
本科 · 软件工程 · 2025届 2年经验(含百度实习) 一周内到岗 秦皇岛 · 可调动
133-4223-0429 1181426980@qq.com 河北省 · 秦皇岛 6K-8K / 月 · 面议 24岁 · 男 · 满族 微信同手机号
0
年开发经验
0
参与项目
0%
数据解析准确率
0
技术认证

工作经历 03 段 · 职业轨迹

北京汇创思拓数字科技 · 河北分公司 2026.02 — 至今
Python 爬虫工程师
  • 基于影刀 RPA 构建电商数据采集系统,自动抓取抖音电商达人、商品及短视频内容数据,覆盖粉丝量、带货能力、销售数据等核心指标
  • 设计并优化自动化流程,实现登录、翻页、动态加载及详情页解析,提升采集效率并降低人工干预
✦ 数据清洗 · 去重 · 结构化输出,支撑运营选品与达人筛选
百度在线网络技术(北京)有限公司 2025.07 — 2025.10
移动抓取与收录研发工程师
  • 参与海量数据分布式爬虫采集系统建设,攻克高性能、高并发、高可用技术场景下的工程挑战
  • 主导从传统 HTTP 爬虫向 Headless Chrome 渲染爬虫 架构演进,有效提升动态内容覆盖率
  • 构建完整的数据质量监控与反馈系统,定义 “正文抽取准确率” “关键信息缺失率” 等量化指标
✦ 数据解析准确率 88% → 97% ✦ 移动端页面抓取量 ↑ 40% ✦ 动态站点覆盖率 60% → 95%+
北京国信创新科技股份有限公司 2025.01 — 2025.06
爬虫工程师
  • 熟练运用 PySpider、Selenium、Requests 等框架研究网页接口规律并实施数据采集
  • 优化爬虫策略并构建代理 IP 池,有效规避反爬虫机制,保障数据稳定性与安全性
  • 采用并发请求与异步执行技术提升吞吐,显著缩短数据抓取周期
✦ 数据获取效率提升 50%+ ✦ 结合异步技术缩短抓取周期

项目经验 03 个 · 核心作品

AI 智能面试辅助平台 · Interview-Guide 2026.02 — 至今
SpringBoot SpringAI RAG PgVector Redis MySQL POI
基于 Java 的 AI 应用开发项目,依托 SpringBoot + SpringAI 框架对接大模型,结合 RAG 检索增强生成PgVector 向量数据库,通过接口调用与 POI 文档解析获取简历及面试知识库数据,借助循环批量处理业务数据,最终打包生成 PDF / TXT 格式面试评测文档。利用 Redis 缓存高频面试题目以降低延迟。
睿选商务数据驾驶舱 2026.02 — 至今
Cloudflare Pages Chart.js ECharts SheetJS JavaScript ES6
前端商务数据可视化平台,部署于 Cloudflare Pages。通过 SheetJS 解析 Excel 原始商务数据(品牌消耗、达人合作、商务业绩),配合自定义计算规则进行多维清洗与格式转换。使用 Chart.js / ECharts 构建 五时间段(近半年当月、最近半年、当月、昨天、当天增量)可视化仪表盘,支持品牌 TOP5 排行、达人合作统计、商务负责人业绩排行等核心分析模块。
电影市场票房分析与可视化系统 2024.01 — 2024.07
Requests Pandas Matplotlib CSV REST API
基于 Python 的全链路数据抓取与分析脚本,通过封装 Requests 调用艺恩娱数 REST API 获取中国大陆电影票房排行榜数据,经 Pandas 进行数据清洗、聚合与统计计算,利用 Matplotlib 绘制饼图与折线图,直观展示票房年度占比及趋势分布。

教育背景 本科 · 软件工程

燕京理工学院
软件工程 · 工学学士
2021.09 — 2025.06
在校期间担任 红衫志愿者协会实践部部长,多次组织并参与校级志愿活动(烈士陵园扫墓、关爱老人、核酸检测等),带领部门高效完成校外对接工作,获评 优秀志愿者 荣誉称号。系统修读数据结构与算法、Java 企业级开发、Python 编程、数据库原理、软件测试技术、Web 开发、Linux 系统、计算机组成原理等核心课程。
高级软件工程师 Web 安全渗透测试 OpenHarmony 人才认证 英语四级 (CET-4) 全国计算机二级
数据结构 Java 企业级开发 Python 编程 数据库原理 软件测试技术 Web 开发 Linux 系统 计算机组成原理

技能栈 Proficiency Matrix

编程语言
Python Java JavaScript (ES6+) HTML5 / CSS3
爬虫工程 & 数据采集
Scrapy / PySpider Requests / urllib Selenium Headless Chrome 影刀 RPA BeautifulSoup / lxml 正则表达式 (Re) 异步抓取 (aiohttp)
数据处理 & 存储
Pandas / NumPy MySQL MongoDB PostgreSQL Redis PgVector Elasticsearch
框架 & 工程化工具
SpringBoot SpringAI Flask RAG (Retrieval-Augmented Generation) Git / GitHub Docker Maven ECharts / Chart.js Office 高级应用

校园经历 & 荣誉 Leadership · Certification

实践部部长 红衫志愿者协会 2022.03 — 2023.02
多次组织并参与大型志愿活动(烈士陵园扫墓、社区关爱老人、核酸检测秩序维护等),带领部门完成校外机构对接与共建合作,荣获 优秀志愿者 荣誉证书,展现出良好的组织协调能力与社会责任感
🏅 高级软件工程师认证
🔐 Web 安全渗透测试认证
📱 OpenHarmony 人才认证
📘 英语四级 (CET-4)
💻 全国计算机二级
🏆 校级 Python 编程竞赛奖项

自我评价 Profile · 关于我

软件工程专业本科应届生,拥有 1 年 Python 实习经验(爬虫、数据解析方向),曾在 百度 总部任职移动抓取与收录研发实习生,具备 互联网一线大厂 工程实战经历。

核心技术栈:扎实的 Python 编程基础,熟悉数据结构与算法;精通 Scrapy / PySpider / Selenium 等爬虫框架,具备 Headless Chrome 渲染爬虫架构演进经验;掌握 Pandas / NumPy 数据处理体系,熟练使用 MySQL / MongoDB / PostgreSQL 等数据库;了解 SpringBoot + SpringAI + RAG 全链路 AI 应用开发流程。

工程素养:具备 数据质量监控体系 建设经验,善于通过量化指标驱动解析准确率提升(88% → 97%);熟悉 Git 版本控制与协作流程,具备良好的代码规范与文档撰写习惯。

综合素质:获得过 校级 Python 编程竞赛奖项,学习能力突出,对 Web 开发数据分析AI 工程化应用 方向充满热情,渴望在实战中持续提升 Python 工程化能力与系统架构思维。

<邱鑫宇 · 在线简历 /> | 最后更新 · 2026.06 | 基于 Glass Purple 设计系统