甘士忠
Experience
爱立信(中国)通信有限公司 2022.10 -
SRE
- 维护支持爱立信EWS 云平台稳定运行,全栈管理物理机集群(HPE/DELL,配置、部署、监控、能耗管理), KVM 虚拟机, K8s platform 以及Ceph存储, 支持全球用户,解决用户在VM、K8s、Ceoh存储使用中存在的问题。
- 监控体系:维护Prometheus + Grafana + Zabbix + Netdata 多维度监控, 部署设计OnCall工具,减少无效警告堆积,提高监控效率;
- 基础设施即代码(IaC): 开发维护Ansible自动化脚本实现集群化配置管理,故障信息采集、KVM配置管理迁移、服务软件部署、优化补丁等;
- 基于多种DevOps工具的API二次开发:Spinnaker触发多任务执行,OnCall堆积消息分类与自动化处理,Reafish物理机自动化控制、iLO/iDRRAC配置、硬件信息采集分析;
- 高性能异步任务python开发:针对CI/CD高频依赖Nexus大文件下载场景,设计异步任务队列架构,通过Redis缓存热点资源+Celery分布式调度,提高下载吞吐与提升任务效率,通过FastAPI提供服务接口。
北京光环新网科技股份有限公司 2019.6 - 2022.10
云计算研发工程师
- 主要负责基于Opnstack架构的公司云平台的代码维护,解决系统漏扫存在的安全问题,及时响应工信部对目标云主机的调查;
- 参与相关项目的部署实施,实现批量化文件配置、基础环境检查、私有云部署、日志监控工具部署等
- 基于django框架完成后端开发任务,主要包括:云平台公网IP信息检索功能、结合celery模块优化公司邮箱系统群发功能
- 针对AWS云平台违规、违法用户,协助司法、公安机关对指定云主机进行数据取证,基于AWS Boto3开发工具实现本地对云资源的远程操作,采用paramiko模块实现对云主机的远程控制,并基于PyQT5开发了一款自动化批处理云数据软件,通过简单的配置即可实现对云数据一键化处理;完成软著。
- 参加苏州移动研发中心移动云贵州节点建设,主要负责ceph对象存储部署、健康检查与处理,优化pg映射提高集群打分(10个集群,每个集群106-126台服务器,其中6台作为MON节点, 大约2000个OSD);py脚本完成软负载均衡配置;云平台环境自动化检测;neutron网络测试等。
- 为缓解公司邮箱服务器压力、提高邮箱并发能力,避免服务器存储空间浪费。基于django架构和SMTP协议完成新邮箱web客户端开发,最后采用docker部署在公司的云平台上,并添加多联系人文本识别、状态查询等功能,便于销售使用。
Education
天津工业大学 2016.9 -2019.4
- 信息与通信工程 工学硕士
南洋理工大学[交流] 2017.7 - 2018.12
NTU, Singapore
- Research Assistant 基于机器学习算法与深度模型的交通大数据
天津商业大学 2012.9 - 2016.6
- 数学与应用数学 理学学士
Publications
甘士忠, 肖志涛, 陈雷, 南瑞杰. 基于高阶非线性模型的多目标高光谱图像解混算法. 红外与激光工程(EI). 2019. [PDF]
陈雷, 甘士忠, 孙茜. 基于回溯优化的非线性高光谱图像解混. 红外与激光工程. 2017. [PDF]
陈雷, 甘士忠,张立毅,王光艳. 基于样条插值与人工蜂群优化的非线性盲源分离算法. 通信学报(EI). 2017. [PDF]
Honors & Awards
第十三届中国研究生电子设计竞赛 二等奖 2018
第十二届中国研究生电子设计竞赛 二等奖 2017
中国大学生数学建模竞赛 国家二等奖、天津市一等奖 2014
Skills
- 擅长语言:python, matlab
- 熟悉Linux系统命令
- 熟悉Ansible, spinnaker, jenkins, Elastic Stack, Zabbix, gitlab, docker等自动化工具的使用
- 熟悉HPE,DELL机器,以及其API
- 熟悉Kubernetes
- 熟悉Openstack开发与部署,后端和前端的代码维护