岗位职责:
1、负责数据中心硬件系统管理,包括计算、存储、网络、软件等提供运行维护、技术支持服务,确保数据中心内系统稳定运行;
2、负责数据中心软件支撑系统相关的开源软件、编译器和函数库等配置安装、用户环境安装调试、用户定制化需求处理;
3、负责日常数据整理运维自动化开发工作,编写相应流程、技术文档;
负责响应用户服务,确保用户高效使用。
4、负责收集和分析系统性能指标,对提高系统可用性提出建议,维护系统稳定运行;
5、根据任务安排,协助客户完成重大任务保障工作,抗压能力强,有强烈的责任心;
任职要求:
1、大学本科及以上学历,计算机相关专业,2年以上HPC集群运维经验;
2、精通Linux操作系统和shell、perl、python等脚本编程;
3、熟练掌握各类服务器(Linux,Windows)的软硬件配置搭建和故障排查方法;
4、熟练掌握SLURM、LSF、PBS等资源调度软件使用及优化方法;
5、熟悉分布式计算或者存储系统,比如luster/Hadoop/Hbase/Storm等;
6、对容器及大数据技术有了解,并喜欢从事相关工作。有软件编程能力者优先;
7、了解IB或OPA高速网络的配置与优化,高可用集群、负载均衡集群的规划与搭建;
8、具有较强的沟通能力和文字表达能力;有敬业精神和较强的团队合作精神,诚实守信、工作严谨、责任心强;
9、具有较强的数据安全和保密意识;
职位福利:五险一金、周末双休、节日福利、带薪年假、定期团建、绩效奖金