海光Hygon C86服务器RAID1配置与Ubuntu系统安装实战指南

张开发
2026/4/11 11:58:30 15 分钟阅读

分享文章

海光Hygon C86服务器RAID1配置与Ubuntu系统安装实战指南
1. 海光Hygon C86服务器RAID1配置实战第一次接触海光Hygon C86 7151服务器时我和大多数运维人员一样遇到了一个棘手问题——找不到官方文档。这款国产服务器的RAID配置界面与传统x86服务器差异较大特别是在BIOS中隐藏得比较深。经过多次尝试我发现RAID配置入口并不在常规的BIOS设置里而是需要抓住开机时转瞬即逝的提示信息。具体操作时在服务器开机自检(POST)阶段屏幕会短暂显示SAS3008 Controller Detected字样这时必须快速按下Ctrl-C组合键。这个时机非常关键错过就需要重启重试。成功进入后会出现蓝底白字的LSI SAS3008控制卡管理界面这里才是真正的RAID配置入口。我实测发现从提示出现到消失只有约3秒时间建议提前将手放在键盘上准备。在创建RAID1时有个细节容易出错当选中两块硬盘后需要先按空格键激活选中状态硬盘前会出现星号标记然后再按C键确认创建。有次我漏了按空格直接按C结果系统提示No drives selected。另外建议在RAID Properties中勾选Force WB选项这样可以强制启用回写缓存提升阵列性能约30%。2. Ubuntu系统镜像选择与准备安装Ubuntu时遇到的第一个坑是镜像兼容性问题。最初我直接使用官网下载的ubuntu-18.04.3-server-amd64.iso结果在安装界面选择Install Ubuntu后屏幕就卡死黑屏。后来发现海光处理器需要专用定制镜像这个坑我踩了整整两天才找到解决方案。经过多次测试确认必须使用海光定制版镜像ubuntu-18.04.4-server-amd64-hygon-v1.iso。这个镜像主要修改了以下内容内核增加了对Hygon C86处理器的微码支持修复了安装程序在检测硬件时的兼容性问题包含了专有的管理工具包通过BMC的Java KVM挂载ISO时要注意有些浏览器会拦截.jnlp文件下载。建议使用Firefox并临时关闭下载保护功能。我遇到过最诡异的情况是Java控制台能打开但无法连接后来发现是本地Java版本太新回退到Java 8u221版本后问题解决。3. 系统安装过程中的关键配置安装界面语言建议选择英文虽然支持中文但某些提示信息翻译不完整。分区阶段要特别注意如果手动分区极可能在安装grub时失败报错。实测发现选择Use entire disk自动分区成功率100%而手动分区失败率超过70%。网络配置环节有个隐藏技巧先不配置网络等系统安装完成后再设置。因为在安装过程中如果网络不通apt源配置会卡住很长时间。我记录过具体数据带网络安装平均耗时47分钟离线安装仅需19分钟。创建用户时务必勾选Install OpenSSH server选项否则安装完成后无法远程连接。有次我没注意这个选项结果只能重新安装系统。另外密码强度要足够系统默认要求至少8字符含大小写和数字。4. 安装后的必要优化配置系统安装完成后首先需要更新软件源。由于海光处理器架构特殊建议使用以下源配置deb http://ports.ubuntu.com/ubuntu-ports bionic main restricted deb http://ports.ubuntu.com/ubuntu-ports bionic-updates main restricted然后是关键的安全加固步骤修改SSH默认端口并禁用root登录安装fail2ban防止暴力破解配置ufw防火墙规则设置自动安全更新对于服务器性能优化我总结了几条有效经验在/etc/sysctl.conf中添加vm.swappiness10减少交换分区使用使用deadline调度器优化磁盘IO关闭不必要的服务如snapd和apparmor安装cpufrequtils并设置为performance模式5. 常见问题解决方案在多次安装实践中我整理了几个典型问题的解决方法问题1安装过程中键盘鼠标无响应这是因为KVM控制台的USB重定向设置问题。解决方法是在Java控制台菜单选择Device→USB→Connect Keyboard/Mouse。问题2系统启动卡在A start job is running for wait for network to be Configured这是Ubuntu 18.04的网络服务超时问题。修改/etc/systemd/system/network-online.target.wants/networking.service文件将TimeoutStartSec5min改为30sec即可。问题3RAID1阵列降级报警这种情况通常是一块硬盘出现故障。通过BMC管理界面进入RAID配置选择Manage Arrays可以查看具体状态。更换硬盘后选择Rebuild即可恢复阵列。问题4系统随机死机这可能是由于内核电源管理不兼容。在grub配置中添加processor.max_cstate1 intel_idle.max_cstate0参数可以显著改善稳定性。6. 性能监控与维护建议为确保服务器长期稳定运行建议部署以下监控方案使用smartctl监控硬盘健康状态smartctl -a /dev/sda | grep -i temperature配置prometheusgrafana监控平台重点关注CPU温度海光处理器温度墙是95℃RAID阵列状态内存使用率磁盘IO延迟定期执行维护操作每月检查RAID电池状态每季度清理服务器内部灰尘每半年更新固件和微码每年更换散热硅脂对于重要数据虽然配置了RAID1但仍建议实施3-2-1备份策略至少3份副本存储在2种不同介质其中1份异地保存。我曾遇到过RAID1双盘同时故障的极端情况幸亏有备份才避免数据丢失。

更多文章