1
NessajCN 197 天前
要开机自动挂载 nfs 的话, 老系统手写一条 fstab
譬如 # mount nfs #192.168.2.xx:/path/to/remote/nfs /path/to/local/nfs nfs defaults 0 0 稍微新一点的系统用 autofs https://wiki.archlinux.org/title/autofs 一般在 /etc/auto.master 和 /etc/auto.nfs 里把远程路径加上就好 |
2
zxsdadasdq OP reply#1 @NessajCN
大概知道这种方式, 但是假如是存储和计算一起断电 然后又断电重启 这个时候这个 mount 会失效 计算的机器会因为没有数据目录 一直在 restart |
3
mouyase 197 天前
OP 的 j4125 是在 pve 里运行的 ikuai 吗
|
4
zxsdadasdq OP reply#3 @mouyase
没有 j4125 独立运行 ikuai, ikuai 里跑虚拟机运行 nginx 这些跟网络相关的服务 |
5
mouyase 197 天前
@zxsdadasdq 印象里 iKuai 的虚拟机性能好像很差,docker 也很难用,文件修改只能下载修改再上传
|
6
zxsdadasdq OP reply#5 @mouyase
虚拟机能用就行 虚拟机内装个 docker 对性能要求不高, 像你说的 可以在虚拟机内用 docker 或其他方式部署 webdav 等 |
7
retanoj 197 天前
我有两台虚机,一台做 BT ,一台装 OpenMediaVault(OMV)
OMV 这台挂载虚拟机磁盘,并对外提供 NFS 共享磁盘 BT 这台开机脚本挂载 NFS 共享磁盘,另外 NFS 还供给电视播放器使用 在虚机启动设置里,配置先启动 OMV 再启动 BT 这算不算存算分离 ;) |
8
NessajCN 197 天前
@zxsdadasdq 不会
|
9
zxsdadasdq OP reply#7 @retanoj
你这个方案不错 只是我的不是用虚拟机部署的存储 没办法控制先启动存再启动算 |
10
zxsdadasdq OP reply#8 @NessajCN
刚刚了解了一下 感觉可以写一个脚本 在算成功启动时,存没启动前 算轮训判断 smb 是否挂载成功 如果挂载成功再启动 docker |
11
fkdog 197 天前
有点看不太懂你们了。
下一步是不是就要给家用 nas 上 cdn 接入了? |
12
coagent 197 天前 1
个人想法:
1. 硬盘损坏的担心,交给绿联 dx6000 上的 truenas 多硬盘 raid 去承接。raid 就是用来做硬盘损坏保护的。 2. 断电的问题,你整个 ups ,3 台机器都对接到 ups ,可以考虑 nut 方案,可以做到优雅关机的,还可以控制关机顺序。 3. j4125 和 n100 用独立的网口去连绿联 dx6000 ,这条链路只有数据存储的通讯,会干净、稳定一些。服务器间挂载用 nfs ,我们在公有云上的服务器挂载 nas 一直都是 nfs ,稳定用几年了。 4. 你的 j4125 和 n100 ,可以弄 pve ,但不建议搞 ceph ,也不建议搞 k8s ,这两者配置好并稳定运行,需要有足够的运维经验。 5. 计算节点的服务,在断电重启后,如果早于 nas 启动好,肯定会出现数据目录未就绪的情况。两个思路: 1 )如果 j4125+n100 都是 pve 或者 esxi ,是可以控制各个 vm 自动开机的顺序、延时多久的,dx6000 要多久就绪是可以测试出来的,测试好后在 pve/esxi 上设置好就行。 2 )绕行方案,可以通过配置服务启动前先检查数据目录就绪情况,然后再启动服务。比如 docker 设置为不开机自动启动,而是 linux 服务器启动好后运行你一个脚本,这个脚本做数据目录就绪检查,检查通过后再手动拉起 docker ,然后再起其他服务。 |
13
llix110 197 天前
其实我建议弄一台高性能的小主机做计算,目前 j1900 truenas 做存储,一台小主机 5600h 做 windows ,基本上主流下载软件都得到很好的支持,也可以运行 wsl 使用 docker desktop ,远程桌面控制小主机,非常稳定且易用。windows 解决 smb 挂载很好用。
|
14
zmcity 197 天前
三台不一样的机器搞存算分离,以及单点没有太强稳定的环境,最好限制在 nas 存电影,另一个机器转码这种只读/数据损坏也无所谓的事情。主要是机器少无法互相形成热备,没有太好的方法实现快速恢复。
我以前搞过 pve 挂载白裙 nfs/smb ,k3s 挂载白裙 nfs/cifs (群晖启动热备 SHR ),以及 openstack 集群部署,挂一些 git server ,ci/cd 之类的服务,稳定性和速度都符合预期,但是模拟故障测试的时候还是很容易搞挂数据(冷备很重要)。 关机和启动这个比较考验运维能力,我自己的设备都配了 ups ,目前从未遇到过意外断电,设备正常是不关的,除非系统升级,这个时候虚拟机级别的服务都是手动启动,也正好验证下系统升级的状态。非要自动启动的话 #12 说的很好,可以按照这种方式搞。 |
16
zxsdadasdq OP |
17
zmcity 197 天前
reply#16 @zxsdadasdq
最后关机的设备上装 NUT 服务器,停电时按关机顺序配置设备的延迟关机时间,这种断电关机方案符合你要求不? 比较难搞的是位于依赖链中间的一台机器意外下线,又没有热备的情况下怎么自动恢复依赖链底层的设备(可能可以尝试配置不断重启? |
19
xiaofan2 197 天前
我靠 存算分离我第一想法是 MQ 的存算分离和大数据的存算分离
|
20
zxsdadasdq OP reply#17 @zmcity
不错, 之后会考虑加 UPS |
21
ZXiangQAQ 194 天前
NFS 挺稳定的啊,我目前方案就是 4 盘位威联通做存储,nuc 装 ubuntu server 使用 nfs 协议挂载 nas 磁盘做视频解码等
nuc 上所有服务使用 docker 启动映射配置目录和数据目录,开机自动挂载 nfs 自动启动 docker nuc 仅做计算,有点类似 k8s 中无状态服务的感觉,断电什么的无所谓,nas 启成功后重启 nuc 就行,而且这个世纪一年都见不到一次断电,至于真断电了,nas 的 raid 也能保证大概率不丢数据 |