AI大牛李沐装机视频来了!你也能练100亿的大模型(2)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
装机步骤
装机清单完成后,接下来就是具体的装机过程了。步骤如下: 首先放GPU。注意,放的过程中一定不能用手碰金属的地方,如果有静电的话非常容易造成GPU导电。 把GPU放进去之后,把螺丝拧上。然后把风扇装进去。 插上电源后,把电源线和水管线绑在一起。然后把NVLink的桥给连上去。 最后连上电源,机器就可以运行了。
压力测试
在装机完成后,下一步的任务就是继续装上操作系统。 沐神装的是ubuntu22,装上之后就靠远程连上去了。 当然了,沐神也是把各种情况说的比较详细,除了ubuntu22以外,windows和linux在不同的需求下也是可以的。 这里沐神用的SSH进行的远程连接。 沐神的系统已经装上了驱动,同时,他也指出如果还没有驱动的话,也可以用apt-get装上nvidia-driver-515。 装好之后,就可以运行nvidia-smi,看到系统了。 从中可以看到各项信息。比如GPU的数量、温度、瓦数、内存使用等等。 接下来还可以通过nvidia-smi的topo-m矩阵看到nv-link是否正常。 可以看到两个GPU由NV4连接。4表示4个通道,这就代表连接是正常的。 下一题,是测试系统在满负荷的情况下的温度。 沐神表示,测试GPU的是一个叫gpu-burn的小程序,github上可以下载。 这里沐神模拟跑了十分钟,也是看到了两个GPU的温度。沐神还打趣说,都能感觉到GPU在呼呼吹热风。 同理,CPU也可以用这种办法测试温度,用的是cpu-burn。 最终两个GPU的温度停留在58度和55度,功耗拉到了440多瓦(满功耗480瓦),还挺好的。 最后的一项参数是机器的耗电情况。沐神的测试大概用了1240瓦,意味着每小时用电1.5度。 从目前的数据来看,稳定性还ok。 至于用这台机器跑Transformer性能怎么样,还得等下期视频了。
网友热评
视频发出后,b站的网友也表示出了极大的兴趣。99科技网:http://www.99it.com.cn
