IT办公室的故事 2024-07

in #hive-1050178 months ago


图片源自:https://www.pexels.com/

今年是我第一次购买DELL的设备,这也是我并入校方IT后最大的一个变化。以往管理的设备都是HPE的。

随着数据中心中所有的零部件都在老化。三年前我便向院长提出更新系统,不过那时候正直疫情初始,所有的资金都转到网络教学上面去了,根本没有钱管理数据中心的事情。

直到去年,预算一点都没有恢复正常,但是设备的老化已经开始影响正常运营了。也正是因为这一点,我一个人没有时间管理经常出问题的系统和对具体用户的服务;才转到了校方。

但是,更新设备的钱还得院里面出。和三年前不同的时,当时只是没有周转的资金,而现在这是既没有周转的资金,也遇到了所有商品通货膨胀。

要说当时工资是工程院发放的时候,我跟院里面说要钱买设备。一个个从院长、副院长,到各个系主任。都愁眉苦脸的哭穷。硬逼着我维护将近十年的设备。

现在我到了校里。同样是我这个人,同样是我提出的更新设备的要求,花销还要比以前多出甚多。但是院里面二话没说掏出我当年要的四倍的数目,连眼都没有多眨一下。让我心里稍微觉得有些不平衡。

不过无所谓了,反正买新设备了。不用天天提心吊胆的了。

买戴尔的产品和原来惠普有些不同。HPE的产品要便宜些,而且从送货到安装很快,一个月已经上完事。戴尔则慢了很多。我们下单还是去年初冬的事情,到现在还在纸箱子里面放着,没有安装。

不过购买戴尔时,他们会被我们上万的培训积分。这是原来惠普没有的。原来新设备正式上线之后,我们需要自己在产品官网上学习,实践中掌握管理的经验。现在我们可以在系统安装前接受培训。

这周我就在上戴尔的培训课。我的同事们也利用这个机会轮流脱产学习。

话说,同事在家上课的时候,不断出现他管理的事情。昨天他的领导,我义不容辞的替他解决事情。这次轮到他替我出马了。我心里还说,这礼拜同事有点倒霉。因为我和我的老板同时上课。他要管的时间还有点多。

上课第二天,我们都在家里听讲。

突然间,老板给我发来一条消息。说我们的vCenter虚拟中心一半的节点都下线了。同事不知道怎么处理。

登录虚拟中心,我立刻问道:“校区是不是刚刚断电了?”

这就是经验吧?我们这堆早该淘汰的设备,哪里突然间不工作都能马上猜出原因。

答案是肯定的。学校的电力刚刚恢复。我在办公室的电脑还是关机状态。

求在学校的人帮忙打开我的电脑。所有登录断掉节点的连接方式和许可都在那台电脑上呢。

我们使用的是惠普的Synergy 12000。在去年年底也是因为一次断电,烧掉了一个管理控制板,以至于从新启动之后需要手动启用。当时我们已经向戴尔购货、交钱了;所以就没有再准备花钱换惠普的零件。

没成想半年过去了,那个断电不会自己动的系统还在运行中。

知道不工作的原因,修理的过程就很简单。登录后端,手动启用系统。Synergy开始正常运转。

不过过了很久,节点还是没有正常运作。正在我查找原因的时候,同事也发现了当前的问题。

对于数据中心里面的老设备,他是一无所知,只能靠我来处理。查找系统数值的时候,我发现六个电源中,有五个现在在报错。只有一个勉勉强强在支撑着整个系统的运转。

难怪呢,电力不足,节点都没有启动成功。

这下有点麻烦,自从我们收到戴尔邮寄过来的设备之后,我们就切断了惠普这边的维护合同。现在绝对不可能在同一天搞到新的电源替代部件。

这一下午,我的课是几乎都没听。

同事问我有什么补救的办法。

我想了想说:“有时候惠普的电源在一长段时间断电之后,会残留上一次断电的错误信息。即便感受到240V的电压了,还不能自动清楚过去的错误警报。我猜有可能那五个电源其实没坏。之不是自己还以为没有电,所以不接收。”

同事问我需要怎么做。我们都知道我在上课,不可能现在跑去学校。

我说:“把电源都拔出来,硬重置一下模块的内存。”

他立马说,去学校弄电源去。

这时候,我才知道原来我们在家上课,同事也撤溜子没去办公室……

好吧,小问题,先不管这个了……

半小时之后,同事给我们发来消息,感觉有两个电源开始工作了,上面的红灯变成了绿灯。

我则开始在后端给所有的节点开机。

二十分钟之后,所有的电源恢复正常。整个虚拟中心再一次生龙活虎起来。

同事很兴奋,问我还需要检查什么吗?

我笑了笑说没有了。说你可以回家了,我继续听课。

同事听说能回家,更加高兴了。说还是我有经验抢修这些老旧的设备。

嗯……是啊,经验。和数据中心的设备打了半辈子的交道了。感觉现在还没有被AI淘汰的原因就是我的经验比AI学习的数据还多一些,她还代替不了我……