Cumulus 5.11.0 確認した追加、変更点のご紹介
Nvidia Cumulus Linuxの5.11.0が2024年末にリリースされました。
NVIDIAのEthernetスイッチのOSが、ONIXからCumulusに移行することになり
弊社では、お客様向けにハンズオン形式のトレーニングを開催しておりますが
提供している内容は
弊社の技術コラムの「NVUEツールでの初期設定方法」と同様のCumulus5.8を
ベースにしております。
このため、Cumulus5.11.0での追加や変更点が、弊社がご提供している
トレーニングの内容に関わる部分に関して確認しましたので、ここでご紹介させていただきます。
また、併せてトラブルシューティングに便利なコマンドも紹介いたしますのでご参考にして
いただければ幸いです。
=====================================
======================================
——————————————————————————-
——————————————————————————-
Cumulusのmgmt(eth0)は初期設定(Default)は、DHCPとなっております。
DHCPを解除してIPアドレスを設定する必要があります。
$nv unset interface eth0 ip address dhcp DHCPの解除
$nv config apply 変更の反映
——————————————————————————-
2.NCLUコマンドが削除されました
——————————————————————————-
Cumulus5.8までは参照用に一部のNCLU(#net show等)コマンドが
使えておりましたが、完全に削除されました。
——————————————————————————-
3.工場出荷状態に戻すコマンドが搭載されました。
——————————————————————————-
Cumulus5.10まではスイッチを初期化するコマンドがありませんでしたが5.11になり搭載されました。
■工場出荷状態(初期状態)にするコマンド
$ nv action reset system factory-default
This operation will reset the system configuration, delete the log files and reboot the switch.
Type [y] continue.
Type [n] to abort.
Do you want to continue? [y/n] y yで初期化されます
●以下のオプションがあります。
$ nv action reset system factory-default keep basic
アカウント、パスワードはリセットされないが、管理ポートの設定はDHCPに戻り、 hostname,Timezoneなどは初期化される
$ nv action reset system factory-default keep all-config
スイッチ本体は工場出荷時のデフォルトに初期化されますが、すべての設定は保持されます
$ nv action reset system factory-default keep only-files
システムファイルとログファイルは保持されますが、アカウント、パスワードなどのローカル設定は初期化され、管理ポートもDHCPに戻ります。
工場出荷時設定へのリセットの実行中に問題が発生した場合、スイッチは以前の構成に戻り、例外とエラーがログに記録されます
——————————————————————————-
——————————————————————————-
搭載しているモジュール(トランシーバ)の情報取得が細かくできるようになりました。
——————————————————————————-
——————————————————————————-
スイッチのリソースを制限する設定ができるようになりました。
——————————————————————————-
——————————————————————————-
特定のポートを高速にリンクアップできる設定が追加されました。
——————————————————————————-
——————————————————————————-
トラブルシューティングに便利なコマンド類が追加/変更になってます。
以前から使えたコマンドも合わせて紹介します。
7-1 ログに関して
ログは、#sudo cat /var/log/switchd.log で確認できます。
Switchdより記録されるメッセージの概要に関して、以下のサイトにリファレンスがあります。
役立つコマンドガイド 各種コマンドのリファレンスが以下にあります。
7-2 スイッチの健康状態確認
$ sudo cat /var/log/syslog |grep smond
7-3 smonctl
7-4 sensors / ledmgrd/pwmd
7-5 スイッチハードウェア状態確認コマンド
7-6 各ポートの詳細情報確認
7-7 トランシーバの詳細情報確認
7-8 各ポートのトラフィック状態確認
#watch -d
7-9 MFT(Mellanox Firmware Tool) が使えます。
ConnectXシリーズでお馴染みのMFTツールを使ってトラブルシューティングができます。
7-10 ethtoolも使えます
7-11 WJH(What JustHappen)
Nvidiaスイッチ独自機能の障害発生時の切り分けに有効なツールであるWhat Just Happenedも使えます。
——————————————————————————-
——————————————————————————-
——————————————————————————-
——————————————————————————-
——————————————————————————-
10.削除されたNVUEコマンド
——————————————————————————-
——————————————————————————-
■おまけ
——————————————————————————-
Cumulusを初めて触れる際に、皆様が戸惑うのがBrideという概念です。
これに関して、Nvidiaのナレッジサイトにて解説が掲載されてますので
ご参考にしていただければと思います
==================================
Bridgeはレイヤー 2 スイッチであり、Linux ベースのネットワークに不可欠な要素です。
ネットワーク エンジニア向けにBridgeとは何か
Cumulus Linux 内でブリッジを使用する方法、
および現行ベンダーの構成内に隠れているブリッジの例についての概念を解説してあります。
==================================