悪い予感は当たる<祭日の次の日はシステムトラブルに注意> [oz日記]
昨晩から悪い予感がしていて、眠れなかったのは、今日の午前中に予定されていた収録の際にトラブルが発生するのではないかと気になったからです。
案の定、朝からシステムトラブル、通信トラブルが発生し、やれメールが開けない、やれサーバからデータがダウンロードできない、などなどのトラブルが発生、あっちこっちで怒りの声が上がっていました。
システム入替の基本は連休に行うこと。連休全部を使うのではなく、初めの数日だけで完結すること。システムを戻す可能性があることを考えると入れ替えてすぐに稼働確認を実施する。問題なければ「無事完了」、ダメだったらすぐに元のシステムに戻す。
もちろん、戻したプログラムもきちんと稼働するか確認が必要。そのために、各部署から最低1名は休日出勤してもらって、立ち上げとシステム稼働の状況を確認してもらう。
当たり前の入れ替えスケジュールを最近は守っていないとしか思えません。
まぁ、きちんとやっているなら、こんなに頻繁にシステム障害は発生しないはずだが。
少なくともユーザーが気が付かない間にシステムがアップグレードされているのがベストと考えて、入替・更新スケジュールを設定しましょう。
私がSEをしていて、大規模なシステム入替があった時は必ず大型連休の最中でした。だから本当に若い頃は5月の大型連休は休んだことがなく、システム入替の実施及び現場担当者としてのシステム稼働確認を行っていました。
日本の場合、年末年始の連休と5月の大型連休は誰しも休み、銀行などもATMを止める絶好の機会でしたので、私の場合、部署で一番若いことも加わり、5月の連休は毎回立ち会っていました。
初めて現場部署に配属になった際、会社からIBMの研修に行かせてもらい、SEの基礎教育を受けたため、いつまでも「システムに強い小津」となって、こういう役回りになっていました。
話を元に戻すと、簡単なことだと思って祭日にシステムをいじるのはやめてほしい。
2月はたまたま週日に祭日が2回(11日と23日)ありましたが、年度末に行き詰まらないよう今のうちに実施しちゃえなんて思っているとしたら、困ったものです。
こうして朝から混乱が起こった結果生じた損失を考えているとは思えません。
そういう意味では、システム部署のトップには、システムに強い必要があるものの、経営的視点でシステムの運営やアップグレードのスケジュールを考えられる人を選ぶ必要があると思います。
<参考写真:本日の昼食はチキンカツ>
2021/02/24<曇>
案の定、朝からシステムトラブル、通信トラブルが発生し、やれメールが開けない、やれサーバからデータがダウンロードできない、などなどのトラブルが発生、あっちこっちで怒りの声が上がっていました。
システム入替の基本は連休に行うこと。連休全部を使うのではなく、初めの数日だけで完結すること。システムを戻す可能性があることを考えると入れ替えてすぐに稼働確認を実施する。問題なければ「無事完了」、ダメだったらすぐに元のシステムに戻す。
もちろん、戻したプログラムもきちんと稼働するか確認が必要。そのために、各部署から最低1名は休日出勤してもらって、立ち上げとシステム稼働の状況を確認してもらう。
当たり前の入れ替えスケジュールを最近は守っていないとしか思えません。
まぁ、きちんとやっているなら、こんなに頻繁にシステム障害は発生しないはずだが。
少なくともユーザーが気が付かない間にシステムがアップグレードされているのがベストと考えて、入替・更新スケジュールを設定しましょう。
私がSEをしていて、大規模なシステム入替があった時は必ず大型連休の最中でした。だから本当に若い頃は5月の大型連休は休んだことがなく、システム入替の実施及び現場担当者としてのシステム稼働確認を行っていました。
日本の場合、年末年始の連休と5月の大型連休は誰しも休み、銀行などもATMを止める絶好の機会でしたので、私の場合、部署で一番若いことも加わり、5月の連休は毎回立ち会っていました。
初めて現場部署に配属になった際、会社からIBMの研修に行かせてもらい、SEの基礎教育を受けたため、いつまでも「システムに強い小津」となって、こういう役回りになっていました。
話を元に戻すと、簡単なことだと思って祭日にシステムをいじるのはやめてほしい。
2月はたまたま週日に祭日が2回(11日と23日)ありましたが、年度末に行き詰まらないよう今のうちに実施しちゃえなんて思っているとしたら、困ったものです。
こうして朝から混乱が起こった結果生じた損失を考えているとは思えません。
そういう意味では、システム部署のトップには、システムに強い必要があるものの、経営的視点でシステムの運営やアップグレードのスケジュールを考えられる人を選ぶ必要があると思います。
<参考写真:本日の昼食はチキンカツ>
2021/02/24<曇>
oz所長、こんにちは
なんとかの法則ではないですが、システムトラブルって、あっては困る日に限って発生するもんですよね。
システムが複雑になりすぎたからなのか、最近は銀行や航空会社でもシステムトラブルが発生しています。
もはや、発生することを前提に、問題発生時の対応策も考えておくべきですよね。
by くるりん (2021-02-25 08:42)
くるりんさん、
何とかの法則そのものですね。
嫌な予感って、本来は当たっちゃいけないのに
最近はよく当たります。
問題発生時の対応マニュアルを作っていますが、
それ自体も目的化していて、「本当の仕事は何?」
状態ですよ。。。
by oz (2021-02-25 20:57)