Расчет Емкостей

RomTech- Переделка АС Электроника АС-75 - установка других

Не знаю почему так получилось, но в тестировании, на мой взгляд, незаслуженно мало внимания уделяется анализу ошибок, того откуда и как они происходят, насколько катастрофичными они могут быть. Что, казалось бы, довольно странно - люди, работа которых искать ошибки, в первую очередь учатся кодить, болтать, мечтать стать менеджером и нараспев орать с табуретки набор заученных догматов-методологий (а как их иначе называть, если подкоркой не интересуемся?).

Для начала возьмем довольно старую и популярную модель, успользуемую для анализа рисков и управления ими - модель "швейцарского сыра". У нее (как и у любого обобщения) есть ряд недостатков, но она очень крутая в педагогическом плане. Про недостатки можно будет побеседовать потом, пока просто опишу что она из себя представляет.

Если вкратце, то модель представляет нам любую мало-мальски сложную социально-техническую систему в виде нескольких слоев швейцарского сыра, которые постоянно крутятся. Каждый слой сыра это своего рода барьер, которым организация/система пытается отгородиться от ошибок. Дырки в сыре это персональные недостатки того или иного куска системы - они все время меняются в размерах и перемещаются по различным кускам сыра. И когда все они совпадают происходит следующее:

Дырки в сыре так же принято классифицировать как латентные и активные ошибки.

Чтобы было понятнее - разберем на примере.

Допусим у нас есть четыре слоя сыра:

  • Планирование
  • Код
  • Обучение
  • Сервера

На каких-то серверах не мониторится I/O. Это типичная латентная ошибка, т.к. сама по себе она проблему вызвать не может, но если что-то внезапно случится, то мы просто не сможем на этой стадии предотвратить проблему и все жахнет. И, скорее всего, пока не жахнет - эта ошибка будет существовать. Последнее, кстати, является крайне неприятным свойством латентных ошибок, но умный менеджер знает как с такими штуками бороться. Запишем эту ошибку:

  • Планирование
  • Код
  • Обучение
  • Сервера (не мониторим I/O - латентная ошибка)

Продолжим разбор гипотетического инциндента дальше.

Допустим группа умных людей немного ошиблась на стадии планирования емкостей и завизировала кривые расчеты у начальства. Получаем еще одну латентную дырку:

  • Планирование (ошиблись в расчетах емкостей - латентная ошибка)
  • Код
  • Обучение
  • Сервера (не мониторим I/O - латентная ошибка)

Все еще мало для катастрофы. Давайте добавим еще немного.

Пусть у нас тотальный непрерывный деплой и парочка unit-test'ов из тех, что прогоняются перед выкладкой кода на сервер ближайшие 20 минут не прогонятеся, т.к. рефакторится или находится в еще каком переходном состоянии. Ну бывает. Это непонятная ошибка, пусть будет латентная.

Еще кто-то взял и немножко нарушил стандарты кодирования. Наговнокодил, другими словами. Тоже бывает. Латентная ошибка.

А еще кто-то взял и зафигачил в код большой такой, сочный баг, который приводит к тому, что при вызове какой-то функции адово абузится запись на диск. Самая что ни на есть активная ошибка.

И чтобы жизнь медом не казалась кто-то намудил с фиче свичами перед выкладкой и открыл наружу вызовы той самой волшебной API и по ней автоматом обновилась дока. Опять активная ошибка.

Возможно, вам понравится:

ELCUT: Расчеты емкости: Часть 1 (3)‪
ELCUT: Расчеты емкости: Часть 1 (3)‪

На Камчатке раздавило рабочего 50-тонной цистерной с цементом  — Mail.Ru
Петропавловск-Камчатский, 29 октября — АиФ-Камчатка. В ночь на 29 октября спасателям удалось разобрать завалы на месте падения ёмкости элеватора на бетонном заводе в Вилючинске. Под ней было обнаружено тело 28-летнего местного жителя.

Мужчина погиб под завалом обрушившегося элеватора с 30 тоннами цемента на Камчатке  — Interfax Russia
На месте происшествия работали 22 человека: оперативная группа Вилючинского гарнизона пожарной охраны, два пожарных расчета от местной пожарной части и два подъемных крана. Как сообщалось .. По данным МЧС, угрозы дальнейшего обрушения элеваторных емкостей нет.


Похожие страницы: