http://fixik-papus.livejournal.com/ ([identity profile] fixik-papus.livejournal.com) wrote in [community profile] engineering_ru2015-10-31 07:08 pm

Это, конечно, не Чернобыль и не Фукусима...

Оригинал взят у [livejournal.com profile] fixik_papus в Это, конечно, не Чернобыль и не Фукусима...
... а всего лишь мелкая котельная мелкого торгового центра, да еще и когда морозы и не начинались... но глупость все та же, разница исключительно в масштабах последствий.

Итак, вводная - примерно такой телефонный разговор. Пару недель назад.
- У нас котельная встала нафих, вся целиком и сразу. Можешь посмотреть?
- А сервисники ее куда смотрят?
В ответ следует длинная фраза, которую по нынешним законам РФ в блоге писАть нельзя. Выжимка: некогда им, потерпите, других дел хватает, как сможем - так доберемся до вас.
- Ну тогда могу.

Посмотреть я могу на все что угодно. И вообще я любопытный. Но ничего, кроме "посмотреть", по телефону обещать не буду.

Чуток вздремнув после ночной смены, отправляюсь по указанному адресу на окраине города.
Внутри абсолютная тишина. Вообще ничего не крутится. Весело.
Котельная простейшая. Построено в 2012. И уже сломалось.

На шкафу обнаруживается чудесная переключалка. Такой я никогда еще не видел. Явно нештатная, врезана позже. Заметьте, включено.

DSC_0002319.jpg

Внутри шкафа - тоже ждет сюрприз. Там все на релюшках, и релюшек тех - полсотни с хвостиком.
Вот интересно, и кто же это сообразил в 2012 году такое сделать?

Берем схему, начинаем разбираться.
Разумеется, переключатель в схеме отсутсвует, и для выяснения его назначения пришлось проследить проводочки.
Оказывается, он делает своими двумя контактными группами два дела: гасит сигнализацию и аварийный сигнал в "диспетчерскую" (красная лампочка и звонок в помещении охраны, такая вот диспетчерская) и отключает (замыкает) аварийные цепочки блокировки насосов.
Ладно, хоть в блокировки газового клапана и котловые не полезли.

Хотя, как "не полезли"? Котел - "вещь в себе", в нем внутри все нужное и на случай работы, и на случай аварии. Снаружи он воспринимает один сигнал "горшочек, вари"-"горшочек, не вари", и выдает стандартную пару сухих контактов "работа" и "авария".
Помимо этого, в схему котла воткнут еще какой-то проводок, не предусмотренный заводом-изготовителем...

К чему я тут про Чернобыль вспомнил? Позволю себе чуть-чуть цитат.
"На инструктаже было установлено, что по этой команде одновременно: закрывается пар на турбину;
нажимается кнопка МПА - нештатная кнопка для включения блока выбега в системе возбуждения генератора; нажимается кнопка АЗ-5 для глушения реактора"
"Почему Акимов задержался с командой на глушение реактора, теперь не выяснишь"
А.С.Дятлов. Чернобыль. Как это было


"В INSAG-1 указывалось, что блокировка системы аварийного охлаждения реактора (САОР) явилась нарушением регламента. Однако полученная в последнее время из Советского Союза информация подтверждает, что блокировка САОР на Чернобыльской АЭС была фактически допустима, если она разрешалась Главным инженером, и что такое разрeшение было дано на время проведения испытаний, приведших к аварии, и даже было утверждено в рабочей программе испытаний.»
ЧЕРНОБЫЛЬСКАЯ АВАРИЯ: ДОПОЛНЕНИЕ К INSAG-1 INSAG-7 Доклад Международной консультативной группы по ядерной безопасности"

Русский перевод взят отсюда
Вообще советую почитать. Много разных фактов и мнений, более-менее корректно собранных в одном месте.

Проверяющие-контролирующие органы, говорите?
"Тут должны были вмешаться и пресечь подобные действия представители группы Госатомэнергонадзора, которая работала на ЧАЭС. Но именно в этот день никого из сотрудников этой организации не было, если не считать руководителя, который заходил на короткое время, не успев и выяснить, что происходит, что планируется на 4-м энергоблоке. А все работники надзора, оказывается, в рабочее время в приказном порядке были отправлены в поликлинику, где они весь день проходили медкомиссию. Таким образом, 4-й энергоблок остался и без защиты со стороны Госатомэнергонадзора"
Оттуда же.

Ну, а чо? Если нельзя, но очень хочется, то можно. Тем более, главный инженер разрешил...

Возвращаемся к нашим баранам. При помощи опроса свидетелей (местный слесарь-сантехник, работающий в ТЦ на полставки) пытаемся выяснить хронологию событий... Изучая схему и проводки в шкафу - пытаемся понять, что из-за чего случилось и к чему привело. (никаких логов аварий, и трендов параметров - нету, зато релюшек много).
И через некоторое время - пазл сложился.

Несколько месяцев назад перестал работать насос подпитки №1. Выбивает тепловое реле. Насос ни ревизовать, ни менять никто не торопился, перешли на второй, сигнал аварии от него - отключили, чтобы звонок не надоедал "диспетчерам".

Небольшое лирическое отступление на тему сигнализации аварий. О базовых понятиях "квитирование" и "гашение звуковой сигнализации".
"Квитирование" - означает, что оператор данную аварию увидел, но устранить прям сейчас не может. "Да, я знаю, что расходомер в поверке, и не нужно круглосуточно об этом ругаться".
"Гашение сигнализации" очевидно, полезно, когда ремперсонал, вызванный этой самой сигнализацией, уже прибежал; и дальше сирена над ухом процессу устранения неполадок только мешает.
Это теория. А на практике сделать такую логику на релюшках - несколько проблематично. Потому что релюшек понадобится слишком много. Посему в этой котельной - и не сделано.


Поэтому, когда через некоторое время накрылся прессостат низкого давления исходной воды, который, в частности, блокирует насосы подпитки, чтобы не убить их сухим ходом - обслуживающая организация не придумала ничего лучшего, как врезать эту самую переключалку. Со словами "пока так поработаете, вряд ли одновременно и воды не будет, и подпитка понадобится, а там заменим".

Вскрываем прессостат. Вот такой прессостат, известный по всей стране и выпускающийся еще со времен СССР.
Внутри - отвалился один проводок, идущий от контактной группы до разъема. Чуть потрогал - отвалились и два других.
Холодная пайка.
Видимо, за 56 лет своего существования завод "Орлэкс" (еще один участник "черного списка") припаивать проводки к контактикам то ли так и не научился, то ли давно разучился.
Припаиваю проводки на место - все заработало. По уму неплохо бы поменять (в "белом списке" тут Danfoss и United Electic Controls), но явно не прям сейчас.
Почему "не сейчас"? Во-первых, у меня с собой не имеется подходящего прессостата. Остальные 27 причин значения не имеют.

Следующий шаг - насосы подпитки. На обоих - вышибает теплушки. Звоню обмотку №2, на котором работали до остановки - межвитковое КЗ. Пипец котенку, проще говоря.

- Ребята, а у вас холодную воду не отключали недавно?
- Отключали на два дня, вон там трассу чинили и врезку делали.
Ну, вот и все понятно.

Один насос подпитки неисправен давно. Второй...

Тут стоит вспомнить про Фукусиму.
Как известно, АЭС Фукусима была рассчитана с учетом возможного землетрясения и цунами. По отдельности.
Но никто не подумал, что прибрежное землетрясение часто вызывает цунами. А на "все сразу" - не рассчитали.

При чем это здесь? А вот причем.
Представьте, что в ТЦ на пару дней отключили воду. И холодную, и горячую. Помыть руки при этом все равно хочется. Где воду взять? В сети отопления, вестимо. Все знают, что вообще это нехорошо (и вода там мягкая, моет плохо), но если очень хочется - то немножко можно. Тем более, со слов сантехника, в нескольких местах на батареи вместо кранов Маевского прикручены обычные водопроводные краны. Все удобства, так сказать.

Уж не знаю, разрешил ли это главный инженер, или кто там главный...

Помните? "вряд ли одновременно и воды не будет, и подпитка понадобится."
А вот фигушки. Одно есть следствие другого - а об этом не подумали.

Останов по сухому ходу заблокирован. Воды нет, подпитка включилась. Насос покрутился без воды, перегрелся и помер.

Разбираем второй, он звонится нормально, но не крутится. После чего - разбираем фильтр на исходной воде.
Зачем фильтр и при чем он тут?
Большинство маленьких фильтров ГМО (грубой механической очистки, а не то что Вы подумали) устроены одинаково. Внутри под пробкой - цилиндрик из сетки, который, собственно - грязь и задерживает.
А тут - ни грязи, ни сетки! Куда сетка делась? Развалилась на кусочки, и один из них доплыл до насоса и заклинил рабочее колесо. Вот такой замечательный фильтр.
(также налицо факт, что в фильтр никто давным-давно не заглядывал. Хотя в журналах ППР чистка фильтра, разумеется, отписана 2 месяца назад).
К сожалению, безвестный производитель фильтра не счел нужным ничего на фильтре о себе написАть...


Воду слили, подпитки нет. Встали котлы (у них свой аварийный прессостат), и встали котловые, они же сетевые, насосы (вот нештатный проводок из котлового шкапчика как раз и идет с прессостата НД и отключает насос; к счастью, эту цепь не заблокировали).Насос ГВС оказался более продвинутым, со встроенным термореле, посему по сухому ходу не помер, а просто выключился.
Все, приплыли. Хорошо, на улице еще более-менее теплый октябрь... А если бы это в новогодние праздники было?

Осталось дел на пять минут. Насос подпитки №1 после выковыривания из него остатков фильтра заработал, система маленькая - подпитать недолго, и через полчаса котельная заработ
ала. Переключалка была выключена с указанием больше ее не трогать (уж не знаю, послушают ли), а клиентам было рекомендовано поискать более адекватный сервис. На сим мою аварийную работу на данном "объектике" можно считать законченной.

Только один момент мне покоя не дает.
Сколько еще в разнообразных шкафах и шкафчиках больших и маленьких громадных и безвестных объектов имеется нештатных переключателей?
Сколько перемычек висит на аварийных датчиках, типа "пока так сойдет, а потом когда-нибудь может-быть починим"?
Сколько отступлений от штатной эксплуатации согласовано главными и не очень главными инженерами и не только?

Вот поэтому я категорический противник атомной энергетики.

Думаете, в некоем идеальном забугорье, да на серьезных станциях все лучше? Не угадали. Почитайте Дэвида Локбаума.
Не доросли мы еще до безопасной эксплуатации настолько опасных объектов.
Да и не факт, что дорастем. Увы.

[identity profile] lazy-flyer.livejournal.com 2015-10-31 04:30 pm (UTC)(link)
Сделайте систему, которой сможет пользоваться даже дурак и даже журак не захочет ею пользоваться. (с)

Не доросли. Слишком много умных вокруг.

(no subject)

[identity profile] lazy-flyer.livejournal.com - 2015-10-31 16:36 (UTC) - Expand

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-10-31 17:03 (UTC) - Expand

(no subject)

[identity profile] kazak-ixbt.livejournal.com - 2015-11-01 14:34 (UTC) - Expand

(no subject)

[identity profile] zinker-a.livejournal.com - 2015-11-01 17:56 (UTC) - Expand

(no subject)

[identity profile] boud.livejournal.com - 2015-10-31 17:25 (UTC) - Expand

(no subject)

[identity profile] doxliak.livejournal.com - 2015-11-01 11:41 (UTC) - Expand

(no subject)

[identity profile] doxliak.livejournal.com - 2015-11-01 11:54 (UTC) - Expand

(no subject)

[identity profile] ikaktys.livejournal.com - 2015-11-02 12:15 (UTC) - Expand

(no subject)

[identity profile] kazak-ixbt.livejournal.com - 2015-11-01 14:35 (UTC) - Expand

[identity profile] stas-178.livejournal.com 2015-10-31 04:38 pm (UTC)(link)
Да, деятельный дуралей - серьезная и общемировая проблема.

[identity profile] nemez-06.livejournal.com 2015-10-31 04:44 pm (UTC)(link)
Эта проблема в Германии решается очень просто. За каждой компанией стоит страховка. Открываеш компанию покупаеш страховку. В данном случае вы выставляете большой толстый счёт который переправляется в сервис и их страховую компанию. Независимо кто счёт оплатит страховка берёт на учёт сервисников. При повторном попадалова уже страховка ставит большой и жирный крест на сервисе отказывая им в страховом полисе или увеличивая стоимось полиса и соответсвено занося во всероссийский чёрный список. Всё. Владельцы уже никогда не смогут никаким бизнесом нормально владеть. Как и мастера могут преспокойно потерять свои дипломы. Но здесь это общегерманская школа мастеров решает эти вопросы.

[identity profile] sinclair-sc.livejournal.com 2015-10-31 04:58 pm (UTC)(link)
В России это не работает. Тут регистрируется новое ООО на нового бомжа, и вуаля - чистая страховая история.

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 18:02 (UTC) - Expand

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-10-31 18:15 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 18:24 (UTC) - Expand

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-10-31 18:31 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 18:38 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 19:37 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 20:56 (UTC) - Expand

(no subject)

[identity profile] blush-man.livejournal.com - 2015-11-01 09:55 (UTC) - Expand

(no subject)

[identity profile] izvne.livejournal.com - 2015-10-31 20:32 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 20:55 (UTC) - Expand

(no subject)

[identity profile] ikaktys.livejournal.com - 2015-11-02 12:17 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-11-02 13:29 (UTC) - Expand

(no subject)

[identity profile] nemez-06.livejournal.com - 2015-10-31 18:04 (UTC) - Expand

[identity profile] sinclair-sc.livejournal.com 2015-10-31 04:57 pm (UTC)(link)
Самое интересное, что вы своей быстрой, и, судя по всему, не очень дорогой починкой котельной вряд ли простимулировали хозяев котельной делать всё как надо. Проще сейчас сэкономить, а в случае ЧП какой-нибудь самоделкин всё починит.

[identity profile] e-pipe.livejournal.com 2015-10-31 05:05 pm (UTC)(link)
Тоже вариант, к сожалению...

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-10-31 18:12 (UTC) - Expand

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-10-31 19:49 (UTC) - Expand

(no subject)

[identity profile] bmc938.livejournal.com - 2015-11-01 18:50 (UTC) - Expand

[identity profile] boud.livejournal.com 2015-10-31 05:20 pm (UTC)(link)
Данфосс хорошо, конечно.
Я сегодня вот столкнулся с совершенно необъяснимым случаем поломки хитрой и редко нужной пружины в механизъме, обломки которой заклинили гораздо более важные элементы механизъмы. И вроде в белом списке железяка, и пружина абсолютно ненагружена 99,99% времени, но вот подиж ты. А из-за этой поломки пришлось программно прописывать задержки по срабатыванию аварий, в надежде что увеличение времени на запуске даст нужный эффект... Теперь, на повестке дня, все эти костыли убрать отовсюду.

(no subject)

[identity profile] boud.livejournal.com - 2015-10-31 18:06 (UTC) - Expand

(no subject)

[personal profile] ex0_planet - 2015-11-01 10:22 (UTC) - Expand

(no subject)

[identity profile] wazawai-n2.livejournal.com - 2015-11-07 13:57 (UTC) - Expand

(no subject)

[identity profile] wazawai-n2.livejournal.com - 2015-11-07 14:05 (UTC) - Expand

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-10-31 18:29 (UTC) - Expand

(no subject)

[identity profile] sinclair-sc.livejournal.com - 2015-11-01 04:41 (UTC) - Expand

(no subject)

[identity profile] ikaktys.livejournal.com - 2015-11-02 12:19 (UTC) - Expand

[identity profile] boguang.livejournal.com 2015-10-31 06:15 pm (UTC)(link)
в нефтепереработке снятая блокировка нет-нет встречается. Результатом бывают взорванные печи, разрушенные компрессоры, заваленные резервуары. В инструкциях даже прописывается что делать для снятияблокировки

[identity profile] vadim rumyantsev (from livejournal.com) 2015-10-31 06:24 pm (UTC)(link)
В современном программировании почти всё так устроено.

(no subject)

[identity profile] ermiak.livejournal.com - 2015-11-01 20:48 (UTC) - Expand

[identity profile] cn-mangetsu.livejournal.com 2015-10-31 06:36 pm (UTC)(link)
Переключатель magic/more magic.

[identity profile] antontsau.livejournal.com 2015-10-31 09:24 pm (UTC)(link)
налево выключено, направо сломано

(no subject)

[identity profile] cn-mangetsu.livejournal.com - 2015-10-31 21:41 (UTC) - Expand

(no subject)

[identity profile] antontsau.livejournal.com - 2015-10-31 22:01 (UTC) - Expand

(no subject)

[identity profile] theholm.livejournal.com - 2015-11-02 04:31 (UTC) - Expand

[identity profile] penetrat0r.livejournal.com 2015-10-31 07:10 pm (UTC)(link)
Хоть отблагодарили за траблшутинг? :)

(no subject)

[identity profile] penetrat0r.livejournal.com - 2015-10-31 22:18 (UTC) - Expand

[identity profile] norguhtar.livejournal.com 2015-10-31 08:01 pm (UTC)(link)
Именно по этой причине все современные реакторы строятся так, чтобы снятие управления снаружи приводило к его остановке. Ибо случаи как известно разные бывают.

[identity profile] drpryor.livejournal.com 2015-10-31 08:44 pm (UTC)(link)
Остановка не проблема (ну, кроме CANDU, хехе). И Фуку, и ТМИ были загашены к началу аварии.

Проблема в том, что после остановки реактора за счёт остаточного тепловыделения и накопленногой теплоты продолжается тепловыделение в течение долгого времени - несколько месяцев. С учётом мощности и относительно небольшого объёма активной зоны там накапливается заметное количество энергии. Именно поэтому так важно охлаждение после останова и, официально, именно это проверяли в 86.

Если после останова не охлаждать активную зону, то она расплавляется и девается незнамо куда (как на втором блоке Фуку). В древности считалось, что энерии расплава хватит чтобы кориум провалится с американской станции сквозь Землю насквозь, как показано в знаменитом фильме "Китайский синдром".

(no subject)

[identity profile] norguhtar.livejournal.com - 2015-11-01 05:23 (UTC) - Expand

(no subject)

[identity profile] drpryor.livejournal.com - 2015-11-01 12:37 (UTC) - Expand

(no subject)

[identity profile] drpryor.livejournal.com - 2015-11-01 16:20 (UTC) - Expand

[identity profile] kudincev.livejournal.com 2015-10-31 08:15 pm (UTC)(link)
Как специалисту,хвалю.

[identity profile] tr1gger.livejournal.com 2015-10-31 08:45 pm (UTC)(link)
Надеюсь вам за "посмотреть" нормально заплатили. Такую работу задёшево делать нельзя -- вредно для экосистемы.

В программировании всё не просто так же, а даже есть понятие баланса между идеальным решением и technical debt. Так вот проблема в том, что в программировании идеальное решение обычно требует в 100 раз больше ресурсов, чем среднее, так что для бизнеса идеал вреден. Котельную, насколько я понимаю, можно сделать идеально; а в программировании нет предела совершенству, можно годами полировать одну и ту же систему. Поэтому хороших инженеров нужно наоборот постоянно пинать чтобы скорее завершали своё любодействие и переходили к новой фиче.

[identity profile] areyosi.livejournal.com 2015-10-31 09:19 pm (UTC)(link)
Не совсем в тему но тоже про отопление.
У клиента сложилась безвыходная ситуация.
Санаторий снабжает отоплением, горячей и холодной водой а также отводом канализации несколько жилых домов которые строились ещё при СССР для персонала санатория а ныне там живёт хз кто, санаторию они уже не принадлежат.
Долгое время санатрий не работал.
Теперь работает на полную и обнаружилась проблема что мощность угольной котельной не рассчитана на обеспечение всех потребителей. И если запускают отопление, горячую воду и бассейн то жилые дома остаются с чуть тёплыми батареями и без горячей воды. А что бы наполнить бассейн надо около недели. Воду в нём меняют раз в два месяца. Раньше выходили из ситуации просто, санаторий в зимний период был загружен на 30% и бассейном не пользовались, а значит и не наполняли его водой.
Теперь же заполнение санатория почти 100% круглый год и роспотребнадзор требует что бы бассейн работал круглый год иначе штраф и лишение лицензии на лечебную деятельность. Получается что либо морозить постояльцев и заполнять бассейн но тут же идут жалобы от постояльцев на холод в номерах и электрические обогреватели не спасали положение.
Либо морозить жилые дома но тогда вмешивается прокуратура и требует обеспечить "благами" жильцов. С судами и постановлениями. Жильцы домов платят за отопление и горячую воду по установленным нормативам которые не покрывают расходов.
На все просьбы хозяев санатория и директора о софинансировании для реконструкции котельной с теплосетями к домам или прокладке газопровода что бы поставить газовые котлы ответ у властей один - денег нет.

[identity profile] antontsau.livejournal.com 2015-10-31 09:27 pm (UTC)(link)
нищебродство вульгарис, ничего необычного. ДЕНЕГ НЕТ. Ни разово (на реконструкцию) ни текущим порядком (на тариф, достаточный для такой реконструкции). Гешефт сдувается и в какой-то прекрасный момент просто лопается, все свободны, всех на мороз.

(no subject)

[identity profile] antontsau.livejournal.com - 2015-11-01 07:02 (UTC) - Expand

(no subject)

[identity profile] msmirnov.livejournal.com - 2015-11-01 11:52 (UTC) - Expand
(deleted comment)

[identity profile] 22sobaki.livejournal.com 2015-11-01 09:05 am (UTC)(link)
В следующий раз забаню.

[identity profile] not-a-daughter.livejournal.com 2015-11-01 12:29 am (UTC)(link)
Насчет Фукусимы вы не совсем правы: там обо всем подумали и все рассчитали. Почти. Не учли только то, что при проектировании учесть нельзя - во время строительства сэкономили на дамбе.

[identity profile] snowman222.livejournal.com 2015-11-01 01:15 am (UTC)(link)
у нас твердотопливный котел, насколько помню на 70 кВт был. Сейчас мы к нему добавили 3 секции и теперь их 9.

Два циркуляционных насоса просто втыкаются в розетку. Больше электрических деталей нет. Разве что штатный термометр заменили на электронный терморегулятор, который при превышении заданной температуры подает сигнал на сирену. Подпитка включается краном вручную, рядом с краном манометр стоит. Еще собираемся к видеонаблюдению подключить камеру, направленную на котел.

Как то раз перегрели котел, лопнула передняя секция. Заказали, поменяли. Насколько помню электричество тогда не отключали. Наверно сильно раскочегарили и вовремя не проветрили помещение.

На случай отключения электричества открывается обводной кран мимо насоса, заводится генератор и к нему подключается насос.

[identity profile] dmitriy crane (from livejournal.com) 2015-11-01 09:00 am (UTC)(link)
Так для того и строят ВВЭР крупными сериями (а в Корее вообще унификация между блоками 100%-ная, из-за этого очень мало нештатных ситуаций).
Поэтому и не любят сами атомщики канальные реакторы, потому их и перестали строить у нас.
Так что "не всё так однозначно" с мирным атомом. Атомпром - это вообще область принципиально иного уровня техконтроля, и этот уровень постоянно повышается. И уроки что Чернобыля, что Фукусимы атомщики вполне учитывают.

(no subject)

[identity profile] dmitriy crane - 2015-11-01 11:10 (UTC) - Expand

[identity profile] vitnis.livejournal.com 2015-11-01 09:17 am (UTC)(link)
Хороший рассказ.

Человеческий фактор - наше все.

Пока на свете есть люди, с самоуверенным характером и не допускающие, что могут быть не правы - все будет так.

(no subject)

[identity profile] vitnis.livejournal.com - 2015-11-01 13:41 (UTC) - Expand

[identity profile] stanislav-v-l.livejournal.com 2015-11-01 11:57 am (UTC)(link)
Отличная история, спасибо! :)

Поделюсь подобным из личного (правда из области программизма)
!98?год, вычислительный центр, ЕС ЭВМ (aka IBM360/370). Зовут меня в машзал. Проблема: машина зависает наглухо при нажимании кнопки "СТОП" на принтере. (Кто в курсе как оно аппаратно организовано - каналы ввода-вывода, функционирующие независимо от ЦП - у тех уже брови поползли вверх - типо "это как так?!" :))
Возился где-то с час, читая память с пульта (на ЭВМ, в отличие от ПиСи, была такая возможность:)) Восстановил причинно-следственную цепочку. Восхитился. Восхититесь и вы :)

По нажатию кнопки "СТОП", устройство переходит в состояние "не готово".
Программа канала завершается с битами в байтах состояния "сбой в устройстве, устройство не готово"
Т.е. - это важно - данная ситуация обрабатывается такой "отдельностоящей" частью ОС, называемой "программа обработки машинных ошибок". В ситуации "какая-то проблема с железом" она должна произвести диагностику и решить - можно ли ошибку исправить и продолжить работу.
Памяти мало - в памяти загружен только необходимый минимум от этой программы, остальные части подтягиваются с диска по мере необходимости. Определив тип "проблемного" устройства, программа обработки машинных ошибок пытается подгрузить с диска специфический модуль для данного устройства.
На диске, на дорожке с библиотекой программы обработки машинных ошибок, имеется сбой вида "потеря адресного маркера" :)
В "нормальном" режиме вводом-выводом занимается такая очень развесистая клюква как "супервизор ввода-вывода", который бы легко справился с этой проблемой. Но сейчас уже работает программа обработки машинных ошибок, которая пользуется своим, "топорным", урезанным до предела супервизором ввода-вывода. И он это ошибку просто "не замечает" - в память считывается не та запись с диска, которая была нужна, а следующая за ней :) И эта запись получает управление. Иными словами - управление получает СЛУЧАЙНЫЙ код.
Вполне ожидаемо - программное прерывание.
Программное прерывание - вообще-то рядовая ситуация - мало ли программеры ошибок делают? Но программное прерывание во время обработки машинной ошибки - это ЧП, близко к жопе. Реакция ОС - аварийно завершить задачу, запросившую операцию ввода-вывода, при которой произошла машинная ошибка.
Задачей, запросившей операцию, был КРОС (по-басурмански - HASP - такая "надстройка" над ОС, которая занимается очередями заданий и очередями печати) Его можно остановить командой оператора, а аварийное завершение у него не предусмотрено (типо, считает себя непогрешимым). Его "штатная" реакция на аварийное завершение - уход в глухой цикл под закрытыми масками, т.е. "зависание".

Я тогда впервые задумался, что предусмотреть "правильную" реакцию сложной системы на комбинацию из двух ошибок, невозможно даже теоретически - ввиду необозримого числа таких комбинаций.

Что касается человеков... Чтоб не эмоционировать впустую - человеки (оператор, обслуживающая организация, страховая компания, etc) должны быть в виде квадратиков нанесены на схему системы автоматического управления :) Только, блин, схема после этого становится невдолбенной :) И специалистов, умеющих такую схему спроектировать, хрен найдешь :)

[identity profile] emwave.livejournal.com 2015-11-02 06:59 am (UTC)(link)
Блин, блин... ёпть. Я где-то всегда надеялся, что внедрять самопальные выключатели на стандартном оборудовании адекватные люди не будут. Интересно другое - похоже такое очень распространено???
Теперь понятно почему мне хочется жить в своём коттедже.

[identity profile] h14th.livejournal.com 2015-11-03 09:14 am (UTC)(link)
C атомными станциями проще - они конструктивно делаются так, что взорваться не могут. Фукусима еще более старая чем ЧАЭС, а после неё уже много чего поменялось.

(no subject)

[identity profile] h14th.livejournal.com - 2015-11-03 10:40 (UTC) - Expand

(no subject)

[identity profile] h14th.livejournal.com - 2015-11-03 10:55 (UTC) - Expand

(no subject)

[identity profile] h14th.livejournal.com - 2015-11-03 11:03 (UTC) - Expand

[identity profile] samo-de1kin.livejournal.com 2015-11-05 10:44 am (UTC)(link)
Меня несколько раз спрашивали главные энергетики, для чего деаэратор и сильно удивлялись, что в атмосферном даеэраторе надо держать более 60...70 град. С., чем было у них. А Вы тут про автоматику...