engineering_ru | Зачем нужна Виртуализация? Что привнесла в современный мир?

nicky-boom.livejournal.com posting in

Современный мир информационных технологий немыслим без Виртуализации "всего на свете" - серверов, операционных систем(ОС), сетевых плат(NIC-карт)-(Xsigo), дисковых массивов(NAS,RAID)-(HDS - Hitachi Data Systems).
Однако, мало кто задумывается над тем, что именно привнесла виртуализация в современный IT, и в чём на самом деле её недостатки, а где именно - достоинства.

Начать можно с того, что оказывается было нужно, чтобы появился термин паравиртуализация, который ничего специфического не означает, а лишь описывает некоторую подгруппу виртуализации, в которой исходный код гостевых ОС(тех, которые виртуализируются) был изменен таким образом, чтобы по предоставленному API(законченному набору функций) она могла обращаться к главной ОС(так называемой Хостовой) машине в случае наиболее неотложных операций(выделение памяти, страничный обмен, прерывания от внешних устройств, специфические функции отдельных приложений, требующие максимум hardware-ресурсов за короткий промежуток времени).
Паравиртуализация понадобилась неспроста, так как общеизвестно, что любая программа выполняется в виртуальной машине заведомо медленнее, чем на реальной физической hardware машине(сервере). Происходит это потому, что в виртуальной среде имеется дополнительный "слой", через который гостевая машина обращается к хостовой для выпонения любых операций и невозможно каким-либо образом исключить этот "избыточный" слой задержки. Так вот, придумали, что в случае таких "критических" операций на гостевой ОС - они (операции) передаются по прерыванию в главную хостовую машину и выполняются там, что позволяет значительно ускорить гостевую ОС.

Кроме того, широко обсуждается "мобильность" целой гостевой ОС, то есть возможность миграции(или переноса) по локальной или глобальной сети целой виртуальной машины(или аналога физического сервера), представленной в случае виртуализации в виде всего одного файла .VMDK, правда размером более чем несколько гигабайт. А что именно даёт такая мобильность?

Кроме достоинств, связанных с DR(Disaster Recovery-восстановление после пожара,стихийного бедствия) и BackUp(восстановление на случай кратковременного сбоя), сопряжена такая мобильность и с риском потери именно той актуальной копии данных, которая может понадобиться в любой момент. Другими словами, можно запутаться где именно что - поскольку копий виртуального сервера стало более одной, неизвестно в чём отличие одной от другой, и где наиболее "свежая". Тот, кто хоть немного имел дело с виртуальными машинами и их "резервным копированием" - поймет, как это легко - запутаться в их множестве и/или актуальности на определенный момент в прошлом или будущем.

Вдобавок, существует целый класс серверных приложений, которые нуждаются в Кластеризации. Например, Oracle Grid - кластер из нескольких физических серверов для "распараллеливания" нагрузки на базу данных с одного - на несколько физических серверов.
Не приходится говорить, что не любую ОС возможно паравиртуализировать из-за закрытости кода например, и не все приложения нуждаются в виртуализации, есть такие, которые скорее наоборот хотят "больше есть hardware", чем быть виртуализированными.

Вообще, сложилось у меня впечатление, что виртуализация может быть оправдана(или обусловлена) лишь наличием legacy-hardware(унаследованное железо) и inherited-software(доставшийся в наследство софт). Причем, серверное программное обеспечение, как правило, менее нуждается в виртуализации, в сравнении с настольным ПО, так как оно легко комбинируется в виде NT-сервиса или Unix-процесса (устанавливается с другими приложениями на одном и том же физическом сервере). Зачем же тогда его виртуализировать, заранее предполагая потерю его производительности, связанную с выполнением в виртуальным домене, в котором всё эмулируется - память, процессор, жёсткий диск, сетевая плата?

Flat | Top-Level Comments Only

From:

ichskh.livejournal.com

Смешалось все в доме Облонских :) Вообще говоря, виртуализация - это отделение аппаратного уровня от уровня ОС. В общем случае оно работает на принципе многое со многим. То есть Не обязательно иметь несколько ОС на одной железке или одну ОС на нескольких железках, лучше иметь много ОС на многих железках и при этом динамически распределять нагрузку между системами.

При этом я бы на месте автора я бы был поаккуратнее с лидерами в тех или иных областях. Потому что я, например, плохо знаю, что такое Hitachi Data System, но вот намного лучше знаю что такое EMC Avamar. Про виртуализацию сетевых подключений я тоже промолчу.

Собственно, все что описано автором, является просто частными случаями применения разделения аппаратуры и ОС. В том числе это распределение нагрузки, возможность переноса виртуальной машины между разными датацентрами.

Да, по поводу DR. Здесь как раз виртуализация имеет лишь ограниченные преимущества. Дело в том, что для обеспечения DR средствами виртуализации необходимо виртуальную машину разнести по разным серверам, находящимся в разных датацентрах (ведь нет смысла работать в рамках одного, иначе какой это DR). Так вот эта необходимость влечет за собой необходимость иметь довольно быстрый канал связи между этими датацентрами. Причем быстрый не в терминах толщины, а времени отклика. Ну и из чистой физики-инженерии, эти датацентры должны распологаться очень близко, вроде как не дальше чем 20-30 километров друг от друга, иначе задержка репликации будет слишком большой.

В случае с бэкапом виртуализация тоже не применима. Бэкап проще делать на уровне приложений-файлов, но не образов ОС. С образами ОС невозможно делать инкрементальный бэкап, а полный бэкап занимает слишком много времени и места. Обычная политика бэкапа подразумевает полный бэкап на еженедельной либо ежемесячной основе, а ежедневно выполняется только инкрементальный.

From:

alex9876543210.livejournal.com

Дело в том, что для обеспечения DR средствами виртуализации необходимо виртуальную машину разнести по разным серверам, находящимся в разных датацентрах (ведь нет смысла работать в рамках одного, иначе какой это DR).
Типа "если жениться то на королеве" :D

Причем быстрый не в терминах толщины, а времени отклика.
хум хау как говориться

С образами ОС невозможно делать инкрементальный бэкап
Можно

From:

ichskh.livejournal.com

http://en.wikipedia.org/wiki/Disaster_recovery

Посчитайте, сколько раз в тексте употреблено выражение "off-site". Собственно дальше обсуждать что-либо бессмысленно.

From:

alex9876543210.livejournal.com

Посчитайте, сколько раз в тексте употреблено выражение "off-site".
off-site не означает реплику vm в другом дц, в частности оттуда
backups made to tape and sent off-site at regular intervals
да и реплика может быть какого-нибудь скуля на вполне себе железке без каких-либо виртуалок
ваш кэп :D

Собственно дальше обсуждать что-либо бессмысленно.
с вами про бэкап вируталок? согласен

From:

ichskh.livejournal.com

Речь вроде о применении виртуализации в disaster recovery, а не об отсылке ленточек в какой-нибудь Iron Mountain.

From:

alex9876543210.livejournal.com

вы предложили посчитать сколько раз употреблено конкретное слово
а оно оказывается вовсе не про виртуализацию и/или репликацию

ума не приложу нафига локальной конторе работающий сервер в другом дц, если у них офис смыло
а вот восстановиться, пусть и с скажем часовым отключением, на второй железке в другом углу здания после пожара в первой серверной, да что там, в соседней стойке после выхода из строя рейд контроллера - это для вас мелковато конечно, отсюда и говорю про "королеву"

а не об отсылке ленточек в какой-нибудь Iron Mountain
во во, опять "королева" :D

Edited Date: 2014-01-31 07:36 pm (UTC)

From:

ichskh.livejournal.com

"нафига локальной конторе работающий сервер в другом дц"
Потому что можно взять ноутбук, подключиться к работающему серверу хотя бы по публичным каналам и продолжать работать. К тому же сервер может обслуживать не только "локальную контору", но еще внешних клиентов (интернет-магазин) либо другие офисы.

"на второй железке в другом углу здания после пожара"
Железка не обязательно одна, их может быть два-три десятка, все подключить сложно. Если они еще работают совместно, то могут возникнуть с целостностью данных.

Пожарные при входе в здание первым делом отключают электричество, возможно, всю подстанцию, а если у вас два-три ввода в датацентр, то и их тоже. Неизвестно, насколько после пожара вообще можно будет включить здание. DR рассматривает разные риски, в их число могут входить не только пожары, но и потопы, селевые сходы и прочие риски.

"после выхода из строя рейд контроллера"
Это не Disaster Recovery, это Service Continuity.

From:

alex9876543210.livejournal.com

Потому что можно взять ноутбук, подключиться к работающему серверу хотя бы по публичным каналам и продолжать работать
максимализм - ваше всё, я понял

Если они еще работают совместно, то могут возникнуть с целостностью данных.
чего это на разнесённых на километры не возникает, а тут обязательно возникнет?

Пожарные при входе в здание первым делом отключают электричество, возможно, всю подстанцию, а если у вас два-три ввода в датацентр, то и их тоже
и тут космические масштабы
и я говорил по ДЦ?

Это не Disaster Recovery, это Service Continuity
тоже на вики сошлюсь
http://en.wikipedia.org/wiki/IT_service_continuity
IT Service Continuity is a subset of Business Continuity Planning (BCP) and encompasses IT disaster recovery planning and wider IT resilience planning
Видимо замена контроллера - это resilience planning

http://www.symantec.com/security_response/glossary/define.jsp?letter=d&word=disaster-recovery
site disaster - только один из вариантов, а "Recovering data from backups after a disk crash or other catastrophe." вас вообще наверно приводит в ужас своей мелочностью :D

Edited Date: 2014-01-31 08:20 pm (UTC)

From:

ichskh.livejournal.com

Если у вас десять серверов приложений и десять серверов баз данных, то бэкап не может происходить абсолютно синхронно. Поэтому если происходит аварийное отключение оборудования, то, вынимая данные из бэкапа, сложно получить одновременный срез данных. Если же у вас репликация в реальном времени, то данные будут целостноми с высокой долей вероятности.

Вообще же бэкап он не для восстановления системы, а скорее для восстановления случайно утерянных данных.

Resilience planning - это resilience planning. Не надо выдумывать что-то новое и приписывать что-то к чему-то. Упавший RAID - это Service Continuity, читайте ITIL и COBIT, благо оба можно найти для прочтения даже на русском языке.

Зачем нужна Виртуализация? Что привнесла в современный мир?

(frozen) (no subject)

Page Summary

Style Credit

Expand Cut Tags