Слово "Грид" - это не аббревиатура, его дословный перевод с английского - "решетка", "сетка". Термин "Грид" был предложен Яном Фостером (Ian Foster) и Карлом Кессельманом (Kаrl Kesselman), авторами первой книги об идее использования компьютерных сетей для решения задач, требующих особо больших вычислительных ресурсов, и объясняется некоторой аналогией с электрическими сетями (Pоwer Grid).
Pоwer Grid - сеть электропитания, распределенный ресурс общего пользования, построенная таким образом, что каждый может легко подключиться через розетку и взять электричества, сколько ему требуется, не задумываясь о том, откуда это электричество "пришло".
Грид или Грид-инфраструктура
Это распределенная программно-аппаратная компьютерная среда, с принципиально новой организацией вычислений и управления потоками заданий и данных.
Такая компьютерная инфраструктура предназначена для объединения вычислительных мощностей различных организаций. На основе технологии Грид (грид-технологии) осуществляется интегрирование региональных и даже национальных вычислительных компьютерных инфраструктур для создания объединенных интернациональных ресурсов, предназначенных для решения крупных научно-технических задач. В Гриде предполагается интегрировать большой объем географически удаленных компьютерных ресурсов. В идеальном случае пользователю не нужно знать, где находятся используемые им ресурсы (в этом и заключается аналогия с сетью электропитания).
Современный статус вычислительных инфраструктур можно сравнить с состоянием электрических систем в самом начале ХХ века. Тогда практически каждый пользователь электроэнергии применял свой собственный генератор. Революционным шагом было возникновение электросетей, создание технологий передачи и распределения электроэнергии, организация стандартизованной службы универсального и гарантированного доступа к электричеству. Если какая-то электростанция перегружена потребителями, в таких сетях электроэнергия автоматически перебрасывается от недогруженных станций.
Аналогичным образом работают компьютерные кластеры (кластер - совокупность компьютеров, соединенных определенным образом, в качестве кластера может выступать и один персональный компьютер) в сетях Грид. В случае перегрузки кластера задачи автоматически перебрасываются на свободные кластеры. Таким образом, Грид - это технологии с гибкой и мощной вычислительной средой, которая может рассматриваться как эволюционное продолжение Интернета. В этом представлении Грид играет такую же роль для вычислительных ресурсов, как и Всемирная Паутина WWW для свободного доступа в сети к документам, содержащим информацию.
Концепция Грид
Базируется на следующих основополагающих моментах: быстрое и постоянное увеличение производительности микропроцессоров массового производства. Современный персональный компьютер на базе процессора сравним по скорости вычислений с суперкомпьютерами 10-летней давности; появление скоростных оптоволоконных линий связи. Сегодня в развитых странах базовые линии связи в сети Интернет имеют пропускную способность 10 Гигабит/с и выше, а подключение к сети многих научных организаций происходит на скорости в 1-2 Гигабит/с; феномен Интернета, глобализация процесса обмена информацией и интеграции мировой экономики; непрерывное совершенствование технологий и средств информационной безопасности.
По сути, Грид является "надстройкой" над Интернетом. Ее основное назначение - организация распределенных вычислений для решения серьезных задач науки и технологии, которые требуют больших вычислительных ресурсов, а именно, мощности компьютеров, ресурсов хранения данных, времени вычислений. В отличие от бесструктурной Паутины WWW, решетка Грид - строго упорядоченная система. До некоторой степени условно Грид можно назвать вычислительным Интернетом.
Пользователь, подключаясь к Гриду, получает доступ к мощи тысяч машин, на которых он может осуществлять вычисления и хранить как огромные массивы данных, так и информацию, полученную в результате их обработки. В этой сети уделяется первостепенное внимание проблемам безопасности – ведь анонимность, удобная при общении в Интернете, может стать чрезвычайно опасной при работе с научными или практическими данными. Запрашивая какую-либо информацию в глобальной базе данных Грида, пользователь получит исчерпывающий ответ на вопросы об ее достоверности, полноте и доступности.
Известно, что сейчас в мире около 500 млн. персональных компьютеров, однако, в среднем используется всего лишь 15% вычислительных ресурсов! Система грид-вычислений (Grid Computing, грид-компьютинг) позволит более эффективно использовать имеющуюся базу вычислительных ресурсов.
Виртуальные организации
В компьютерных Грид-системах различные организации, имеющие общие научные или практические интересы, на добровольной основе создают объединение, которое в грид-технологиях называется виртуальной организацией (ВО). Участники ВО связаны между собой с помощью Интернета таким образом, что их вычислительные мощности объединяются. Система включает в себя вычислительные ресурсы и ресурсы хранения данных, но при этом каждая организация контролирует использование своих ресурсов. Пользователи могут получать практически неограниченные ресурсы для вычислений и хранения данных, не задумываясь об их происхождении. Каждый из участников ВО предоставляет свои вычислительные ресурсы (или их часть) для использования другими участниками и, в тоже время, получает доступ к ресурсам других участников ВО.
Примером наиболее развитой ВО является организация WLCG (Worldwide LHC Computing Grid, http://lcg.web.cern.ch ), которая координируется в международном центре ядерных исследований ЦЕРНе (Женева, Швейцария, http://www.cern.ch/ ). Она объединяет сотни компьютерных центров во всем мире, несколько десятков тысяч современных мощных компьютеров. Задача WLCG - обработка и анализ беспрецедентного объема (около 15-20 Петабайт в год, 1 Петабайт=1015 байт) экспериментальных данных, которые будут поступать с наибольшего в мире ускорителя элементарных частиц и ядер LHC (Large Hadron Collider). Ускоритель начнет работать в ЦЕРНе в 2008 году.
Проект EEGE
В Европе успешно осуществляется проект EGEE (Enabling Grids for E-sciencE, http://www.eu-egee.org/ ), в котором 90 участников из 32 стран. Проект финансируется Европейским Союзом, за четыре года существования бюджет EGEE составил около 100 млн. евро. Его цель - создание в Европе круглосуточно работающей Грид-инфраструктуры, объединение и организация вычислительных ресурсов для решения исследовательских и практических задач.
Среди основных задач, решаемых с помощью Грид-технологий, на данный момент можно выделить: организация эффективного использования ресурсов для небольших задач, с утилизацией временно простаивающих компьютерных ресурсов; распределенные супервычисления, решение очень крупных задач, требующих огромных процессорных ресурсов, памяти и т.д.; вычисления с привлечением больших объемов географически распределенных данных, например, в метеорологии, астрономии, физике высоких энергий; коллективные вычисления, в которых одновременно принимают участие пользователи из различных организаций.
Важно подчеркнуть, говоря об использовании грид-технологий, что они позволяют не только решать научные и практические задачи, ранее недоступные из-за слишком большого времени, которое требуется для получения ответа. Грид создаёт основу для новой организации науки, высокотехнологического производства, социальной жизни, позволяет более эффективно и надёжно управлять ресурсами общества.
Всё чаще зарубежные эксперты повторяют тезис, суть которого заключается в том, развитие грид-технологий становится стратегической задачей. Очень скоро страны, не имеющие развитой грид-инфраструктуры, даже не смогут претендовать на статус развитой страны.
Специалисты, приглашаемые автомобильной компанией на стадии планирования, для оценки характеристик нового завода, члены индустриального консорциума, создающие новый самолет, кризисные группы, вовлеченные в деятельность по мониторингу опасных ситуаций, члены большой, международной, команды физиков-ядерщиков - некоторые примеры реально существующих виртуальных организаций. Каждая из подобных организаций при выполнении вычислений и решении проблем опирается на подходы, построенные на взаимодействии в рамках вычислительных и информационных пространств. Виртуальные организации могут существенно отличаться по целям, размерам, материальному снабжению, продолжительности существования, структуре, социальному составу. Однако пристальное изучение их требований к информационно-вычислительным технологиям приводит к формулированию функционального набора однотипного для всех виртуальных организаций. Вне зависимости от размера и иных характеристик виртуальных организаций существует необходимость: в гибких разделяемых связях, ранжируемых от клиент-серверных до точка-точка; в сложных и точных уровнях контроля над используемыми ресурсами, включая доступ к хранилищам, делегирование прав, применение локальных и глобальных политик; в разделении разнообразных ресурсов (программ, файлов, данных для компьютеров, датчиков, сетей); в разнотипных пользовательских группах; в планировании, совместном выделении ресурсов, учете.
Существующие распределенные вычислительные технологии не обеспечивают выполнения представленных выше требований. Например, Internet-технологии направлены на коммуникационный и информационный обмен между компьютерами, но не предоставляют интегрированного подхода для координированного использования ресурсов на нескольких вычислительных системах. Бизнес-технологии фокусируются лишь на проблемах совместного использования информации, зачастую через централизованные серверы. Распределенные вычислительные технологии масштаба предприятия, такие как CORBA или Enterprise Java, позволяют разделять ресурсы только в рамках одной организации. Средства Open Group's Distributed Computing Environment (DCE) поддерживают защищенное совместное использование ресурсов нескольких сайтов, однако большинство виртуальных организаций находит эти инструменты обременительными и негибкими. Провайдеры сервисов хранения данных (storage service provider - SSP) и сервисов приложений (application service provider - ASP) допускают хранение данных и выполнение вычислений на третьей стороне, но с некоторыми ограничениями (например, SSP ресурсы доступны покупателям лишь через частные виртуальные сети virtual private network - VPN). Таким образом, нынешние технологии либо не позволяют объединить разнообразные типы ресурсов, либо не предоставляют гибкости в управлении разделяемыми связями.
На фоне существующей картины и появилась Грид. Технология Грид занимается интеграцией разнородных информационных, вычислительных, компьютерных задач. Основная задача Грид является сложной научной и практической проблемой, находящейся на стыке большого количества научно-технических направлений. Долгое время ученые не имели возможности даже подступиться к объединению ресурсов. Однако в последние десять лет, благодаря прогрессу в технической сфере в разных направлениях (увеличение мощности компьютерных ресурсов, рост сетевых технологий, появление новых классов приложений), появились разработки в области объединения ресурсов. В результате деятельности Грид-сообщества созданы протоколы, сервисы и средства, необходимые виртуальным организациям. Исходя из теоретических знаний и практического опыта, сформулированы базовые принципы технологии Грид - архитектура протоколов Грид. Архитектура Грид - это широкое поле деятельности для дальнейших исследований и разработок. Новые сервисы, пакеты, протоколы технологии Грид должны укладываться в рамки этой архитектуры, расширяя и пополняя ее, но не противореча ее принципам.