143
жедел жады, қатқыл диск кіреді. Жүйедегі процессорлардың жалпы саны 768, ал МВС-
1000М суперкомпьютерінің шектік ӛнімділігі 1 Тфлопс-тан асады.
МВС-1000М суперкомпьютерінің барлық модульдері екі тәуелсіз желілермен
байланысқан. Пайдаланушылар бағдарламаларында Myrinet 2000 желісі есептеу
барысында деректермен алмасу үшін пайдаланылады. MPI пайдаланғанда желі
каналдарының ӛткізу қабілеті 110-170 Мбайт/сек мәндеріне жетеді. Операциялық жүйе
сервистік функцияларды орындау үшін Fast Ethernet желісін пайдаланады.
Сурет - 1.
МВС-1000М суперкомпьютерінің құрылымы
Кластерлерді тұрғызудың коммуникациялық технологиялары.
КластерДі трғызудың әртүрлі нұсқалары ӛте кӛп. Оларың арасындағы елеулі
ӛзгешіліктің бірі пайдаланылатын желілік технологияда жатыр, ал оны таңдау алдымен
қойылған есептердің класымен анықталады.
Алғашқыда Beowulf-кластерлері әдеттегі 10-мегабиттік Ethernet желісі базасында
тұрғызылды. Қазіргі күні коммутаторлар базасында Fast Ethernet желісі пайдаланылады.
Бұндай шешімнің негізгі құндылығы – төмен баға. Сонымен қатар, Fast Ethernet
шеңберінде хабарлама жіберуге үлкен қосымша шығындардың болуы, осындай
кластерлерде тиімді шешілетін есептер аумағын қатаң шектеулерге алып келеді. Егер
кластерден жоғары әмбебаптылық талап етілсе, онда басқа ӛнімділігі жоғары және арнайы
коммуникациялық
технологияларды
пайдалану
керек.
Кластерлік
жүйелерді
құрастырушылар баға, ӛнімділік және масштабталу ұғымдарын ескере отырып Fast
Ethernet, Gigabit Ethernet, SCI, Myrinet, cLAN, ServerNet және т.б. желілік технологиялар
арасынан таңдау жасайды. Коммуникациялық технологиялар және олардың негізгі
параметрлері туралы толық мәліметті, мысалы
http://www.Parallel.ru
сайтынан табуға
болады.
Кластерлі жүйелерде, коммуникациялық желілердің ӛнімділігі қандай сандық
сипаттамалармен ӛрнектелетініне тоқталайық. Пайдаланушыға қажетті негізгі екі
сипаттама бар: латенттік және желінің жіберу (ӛткізу) қабілеті. Латенттілік - бұл
хабарламаларды жіберу кезіндегі бастапқы бӛгелу уақыты. Желінің жіберу (өткізу)
қабілеті байланыс каналдары бойынша ақпаратты жіберу (ӛтізу) жылдамдығымен
анықталады
(Сурет 2). Егер бағдарламада кішкене хабарламалар кӛп болса, онда
латенттілік қатты ӛзгерістерге ұшырайды. Егер хабарламалар үлкен порциялармен
берілетін болса, онда байланыс каналдарының ӛткізу қабілетінің жоғары болуы маңызды.
Myrinet 2000 желісі
128
CPUs
128
CPUs
128
CPUs
128
CPUs
128
CPUs
128
CPUs
Fast Ethernet желісі
Gigabit Ethernet желісі
Басқарушы
компьютер
Файл-
сервер
Резервтегі
басқарушы
компьютер
144
Латенттілік әсерінен шағын ұзындықты хабарламаларда желі бойынша жіберудің
максималды жылдамдығы қамтамасыз етілмеуі мүмкін.
Сурет - 2.
Коммуникациялық ортаның латенттілігі және өткізу қабілеті
Әрне, пайдаланушыға ӛндірушілердің айтқан (ұсынылатын) шектік сипаттамалары
емес, тәжірибе жүзінде (бағдарламаларды орындау барысында) жетуге болатын нақты
кӛрсеткіштері маңызды. Пайдаланушы хабарламаны жіберу функциясын Send()
шақырғаннан кейін, хабарлама бағдарламалық қамтама және аппаратураны ұйымдастыру
ерекшеліктерімен анықталатын қабаттар жиыны арқылы ӛтеді. Осымен, дербес жағдайда
нақты жүйелердің латенттілігі анықталады. Мысалы, компьютерде MPI дұрыс
орнатылмаса немесе нашар орнатылса, латенттілік үлкен болады, белгісіз таныс емес
ӛндірушілерден арзан желілік карта сатып алып орнатсаңыз да сюрприздерді күте беріңіз
деген сӛз. Енді таратылған жадылы есептеу жүйелерінің нақты бағдарламаларды орындау
кезінде ӛнімділігін тӛмендететін факторларға кӛңіл аударайық.
Амдал заңынан бастайық. Таратылған жадылы компьютерлер үшін ол ӛте үлкен роль
атқарады. Шындығында, егер бағдарламада тек 2% ғана тізбекті орындалатын
операциялар бар дер есептесек, онда бағдарлама жұмысының 50-еселік және одан жоғары
үдеу (50-кратное ускорение) алатынына әрине сенімділік жоқ. Енді ӛз бағдарламамызға
критикалық кӛзбен қарап кӛрелік. Әрине онда инициалдау, енгізу/шығару операци ялары,
қандай да бір тізбекті учаскілер бар болары анық. Олардың үлесін тұтас бағдарлама
фонында бағалап, бір сәтке 1000 процессордан тұратын есептеу жүйесіне рұқсат алдық
деп есептейік. Осындай жүйеде бағдарлама үдеуі үшін жоғарғы границасын есептегеннен
кейін, Амдал заңының әсерін бағаламауға ешқандай негіз жоқ.
Таратылған жадылы компьютерлерде процессорлар арасындағы арақатынас
хабарлама жіберу кӛмегімен жүргізіледі. Бұдан екі басқа тӛмендететін факторлар –
латенттілік және коммуникациялық орта каналдарымен деректерді беру жылдамдығы
шығады. Бағдарламаның коммуникациялық құрылымына байланысты бұл факторлардың
әсер ету дәрежесі қатты ӛзгеруі мүмкін. Егер аппаратура немесе бағдарламалық қамтама
есептеу фонында хабарламаны асинхронды жіберу мүмкіндіктерін қолдамаса, онда
параллель процесстердің арақатынасының толық аяқталуын күтуге байланысты шарасыз
қосымша шығындар пайда болады.
Тиімді параллель ӛңдеуге қол жеткізу үшін, барлық процессорлардың максималды
бірқалыпты жүктелуін қамтамасыз етуіміз қажет. Егер бірқалыптылақ болмаса, онда
процессорлардың бір бӛлігі басқаларын күтіп шарасыздан тұрып қалады. Әрине осы
уақытта олардың күтуден гӛрі пайдалы жұмыс істеуге толық мүмкіндіктері бар. Егер
есептеу жүйесі біртекті болса бұл проблеманың оңай шешілері анық. Біртекті емес
жүйелерге кӛшу кезінде, олардағы есептеу тораптары немесе байланыс каналдары
арасындағы айтарлықтай айырмашылық салдарынан ӛте үлкен қиыншылықтар
туындайды.
Маңызды фактор – бұл есептеу жүйесіндегі жеке процессордың нақты ӛнімділігі.
Микропроцессорлардың әртүрлі моделдері кэш-жадының бірнеше деңгейіне қолдау
кӛрсетуі және оларда арнайы функционалды құрылғылардың және т.б бар болуы мүмкін.
1 торап
2 торап
өткізу қабілеті
Л
ат
ент
ті
л
ік
Send()
Recei ve()
Достарыңызбен бөлісу: |