Тахир Такабаевпен Қазақстандағы суперкомпьютерлердің жай-күйі мен оларды қолдану мүмкіндіктері жөніндегі әңгімемізді жалғастырамыз. Бұған дейін терминологияға аз-кем тоқталған едік, енді туындаған сауалдарға жауап іздеп көрейік.
Естеріңізге сала кетейік, Тахир Такабаев – кәсіпкер, физика-математика ғылымдарының кандидаты, отыз жылдық ғылыми-педагогикалық тәжірибесі бар маман. 20-дан астам ғылыми еңбектің авторы. Алматыда қуаты 1,2 мегаватт болатын, 120 серверлік шкафқа арналған тәуелсіз коммерциялық деректер орталығын (ЦОД) іске қосқан.
Тілші: Деректер орталығы дегеніміз не? Ол міндетті түрде суперкомпьютерді қамтуы тиіс пе?
Тахир Маратович: Суперкомпьютер дегеніміз – есептеуіш кластер. Ал деректер орталығы – сол суперкомпьютерді орналастырып, жұмысын қамтамасыз ететін орын.
Суперкомпьютер (hPC) – үлкен есептеуіш кластердің шартты атауы. Бүгін ол «супер» саналса, ертең жаңа буын құрылғылары шыққан соң артықшылығын жоғалтады. Әлемде ТОП-500 деген арнайы тізім бар, онда ең қуатты суперкомпьютерлер көрсетіледі. Бұл тізім үнемі өзгеріп отырады: бүгін біреулер көш бастаса, ертең олардың орнын жаңалары басады.
Суперкомпьютер немесе есептеуіш кластер – біртұтас жүйеге біріктірілген серверлер жиынтығы. Әр сервердің өнімділігі қосылып, жалпы есептеу қуаты еселеп артады. Мұндай серверлер арнайы 42U стандартына сай сөрелерге орналастырылады.

Суперкомпьютердің ең басты ерекшелігі – есептеулерді параллельді түрде жүргізуі. Қарапайым тілмен айтқанда, күрделі математикалық есеп ұсақ-ұсақ мыңдаған, тіпті миллиондаған шағын амалдарға бөлінеді. Мысалы, әрқайсысы X+Y=Z түріндегі қарапайым теңдеу болуы мүмкін. Солардың бәрін бір мезетте қатар шешкендіктен, суперкомпьютер секундтың ішінде миллиардтаған амалдарды орындай алады.
Олардың өнімділігі FLOPS деп аталатын бірлікпен өлшенеді. FLOPS – секундына орындалатын қалқымалы үтірлі (нақты сандармен) операциялардың саны. Қазір бұл көрсеткіш миллиардтар емес, миллиардтың миллиардтарына жетіп отыр.
Бүгінде мектеп оқушылары да біледі: кез келген компьютердің «миы» – орталық процессор (CPU). Техникалық тұрғыда ол көптеген транзисторлардың белгілі бір жүйемен бірігуінен тұрады. Бұл бірігу тәсілі процессордың архитектурасы деп аталады. Ұзақ уақыт бойы ақпараттық технология саласында біздің жеке компьютерлерімізде қолданылатын x86 архитектурасындағы процессорлар басым болды. Алайда соңғы жылдары бастапқыда мобильді құрылғыларға арналған ARM архитектурасына негізделген процессорлар кеңінен таралып келеді.
CPU-дың өз ішінде де ядроларға бөлінуі бар. Әр ядро – жеке шағын процессор іспетті. Мысалы, смартфондарда қазірдің өзінде 8 ядро бар, ал серверлік процессорларда олардың саны 64-ке дейін жетеді. Әр ядро толыққанды есептеулер жүргізе алады, сондықтан көп ядролы процессорлар деректерді өңдеуде әлдеқайда жылдам.

CPU-дан бөлек, жоғары өнімді есептеу саласында (HPC) кеңінен қолданылатын тағы бір маңызды құрал – GPU, яғни графикалық процессор. Бастапқыда ол тек компьютердегі суреттерді өңдеуге арналған болатын. Экрандағы бейне көптеген ұсақ нүктелерден тұратынын білесіз. Әр нүктенің түсін, координатын есептеу қажет. Міне, осы есептеулерді GPU өзіндегі ондаған, жүздеген шағын ядролар арқылы атқарып отырды. NVIDIA компаниясы оларды CUDA-ядролар деп атады.
GPU-дың ядролары қарапайым, бірақ саны өте көп. Егер AMD процессорында бар болғаны 128 әмбебап ядро болса, заманауи GPU-ларда 15 мыңнан астам шағын есептеуіш ядро бар. Олар күрделі логиканы емес, негізінен қарапайым математикалық амалдарды «жылдам санауға» бейімделген. Ал CPU тек есептеп қана қоймайды, сонымен қатар мәліметті талдап, салыстыру сияқты «ойлауға» жақын процестерді де орындайды. Сондықтан жасанды интеллект жүйелері үшін CPU – әлі де негізгі тірек.
Әлемдік рейтингтегі ең озық суперкомпьютерлер әдетте ондаған, тіпті жүз мыңдаған процессорларды біріктіреді. Мысалы, TOP-500 тізіміндегі жүйелердің көпшілігі 30–150 мыңға дейінгі CPU-ды бір кластерге қосып, параллель жұмыс істетеді.

Бірақ мұнда бір қызық жайт бар. Процессорлардың барлығы есептеуге жұмылдырылмайды, белгілі бір бөлігі тек кластердің жұмысын басқаруға кетеді. Айталық, егер сіз 400 серверді біріктірсеңіз, әрқайсысында екіден CPU болса, олардың бір бөлігі тек жүйені басқаруға жұмсалады да, есептеулерге шамамен 700 CPU ғана қалады. Сервер саны артқан сайын, қызмет көрсетуге кететін процессорлар да көбейеді.
Көп жағдайда серверлерде екі CPU қолданылады, бірақ төрт немесе сегіз процессорлы жүйелер де кездеседі.
Мысал ретінде, жақында ғана әлемдік көшбасшы болған FUGAKU суперкомпьютерін алуға болады. Ол шамамен 160 мың CPU-ды біріктірген. Әрбір процессорда 48 ядро бар. Демек, FUGAKU-дың есептеулерінде 8 миллионнан астам ядро қатар жұмыс істеген. Бұл – адам ақылына сыймайтын ауқымдағы қуат.

Қазіргі заманғы суперкомпьютерлер CPU мен GPU-дың бірлескен жұмысынан құралады. Мұнда әдеттегі есептеу серверлері де, сондай-ақ бірнеше қуатты графикалық карталар орнатылған арнайы «видео-серверлер» де қолданылады. Яғни, суперкомпьютер – бұл жүздеген серверлерден құралған алып жүйе, онда мыңдаған процессорлар мен графикалық ядролар бірігіп, жоғары жылдамдықтағы желі арқылы байланысады.
Бұл желілердің де өз даму кезеңі бар: бір технология ескірсе, оның орнын жаңасы басады. Мәселен, КБТУ-дағы алғашқы суперкомпьютер infiniband желісімен жұмыс істесе, бүгінде fiber channel ethernet стандарты кеңінен қолданылып жүр. Әдетте мұндай технологиялық жаңару әр 5–6 жыл сайын орын алады.
Әрине, мұндай жүйені қарапайым Windows басқару жүйесімен жүргізу мүмкін емес. Тіпті серверлік Windows нұсқасы да мұндай ауқымдағы есептеулерге шыдас бермейді. Сондықтан суперкомпьютерлер арнайы бейімделген операциялық жүйелерде жұмыс істейді. Ал оларды басқаратын білікті мамандардың нарықта өте аз екенін де ескеру керек.
Қорытындылай айтқанда, суперкомпьютердің қуаты мен деңгейін оның серверлер саны, CPU және GPU көлемі, орнатылған сөрелері мен тұтынатын энергиясы анықтайды.
Тілші: Павлодардағы ең ірі Дата-Центр туралы айтқанда, сіз онда суперкомпьютер жоқ дедіңіз.
Тахир Такабаев: Дата-Центр дегеніміз – тек сақтау мен жұмыс істеу алаңы. Павлодарда ол басқа мақсатқа пайдаланылып жатқан сияқты.
Тілші: Ал мына жерде, сіздің Дата-Центрде біз нағыз суперкомпьютерді көріп тұрмыз ғой?
Тахир Такабаев: Иә, мұнда шағын есептеу кластері бар. Бірақ оған 10 жыл болғандықтан, ол қазір суперкомпьютер деңгейінен түсіп қалған, яғни моральдық тұрғыда ескірген.
Тілші: Дегенмен сыртқы көрінісі мен құрылымына қарасақ, ол қазіргі суперкомпьютерлерден көп айырылмайтын сияқты ғой?
Тахир Такабаев: Дұрыс байқадыңыз. Негізгі схемасы – әлемдегі кез келген танымал hPC-мен бірдей.

Тілші: Суперкомпьютерлер саласында Қазақстанның қазіргі орны мен келешегін қалай бағалар едіңіз?
Тахир Такабаев: Жалпы алғанда, еліміздегі ақпараттық-коммуникациялық технологиялар белгілі бір деңгейде дамып келеді. Үкіметтік сервистер мен финтех саласында жетістіктер бар. Бірақ мамандар да, қарапайым азаматтар да «бәрі әлдеқайда жақсы болуы мүмкін еді» деп жиі сын айтады.
Мәселен, қазақ интернетінің дамуы жағынан біз көп елдерден артта қалдық. Ресейлік сегментте 15 миллионнан астам сайт бар, ал бізде бар-жоғы 159 мың. Дата-орталықтардың қуаттылығы бойынша да Қазақстан Ресейден 30–40 есе артта. Сол себепті дата-орталықтар салу стратегиялық маңызды бағыт ретінде мойындалды. Бұл жайтты ел басшылығы да бірнеше рет атап өтті. Артта қалу – ашық шындық.
Тағы бір мысал: біздің азаматтар YouTube-қа көптеп бейне жүктейді, өйткені ол тегін. Ал Қазақстанның өз бейнеалаңдары жоқ. Нәтижесінде ішкі желілер YouTube үшін тегін, ал қазақстандық жобаларға қосымша шығын керек. Әрине, бұл шығынды соңғы тұтынушыға жүктейді. Ал адамдар тегін сервисті таңдайды. Бірақ ертең бізді қандай да бір себеппен шектесе немесе ажыратып тастаса не болады? Сол кезде Қазақстаннан шыққан көптеген ақпаратқа өзіміз қол жеткізе алмай қалуымыз мүмкін. Барлығы сыртта қалып, жабылып қалады.
Бұл тек инфрақұрылым емес, мәдениет мәселесі де. Біздің балалар өзге елдердің мультфильмін көреді, өзге елдердің ойындарын ойнайды. Бұл да көп нәрсені аңғартады.
Тілші: Ал қазақстандық суперкомпьютерлерге қандай міндеттер жүктелуі мүмкін? Ғылым, технология, экология, қоғам саласында ше?
Тахир Такабаев: Бүгінгі таңда Қазақстанда суперкомпьютер күтіп тұрған нақты тапсырмалар легі қалыптасқан жоқ. Әлемде мұндай нарық бар: ірі банктер, мұнай компаниялары, сейсмология, гидрометеорология салалары суперкомпьютерлерді белсенді қолданады.
Бізде әзірге жүйелі сұраныс жоқ. Мысалы, КБТУ-дағы суперкомпьютер 10 сөрені ғана алып жатты. Салыстыру үшін айтсақ, Мәскеудегі «Ломоносов» 104 сөреден тұрады, қазір олар екінші осындай жүйені іске қосқалы отыр.

Тілші: Әңгімемізді әлемдік деңгейдегі суперкомпьютерлермен салыстырудан бастасақ. Мысалы, Жапониядағы Fugaku – әлемдегі ең жылдам жүйелердің бірі.
Тахир Такабаев: Иә, Fugaku сияқты жүйелермен иық теңестіру үшін бізге әлі талай еңбек ету керек. Бұл бағытта ұзақ жол күтіп тұр.

Ал енді шынын айтқанда, суперкомпьютер – өте қымбат. Бұған дейін айтқанымдай, тек электр қуаты мен амортизация шығындары мегаваттық дата-орталыққа ай сайын 30 миллион теңгеге түседі. Бұл күніне шамамен 1 миллион теңге.
Қазақстандық суперкомпьютерлердің құны шамамен 50 млн АҚШ долларына бағаланғаны бұқаралық ақпарат құралдарында айтылды. Ал олардың қызмет ету мерзімі 5–6 жыл ғана. Демек, өзін ақтау үшін ай сайын кемінде 1 млн доллар табыс әкелуі тиіс. Қазір елімізде үш бірдей суперкомпьютер бар, олардың бәрі мемлекеттік шығындар есебінен келгенін ескерсек, бұл – ай сайын 3 млн доллар пайда әкелуі керек деген сөз. Бұған әлі эксплуатация шығыны мен мамандардың еңбекақысы кірмейді.
Сондықтан суперкомпьютерді орнатпас бұрын оның қандай міндеттерді шешетінін анықтап алу қажет. Мұндай жүйелердің әлеуеті – мұнай-газ химиясы, гидрометеорология, экология, білім беру сияқты салаларда. Бұл бағыттардың бәрі Қазақстан үшін өзекті.
Тілші: Сіз әлеуметтік желілерде экология мәселесін жиі көтересіз. Сіздің ойыңызша, Алматыдағы қандай проблемаларды суперкомпьютер арқылы шешуге болады?
Тахир Такабаев: Мен жұмысқа күн сайын жаяу барамын, қаладағы көп дүниеге көзім түседі. Алматы үшін суперкомпьютер көмектесе алатын нақты міндеттер бар.
Мәселен, Алматының ауа бассейнін модельдеу – аса қажет жобалардың бірі. Үкімет жиі айтып жүрген «қаланың цифрлық егізі» ұғымын да осы тұрғыда нақты түсіндіріп алу керек. Менің пайымдауымша, ол – қаланың үш өлшемді картасына инженерлік желілерді, ғимараттарды, желдің бағытын, көлік пен өнеркәсіптен шығатын ластаушы көздерді қабаттап енгізу.

Тахир Такабаев: Бірақ мәселе тек 3D-картаға қабаттар енгізумен шектелмейді. Ауа бассейнін талдау үшін міндетті түрде математикалық модель қажет. Ол ондаған параметрді ескеріп, көбінесе бейсызық немесе квазисизық дифференциалдық теңдеулер жүйесіне сүйенеді.
Қалаға биік ғимарат салудың салдарын алдын ала болжау үшін 3D модельдер мен математикалық есептеулердің көмегі зор. Мәселен, 40 қабатты тұрғын үй кешенін тұрғызу мүмкін бе деген сұрақ қойылды делік. Сол нысанды 3D модельге енгізген сәтте-ақ, бірқатар маңызды көрсеткішті есептеуге болады. Қай жерде ауа тоқтап, қай жерде желдің әсерінен түтін құбыры секілді ағындар пайда болатынын көруге мүмкіндік бар. Сондай-ақ көлік қозғалысына қалай ықпал ететіні, жаңа нысаннан 5–10 шақырымға дейінгі аралықтағы әсері, инженерлік желілердің қосымша жүктемесі де есепке алынады.
Осындай жан-жақты талдау қала экологиясы мен инфрақұрылымына зиян келтірмей, дұрыс шешім қабылдауға жол ашады.

Тағы бір қызықты бағыт – қаладағы көлік трафигін есептеу. Бұл үшін де 3D-карта қажет және оның «GIS» жүйесімен байланысы маңызды. Жеке пікірім, мұндай жобалар үшін ашық кодты GIS жүйелерін – OGIS, Grass GIS сияқты платформаларды қолданған тиімді.
Тахир Такабаев: Алматыда күн сайын жолға миллионға жуық көлік шығады. Әрқайсының өз қозғалыс режимі бар. Суперкомпьютер осы қозғалыстың барлығын бір сәтте бейнелеп, нақты картасын көрсете алады. Қаладағы коммуналдық көліктер қанша жанармай тұтынады, таксилер мен жүк көліктері қанша шығын шығарады, құрылыс пен жол техникасы қанша отын жағады – мұның бәрін есептеуге болады. Тиісінше, әрбір көліктің атмосфераға қанша зиянды зат шығаратынын да анықтауға мүмкіндік бар.
Алайда қала үшін ең күрделі түйткілдің бірі – көлік кептелісі. Оны алдын ала болжауға суперкомпьютердің мүмкіндігі жеткілікті. Жолдағы өзгерістерге қарай қозғалыстың қай тұста баяулайтынын есептеп шығару қиын емес. Дұрыс қойылмаған бағдаршам кей жерде ұзын кезек тудырады, тәжірибесіз реттеуші бір сәтте барлық бағыттағы қозғалысты тұсаулап тастауы мүмкін. Ал көшелердегі жөндеу жұмыстары тіпті тұтас қаланың тынысын тарылтып жібереді.
Осының бәрін үлкен есептеу жүйесі алдын ала көрсетіп, шешім қабылдайтын мекемелерге нақты ұсыныс берер еді.
Жақында Мәжілістегі әйел-депутаттардың бірі Зенков көшесіндегі (Жасыл базар маңы) жаяу жүргіншілер аймағына қарсы пікір білдірді. Себебі көлік қозғалысының бір бөлігі жабылған соң, сол мезетте-ақ кептелістер пайда болды.

Тахир Такабаевтың айтуынша, мұндай өзгерістер енгізілмес бұрын Акимат тұтас ауданның қозғалысын сандық модель арқылы алдын ала есептеуі қажет. Қазір мұндай модель әлі жасалмаған. Егер дайын болғанда, көлік ағынындағы өзгерістің ықпалын, соның ішінде кептеліс кезінде ауаға тарайтын көмірқышқыл газының мөлшерін де болжауға мүмкіндік туар еді.
«Осындай есеп-қисаптарды коммерциялық негізде жүргізіп, Суперкомпьютерді тиімді қолдануға болады. Бұл – сол жүйені табысты ету мен монетизациялаудың нақты жолдарының бірі», – дейді ол.
Тілші: Сонда бастысы – нақты міндеттер ме?
Тахир Такабаев: Дәл солай. Суперкомпьютердің басты мәні – шешілетін міндеттерде. Мен тәуелсіз коммерциялық дата-орталықты салып, мемлекеттік органдарға мұндай жобаның Қазақстан үшін де қолжетімді екенін дәлелдегім келді. Қазір біздің клиенттеріміздің қатарында 4 банк пен 14 байланыс операторы бар. Өзімнің техникалық шешімдерімді талай мамандармен пікірталаста қорғап шықтым.
Ал енді модельдеуге келсек. Қазақстандағы суперкомпьютерлерге нақты міндет жүктеу қажет. Егер мұнай-газ саласындағы компаниялар, геодезистер, сейсмологтар, гидрометеорологтар дайын модельдермен жұмыс істей алса, онда суперкомпьютерлерді толық қуатта жүктеуге болар еді.

Орта және жоғары білім беру жүйесі үшін де шексіз мүмкіндіктер бар.
Өте қызықты тапсырма – рендер жасау. Мысалы, 3D бейнеден 2D бейнеге көшіру қажет делік. Қазақстанда шамамен 500 мың студент бар. Егер әр студент курстық жұмыс ретінде 15 минуттық анимация жасаса, бұл жалпы отандық мультфильмнің ұзындығы 125 мың сағатқа жетеді. Әрине, бәрі мінсіз бола қоймайды. Бірақ 20–30 модель жасап көрейік: қыз, жігіт, ат, атты адам, әр түрлі қалалардағы белгілі ғимараттар. Ал егер үздік роликке конкурс ұйымдастырсақ ше? Бірінші орынға – пәтер, екінші орынға – автокөлік, және т.с.с. Студенттер онда түнгі уақытта да жұмыс істейтін болар еді.
Суперкомпьютердің тағы бір маңызды міндеті – сандық теңсіздікті жою. Біздің студенттердің бәрі өз компьютеріне, планшетіне немесе ноутбукке және жылдам интернетке қол жеткізе бермейді. Бірақ студенттерге ноутбук сатып берудің орнына, мысалы пандемия кезінде әкімдік таратқан 2000 компьютер секілді, бұлттық, виртуалды десктоп ұсынайық. Яғни десктоптың өзі Дата-орталықта орналасқан, ал смартфон, планшет немесе қарапайым ноутбук оның мониторы ретінде қызмет атқарады. Смартфон барлығының қолында, қуатты дата-орталық бар, сол арқылы жұмыс істесін. Бұл технологияны VDI деп атайды.

Мұндай тәсіл тиімді болады! Бағалы ноутбукты аз қамтылған студентке сыйлаудың орнына, оған VDI қызметін төлеп беруге болады, ал смартфон немесе планшет барлығының қолында.
Егер студенттердің VDI жүйесін қуатты GPU-лармен біріктірсек, әрқайсысы графикалық станцияға қол жеткізе алады және қалағаны анимациялық контент жасай алады. Шетелдік мультфильмдерде қазақ кейіпкерлері көбінесе Тұғарин немесе жабайы, дөрекі батырлар ретінде беріледі. Менің орнымда МЦРИАП, Мәдениет министрлігі, Білім және ғылым министрлігі қазақ жігітінің ат үстіндегі бейнесі, киіз үй, тұрмыстық заттар, қыз бейнесін сандық 3D форматта жасар еді. Сол кезде 500 мың қазақстандық студент пен 2,5 миллион оқушы өз VDI жүйесінде осы кейіпкерлермен мультфильм жасай алар еді.
Қазіргі мектеп оқушылары мен студенттердің көбі ғаламтор желілерін еркін пайдалана алады. Алайда, онлайн кеңістік тек пайдалы ақпарат қана емес, кейде қауіпті ойындар мен сайттарға да толы. Дегенмен, бұл мәселені шешудің жолы бар. Мысалы, оқушылар тек арнайы рұқсатпен ғана желіге қосыла алады. Барлық білім беру материалдары суперкомпьютерде сақталып, зиянды сайттарға жол берілмейді. Виртуалды жұмыс үстелдері бар орталықтандырылған жүйені сыртқы шабуылдан қорғау әлдеқайда жеңіл.

Суперкомпьютердің тағы бір маңызды қызметі – қазақ тілінен басқа тілдерге және керісінше синхронды аударма жасау. Мысалы, мен қытай әріптестеріммен сөйлескенде, олар Google аудармашысын қосып, әдеттегі әңгімесін түсінікті етіп жүргізе алады. Ал қазақ тілі үшін әзірге мұндай жүйе жоқ. Соңғы 30 жыл бойы тілдің дамуы мәселесі көтеріліп келеді, бірақ сапалы онлайн аудармашылар әлі жоқ. Аудиофайлдарды өңдеу көп қуат қажет етпейді, бірақ диалогтар саны көбейсе, суперкомпьютер дәл осы тапсырманы толық орындай алады.
Қорытындылай келе, суперкомпьютерді тиімді пайдалану мүмкіндігі өте кең. Негізгі мәселе – осы қымбат техниканы нақты, маңызды жұмыстарға жұмсау. Егер мемлекет қолдау көрсетіп, суперкомпьютер ресурстары кеңінен қолжетімді болса, Қазақстан тек пайда көреді. Қазақстандық HPC технологиялары дамып, экономиканың әр саласында сәтті қолданылады.