291
Сурет 2.3. Сөйлем аудару.
Қорытындылай келе, машиналық аударма қазіргі кезде үлкен сұранысқа ие екені белгілі.
Қазіргі таңда жұмыс істеп тұрған қазақ тілінен орыс тіліне аударатын demo_kaz_rus
программасы сөйлемдердің құрылымын, сөздің мағынасын ескере отырып түсінікті аударма
жасауда. Еліміздегі машиналық аудармалардың сапасын арттыру мақсатында атқарылып
жатқан жобаның тиімділігі айқын.
Әдебиеттер
1. Бектаев, К.Б. Большой казахско - русский, русско-казахский словарь / Калдыбай
Бектайұлы Бектаев.- Алматы: Алтын қазына, 2007.- 709 с.
У.А. ТӨКЕЕВ, С.З. САПАҚОВА
Әл-Фараби атындағы ҚазҰУ, Алматы, Қазақстан
ҚАЗАҚ ТІЛІНЕН ОРЫС ТІЛІНЕ МАШИНАЛЫҚ АУДАРМА
1. Қазақ тілді машиналық аудармашыларға қысқаша шолу
Қазіргі таңда қазақ тілінен өзге тілдерге аударатын программалар, онлайн-аудармалар
баршылық, бірақ олардың жұмыс нәтижесі мардымды емес. Оның ең негізгі себебі қазақ
тілінің грамматикасының басқа тілдің грамматикасына қарағанда анағұрлым күрделілігі, өзге
тілдің грамматикасына ұқсамайтындығында. Еліміздегі қазіргі кезде кеңінен қолданылып
жүрген sozdik.kz, soylem.kz, sanasoft.kz секілді онлайн аудармашылармен қатар «Ізет-
тілмәш» қолданбалы программасында қазақ тілінен орыс тіліне аудару мүмкіндігі бар. Бірақ
бұл аудармашы программалар енгізілген сөздерді аударғанымен сөйлемнің құрылымына, сөз
мағынасына аса мән бермейтінін олардан алынған нәтижелерден көре аламыз. Айта кететін
жайт осы айтылған машиналық аудармаларда сөйлемдер енгізіп, оларды аударатын болсақ
ол сөздердің көп жағдайда орнын өзгертпей, басқа мағыналарын қарастырмайтынын көреміз,
292
яғни түсініксіз аудармаларға грамматика толық қарастырылмағандықтан тап боламыз, оны
дәлелдемесекте болады. Сонымен қатар, бұл бағытта атқарылып жатқан іс-шараларды да
атап кететін болсақ, «ағылшын- қазақ» машиналық аударма бағытында Apertium програмасы
Микель L. Forcada (Испания) басшылығымен және әл-Фараби атындағы Қазақ Ұлттық
Университетінің қолдауымен, free/ машиналық аударманың ашық кодты платформасы
пайдаланылуда. Apertium –бұл машиналық аударма жүйесінің ашық кодасын құруға
арналған құралдардың жиыны, әсіресе өзара байланысқан тілдер жұбы үшін ыңғайлы, оның
құрамына ашық лингвистивкалық мәліметтерге арналған бірнеше сөздіктер, техникалық
қызмет көрсету т.с.с. енетінін білеміз. Осы бағдарлама негізінде «қазақ- татар» тілдер
бағытындағы ашық кодалы жүйе құрып, онымен қарқынды айналысып жатқан ғалымдарды:
Ильнар Салимзянов, Джонатан Вашингтон және Фрэнсис Tyers атап кетуге болады.
Ұсынылып отырған жұмыс қазақ-орыс бағытында құрылған машиналық аударма
жүйесінің негізгі жұмыс істеу принциптеріне, қазіргі таңда туындаған мәселерге тікелей
байланысты. Жұмыс нәтижесінде шағын «kaz-rus translator» қолданбалы программасы
жасалынды және одан әрі дамыту үстіндеміз, бұл программа Visual Studio 2010 және SQLite
орталарында орындалды.
2. Қазақ тілінен орыс тіліне аудару барысындағы морфологиялық талдау сұлбасы
Қазіргі уақытта машиналық аударма барысында бірнеше бөліктерден тұратын күрделі
жүйе қолданылады, мысалы:
Морфологогиялық талдау – мәтіндегі сөздерді талдау
Синтаксистік талдау – сөйлемдерді, грамматиканы және сөздер арасындағы
байланыстарды талдау;
Семантикалық талдау – белгілі бір пәндік аймаққа бағытталған деректер қоры
негізінде әр сөйлемнің мағынасын талдау.
Прагматикалық талдау- өзіндік мәліметтер қоры негізінде белігілі бір контекстің
ауқымында сөйлемнің мағынасын талдау.
293
Сұлба 1. Қазақ тілінен орыс тіліне сөз аударудың блок-сұлбасы.
294
Бұл сұлбадан көретініміз морфологиялық талдауда маңызды рол атқаратын жалғаулардың
МҚ бөлек кесте түрінде сақталуы. МҚ «жалғаулар» кестесінде кездесетін 753 жалғауды
Бектаевтың сөздіктер кітабынан [1] енгіздік. Бектаевтың сөздігінде қазақ тілінде кездесетін
барлық қосымшаларды қарастырылған, сол сөздік бойынша қосымшалардың жалғану реті
жасалынды. Мысалы, бара-лар-ымыз-дың деген сөзді алсақ, қосымшалардың жалғану реті
былай болады: Р – К – Ж – Т (түбір – көптік жалғау – жіктік жалғау – тәуелдік жалғау). Осы
қосымшалардың бүкіл жағдайын қарастырып, барлығын қосындыласақ 753 қосымша
шығады (2-сұлба).
Сұлба 2. Қазақ тіліндегі жұрнақтардың жалғану реті.
Қарастырылып отырған тілдер жұбында, әр тілдің өзіндік ерекшеліктері мен олардың
арасындағы бірмәнді сәйкестік болмайтынын да айқын көреміз. Мысалы, қазақ тіліндегі
әртүрлі сөз таптарының өзіне тиселі жалғаулары бар, ол басқа сөз табына жалғанбайды,
сонымен қатар бірнеше сөз табына жалғанатындары да бар. Осы ерекшеліктерді ескере
отырып, біз жалғаулар кестесіне келесі атрибуттарды пайдаландық
Сұлба 3. Жалғаулар кестесінің атрибуттары.
295
Бұл жұмыста қарастырылып отырған Мәліметтер қорының құрылымы келесідей:
Сұлба 4. Мәліметтер қорының шағын сұлбасы.
Әрқайсысына келесідей жекеленген түсініктеме беріп кетуге болады:
zat (зат есімнің қазақша-орысша аудармасы)
syn (сын есімнің қазақша-орысша аудармасы)
san_esim (сан есімнің қазақша-орысша аудармасы)
etistik (етістіктің қазақша-орысша аудармасы)
usteu (үстеудің қазақша-орысша аудармасы)
esimdik (есімдіктің қазақша-орысша аудармасы)
predlog (орыс тіліндегі предлог)
zhalgaular (қазақ тіліндегі барлық мүмкін болатын жалғаулар)
skl1 (орыс тіліндегі склонение 1-дің жалғаулары)
skl2 (орыс тіліндегі склонение 2-дің жалғаулары)
skl3 (орыс тіліндегі склонение 3-дің жалғаулары)
iya (орыс тілінде ия-ға бітетін зат есімдердің жалғаулары)
iyi (орыс тілінде ий-ға бітетін зат есімдердің жалғаулары)
pril_skl (орыс тіліндегі сын есімнің жалғаулары)
glagol_spr (орыс тіліндегі етістіктің жалғаулары)
Осы МҚ кестелердің, әрқайсысының ерекшеліктері ескеріле отырып, келесі түрдегі
атрибуттар тағайындалды.
296
Сұлба 5. Сөз таптарының және көмекші кестелердің атрибуттары.
297
Сурет 1. Мәліметтер қорындағы «Жалғаулар» кестесі.
Мысал, «үстелдердің» көпше түрдегі сөзді аудару процесін қарастырсақ.
<үстелдердің>::=<үстел><дердің>
<үстел>::=<стол>
<дердің>::=
Сұлба 7. Морфологиялық генератордың сұлбасы.
Сұраныс бойынша МҚ «ов» жалғауы алынады және сөздің соңына жалғанады.
«үстелдердің» - «столов».
Бұл жұмыста бүкіл атқарылып жатқан жұмыстардың сипаттамасын, ішкі құрылымын
көрсету мүмкін емес, сондықтан «зат есім» сөз табының маңызды жақтарын қарастырсақ.
298
Соның ішінде Септік жалғаулары жобада толық қарастырылған. Мысал ретінде Табыс
септігін алсақ, ол орыс тіліндегі винительный падежге сәйкес.
1-склонение. Егер енгізілген сөздің соңғы әріпі «а» және оның соңғы әрпінің алдындағы
әрпі келесі жиыннан болса, pb[]={ 'б', 'в', 'г', 'д', 'ж', 'з', 'к', 'л', 'м', 'н', 'п', 'р', 'с', 'т', 'ф', 'ч', 'ш', 'щ',
'х', ‘ц’}, онда аударылған сөздің соңына «у» жалғауы жалғанады, мысалы, көлікті =>машину.
–у немесе –ю жалғауларын жалғау ережелері:
МҚ келесі атрибуттары бар сұраныс түседі: padezh=4, chislo=1, rod=2.
string[] string1 = new string[] { "я" };
if (defineVariables.skl[defineVariables.i] == "1")
{ if (padezh == "4")
{if
(string1.Contains(defineVariables.words_rus[defineVariables.i].Substring(defineVariables.words_r
us[defineVariables.i].Length - 2, 1)))
{ defineVariables.words_rus[defineVariables.i] =
defineVariables.words_rus[defineVariables.i].Substring(0,
defineVariables.words_rus[defineVariables.i].Length - 1) + okonch2; }
else { defineVariables.words_rus[defineVariables.i] =
defineVariables.words_rus[defineVariables.i].Substring(0,
defineVariables.words_rus[defineVariables.i].Length - 1) + okonch1; }
Нәтижесі:
Сурет 2. Зат есімдер кестесі мен сұраныстар кестесінің нәтижесі.
Kaz-Rus translator жұмыс нәтижесін көрсететін болсақ келесі қарапайым сөйлемдерді
аударады.
299
Сурет 3. Kaz-Rus translator жұмыс нәтижесі.
Қорыта айтқанда,
қазақ тілінен орыс тіліне аударатын машиналық аудармалар салыстырылып, оларға
талдау жасалды, яғни сапалы машиналық аударма алу үшін кеткен қателіктер зерттелді;
машиналық аударманың негізі болып табылатын мәліметтер қорын толтыру
нұсқалары қарастылып ең тиімді шешім алынды, кестелерге қажетті атрибуттар аныөталды;
12000 сөз енгізілген мәліметтер қорына программа күрделілік деңгейін азайту үшін
орыс тілінің жалғаулары қосылды;
қазақ тілінен орыс тіліне машиналық аудармада кездесетін қиындықтар талқыланып,
шешуге қажетті модульдер құрылды.
Әдебиеттер
1.
Бектаев, К.Б. Большой казахско - русский, русско-казахский словарь / Калдыбай Бектайұлы
Бектаев.- Алматы: Алтын қазына, 2007.- 709 с.
N.Z. ABDURAKHMONOVA
National University of Uzbekistan named after Mirzo, Tashkent, Uzbekistan
GRAMMATICAL ANALYZE IN MACHINE TRANSLATION
BETWEEN ENGLISH AND UZBEK
Today human society characterizes high degree of activity in different fields such as economy,
science, technology, culture etc. And it has caused to increase body of information that presents
some difficulties between person to person or among the group of people. Computer has being
considered one of the main approaches to ease opportunities of people since it was invented. So
machine translation is used to exchange information communicative attitudes. Translation of the
text is very complex creative process from a natural language into another one. We can see now
variety forms of machine translation system; even they can recognize speech and translate orally.
Most of them are multilingual translation programs. The Uzbek language is being developed rapidly
Достарыңызбен бөлісу: |