Аударманың Өзекті мәселелері алматы, 2015



жүктеу 2,8 Kb.
Pdf просмотр
бет36/96
Дата25.05.2018
өлшемі2,8 Kb.
#17606
түріБағдарламасы
1   ...   32   33   34   35   36   37   38   39   ...   96

108
ескерілген болатын [26]. Анализ бен синтездің бір-біріне барынша 
тәуелсіз  болуынан  оларды  басқа  салалас  тілдік  жүйелерге  де 
қолдану мүмкіндігі туындады.
Өткен  ғасырдың  70-жылдарынан  бері  зерттеліп  келе  жатқан 
Гренобльдық  орысша-французша  аударма  жүйесінің  (GETA) 
жетілдірілген  түрі  логикалық  пішіндегі  терең  синтаксистік 
құрылымдарды  алуды  көздейтіні  мәлім.  Бұл  жүйе  бойынша 
семантикалық, синтаксистік, морфологиялық және сөздік деректері 
арқылы  бірнеше  өңдеулер  (трансформаций)  жүргізе  отырып, 
«шығыс» тілдің (выходной язык) үстірт тұрпатының (поверхностная 
форма) көрінісін анықтауға мүмкіндік туады. Көпдеңгейлік талдау 
өңдеудің  11  топтамасының  реттік  тәртібі  түрінде  құрылады. 
Мысалы,  аналитикалық  тұлғаны  синтетикалыққа  келтіру, 
фразаны  сегменттеу,  есім  топтарын  талдау  және  т.б.  Мұндай 
әрекеттер  антецеденттерді  іздестіру  мен  қалпына  келтірілген 
түйісу  нүктелерінің  синтаксистік  және  логикалық  фунцияларды 
анықтауға дейін өз жалғасын тапты. Аталған жүйе ARIANE атты 
дамыған программалық (бағдарламалық) жабдықталуға ие болды. 
Мысалы,  ол  жүйе  мен  тұтынушы  арасындағы  әрекетті  деректер 
базасы арқылы алдын ала қарастырумен қатар, процесті басқару 
мен мәтінді өңдеуде де аса дамыған құралдар қолданыс тапты. 
TAUM жүйесінде (Монреаль университеті, Канада, жетекшісі 
–  Р.Китредж)  ағылшынша-французша  аударма  үстірттік 
(поверхностный)  синтез  деңгейінде  жүзеге  асады  [40].  Аталған 
жүйе  лексикалық  және  құрылымдық  жағынан  өңдеу  міндетін 
атқаратын трансфер топтамасына (блогына) ие. Оған лексемаларды 
аудару,  француз  тіліндегі  фразаны  синтездеуді  жеңілдету  үшін 
құрастырушылар таралымының (дерево) кейбір бөліктерін өңдеу, 
етістіктің шақтық түрін және меңгеру моделін (модели управления) 
аудару мәселелері қамтылды. Программаны (бағдарламаны) жазу 
тілі ретінде А.Кольмер құрастырған Q (Quebec) тілі алынған [40, 
92-б.]. Бұл жүйедегі талдағыштың комбинаторлығы мен икемділігі 
(талдаудың алғашқы болжамын аяғына дейін сақтау, ережелердің 
қолдану тәсілдерінің ретін белгілеу және т.б.) аударманың үстірттік 
синтаксиске бағышталуына мүмкіндік тудырады. 
TAUM жүйесі 1968 жыл мен 1980 жыл аралығында белсенді 
түрде дамып, нәтижесінде 1977 жылдан бастап аталған жүйе жыл 


109
сайын 5 млн. сөз көлеміндегі мәтіндерді аударуды жүзеге асырып, 
өндірістік жүйе дәрежесіне дейін көтерілді [20, 12-б.].
Чехославакиядағы  Карлов  университетінің  алгебралық  және 
есептеу лингвистикасы тобы П.Сгаллдың ғылыми жетекшілігімен 
жай  сөйлемдерді  ағылшын  тілінен  чех  тіліне  шектеулі  сөздік 
бойынша  аударма  жасайтын  машиналық  аударма  жүйесін 
құрастырды  [40,  84-б.].  Бұл  жүйеде  талдау  процесі  негізгі  төрт 
кезеңнен  тұрады:  морфологияға  дейінгі  талдау,  морфологиялық 
талдау,  синтаксистік  талдау,  аудару.  Синтаксистік  талдау 
синтаксистік  ережелердің  әрекет  ету  аясының  кеңейтілген 
типі  ретінде  құрылған:  алдымен  шағын  мәнмәтіннің  бірліктері 
талданады  және  әрі  қарай  оның  көлемі  біртіндеп  ұлғайып, 
сөйлем  шеңберінен  сырт  шығатын  мәнмәтін  көлеміне  дейін 
өседі. Сондықтан мұны әдеттегі «төменнен жоғары қарай» талдау 
жағдайына  жатқызуға  болады.  Осыған  байланысты  синтаксистік 
талдаудың өзі де бірнеше кезеңге бөлінеді. Аталған жүйеге жүйесіз 
(нерегулярный)  синтаксисті,  мағынаны  дұрыс  ашуға  қажетті 
сөйлемде  жоқ  элементтерді  толықтыру  ережелерін  талдау  үшін 
«авариялық»  деп  аталатын  грамматика  енгізілген.  Синтаксистік 
қатынастарға  семантикалық  түсініктеме  беру  тәсілі  кең  түрде 
қолданыс тапқан. 
Шамамен  алғанда,  1970  жылдан  бастап,  SUSY  жүйесін 
құрастыру жұмысы басталады [40, 90-б.]. Аударма жасау процесі 
деректерді  алдын  ала  дайындаудан,  талдаудан,  өңдеуден  және 
синтездеуден  тұрады.  Аударма  алгоритмін  жасау  әр  тілдің 
грамматикасына  тәуелсіз  сипаттау  принципіне  негізделеді, 
сондықтан жүйеге жаңа тілді қосу әртүрлі жаңа бағдарламаларды 
құрастыру әрекетін сан жағынан шектейді. Неміс, орыс, ағылшын 
және  француз  тілдерін  талдау,  ал  сонымен  бірге  неміс  тіліне 
қатысты синтездеу жұмыстары жүйелі түрде жүргізілді. Туындау 
таралымы  (дерево)  түріндегі  «базистік  құрылымды»  –  талдау 
жұмысының  нәтижесі  деуге  болады.  Сөздіктер  жүйесі  (талдау 
сөздіктері,  семантикалық  сөздіктер  және  аударма  сөздіктері) 
әсіресе  талдау  процесіндегі  семантикалық  ақпарат  үшін  аса 
маңызды  болып  келетін  кез  келген  ақпаратты  пайдалануға 
мүмкіндік  туғызады.  Талдау  принципі  өзара  қисынды  түрде 
құрастырылған:  талдаудың  бірінші  бөлігі  «жоғарыдан  төменге 


110
қарай»  өңдеуден  басталады,  екінші  бөлігі  «төменнен  жоғарыға 
қарай» өңдеуден басталады, ал үшінші бөлікте алдыңғы екі нәтиже 
бір-біріне тіркесіп орындалады («жапсырылады»). Талдау соңында 
бұрыс синтаксистік құрылымды өңдеу шаралары қарастырылған. 
Машиналық аудармамен айналысатын ресейлік топтардың сан 
жағынан аз болуына қарамай, сөз болып отырған екінші кезеңде 
олардың зерттеу жұмыстарын аса нәтижелі деп сипаттауға болады: 
а) лингвистикалық және математикалық жабдықтау тұрғысынан 
алғанда, бастапқы машиналық аударма жүйелерінің жақсартылған 
түрлерінің құрастырылуы;
ә)  жаңаша  типті  жүйелердің  құрастырылуы  (Бүкілодақтық 
аударма орталығы, А.И.Герцен атындағы ЛГПИ-дегі «Статистика 
речи» тобы);
б)  автоматтанған  талдау  жүргізетін  жүйелердің  қарқынды 
түрде зерттелуі;
в)  машиналық  аударма  жүйелерін  әртүрлі  мәндік  дәрежеге 
қатысты тәжірибелік сынау деңгейіне дейін жеткізілуі және бұрын-
соңды  құрастырылған  жүйелердің  жетістіктері  мен  кемшіліктері 
бірдей дәрежеде сыннан өту нәтижелері осыны байқатады.
Аталған  кезеңде  КСРО  ҒА-ның  Қолданбалы  математика 
институтында французша-орысша машиналық аударма жүйесінің 
жаңаша түрі (жаңаша версиясы) құрастырылды. Француз тіліндегі 
математикалық  мәтінді  орысшаға  аударатын  бұл  жүйе  1967-
1976  жылдар  аралығында  О.С.Кулагинаның  ғылыми  жетекшілігі 
бойынша зерттеу жұмыстарын жалғастырды [19]. 
Жүйеде аударма әрекетіне қатысты өңдеу жұмыстары былайша 
іске асты: жүйеге «кіретін» ақпарат французша фразаның үстіңгі 
синтаксистік  құрылымы  (фраза  бойынша  аудару),  ал  жүйеден 
«шығатын» ақпарат – мән-мағыналық сәйкестікте тұратын орысша 
фразаның  үстіңгі  (поверхностный)  синтаксистік  құрылымы. 
Мұндай  тәсіл  екі  түрлі  тілдердің  сөздері  мен  фразалары 
мағыналарының  сәйкестігі  мен  олардың  құрылымдық  сәйкестік 
сипатына  негізделеді.  Бұлайша  талдаудың  негізгі  мақсаты 
бағыныңқылықтар  таралымы  (дерево)  түріндегі  фразалардың 
синтаксистік  құрылымдарының  жиынын  құру.  Осылайша  талдау 
әдісін  жүргізе  отырып,  синтаксистік  байланыстың  52  типі  жеке 
түрде бөлініп алынады. 


жүктеу 2,8 Kb.

Достарыңызбен бөлісу:
1   ...   32   33   34   35   36   37   38   39   ...   96




©g.engime.org 2024
әкімшілігінің қараңыз

    Басты бет
рсетілетін қызмет
халықаралық қаржы
Астана халықаралық
қызмет регламенті
бекіту туралы
туралы ережені
орталығы туралы
субсидиялау мемлекеттік
кеңес туралы
ніндегі кеңес
орталығын басқару
қаржы орталығын
қаржы орталығы
құрамын бекіту
неркәсіптік кешен
міндетті құпия
болуына ерікті
тексерілу мемлекеттік
медициналық тексерілу
құпия медициналық
ерікті анонимді
Бастауыш тәлім
қатысуға жолдамалар
қызметшілері арасындағы
академиялық демалыс
алушыларға академиялық
білім алушыларға
ұйымдарында білім
туралы хабарландыру
конкурс туралы
мемлекеттік қызметшілері
мемлекеттік әкімшілік
органдардың мемлекеттік
мемлекеттік органдардың
барлық мемлекеттік
арналған барлық
орналасуға арналған
лауазымына орналасуға
әкімшілік лауазымына
инфекцияның болуына
жәрдемдесудің белсенді
шараларына қатысуға
саласындағы дайындаушы
ленген қосылған
шегінде бюджетке
салығы шегінде
есептелген қосылған
ұйымдарға есептелген
дайындаушы ұйымдарға
кешен саласындағы
сомасын субсидиялау