114
Грамматикалық және дамыған лексикалық талдауларға
бағышталған АМПАР жүйесі де көпдеңгейлі. Онда сөз
айналымдары, бірмағыналы және көпмағыналы сөздер жеке
топтамалар арқылы өңделіп, тек сөйлем құрылымдары ғана
өзгеріске ұшырайды. Аталған жүйе іс жүзінде қолданыс табуда.
Белгілі ғалым, профессор Р.Г.Пиотровский жетекшілік ететін
Бүкілодақтық «Статистика речи» тобы 1970 жылдан бастап
машиналық аударма жүйесі бойынша зерттеулер жүргізді. Бұл
жүйе қазіргі уақытта да актуалды болып саналатын итеративті-
стратификациялық тәсілге негізделеді. Мұндай әдіс бойынша
аударуға тиісті мәтінді қайшылықсыз сипаттау үшін ол кезеңдік
сипатта қарастырылуы қажет.
Ленинградтағы А.И.Герцен атындағы Педагогикалық инсти-
туттың инженерлік лингвистика зертханасында 1975 жылдан
бастап зерттеле бастаған СИЛОД атты аударма жүйесі көптілді
жүйе ретінде өз міндетін атқара бастады. Оның сөздіктермен және
морфологиялық тұрғыда жабдықталуы аса күшті және құрамында
трансфер қолданыс табатын грамматикасы бар жүйе болып
саналады.
Осы кезеңдерде ағылшынша-орысша және французша-орысша
машиналық аударманың түрлері құрастырылып, тәжірибелік
сыннан өтеді. Осы әрекеттердің нәтижесінде жекеленген
синтаксистік конструкциялардың құрылымы мен мағынасын
тануға мүмкіндік тудыратын талдаудың фреймдік және тезаурустық
негіздері қаланады [46; 47; 48]. Аталған жүйеде машиналық
аударманың алғашқы кезеңінде ұсынылған «фулькрумдар»
әдісінің дамыған түрі ретінде саналатын машиналық аударма
алгоритмдерін деңгейлік тұрғыда құрастыру ескерілген.
Машиналық аударма жүйелерін құрастырудың екінші кезеңін
қысқаша қарастыра отырып, олардың негізгі сипаттамалары мен
жалпы ерекшеліктерін былайша атап кетуге болады [19; 25]:
1) көпдеңгейлі талдау мен синтаксистік деңгейдің толық
дәрежеде көрініс табуы;
2) талдау нәтижелерінің көпнұсқалылығы. Аталған жайт
көптеген мүмкіндіктердің ішінен ең дұрысы деп саналатын біреуін
ғана таңдап алу ықтималдығын күшейтеді.
3) лингвистикалық мәліметтерді сақтайтын қатал алгоритмнен
115
барынша «жұмсақ» жүйеге ауысу мүмкіндігі. Соңғы жүйеде
барлық лингвистикалық мәліметтер олардың алгоритмінен
бөлектелген [41; 19].
Жоғарыда
аталған
жүйелердің
сипаттамалары
мен
ерекшеліктері машиналық аударма жұмысын ұйымдастыруға оң
әсерін тигізді. Басқаша айтқанда, олар тілшілер мен математика
мамандарына жүйенің ерекшелік аспектілерін қарқынды түрде
зерттеуге бағыт-бағдар беріп, ынталандыруға себепші болды.
Сонымен бірге аталған жайт тілдің формалды моделін құру жолын
зерттеу мен оны дұрыс қолдану мүмкіндіктерін анықтауды қажет
етті. Ал табиғи тілді формалды сипаттау әдісі грамматикаларды
бірізділікке келтіруге мүмкіндік тудырды. Сондықтан машиналық
аударманың даму кезеңінің екінші сатысында әртүрлі тілдерді
сипаттау үшін формалды модельдер қолданумен бірге тілдік
деректерді қалаған дәлдікпен (адекватно) сипаттауға мүмкіндігі
мол жаңа модельдер үлгісін құру қажет болды.
Сонымен, машиналық аударманың даму кезеңінің екінші сатысы
бірінші буынға қатысты практикалық жүйелердің дамуымен,
тәжірибе жинақтаумен, оны іске қосумен, сөздік базасының кең
түрде өріс алуымен және тәжірибелік тұрғыда болса да барынша
жабдықталған теориялық жүйелерді құрумен сипатталады.
Қол жеткен практикалық және теориялық нәтижелер
машиналық аударманың даму сатысының келесі үшінші кезеңіне
көшуге даяр екендігінің айғағы болып саналды. Бірақ келесі
сатыға өту жолы бірнеше экстралингвистикалық деректерді алдын
ала анықтап алуды қажет еткені белгілі.
Біріншіден, 70-ші жылдардың аяғында ақпарат ағымы бұрын-
соңды болмаған қарқында дамиды. Мысалы, америкалық және
канадалық корпорациялар бір жылдың ішінде 2,5 млрд. сөзге дейінгі
мәтіндерді аударып отыруға мүмкіндігі болған. Егер АҚШ-та 1966
жылы аударма жұмысының біржылдық шығыны 22 млн. доллар
болса, 1981 жылы ол шығын 200 млн. долларға дейін өседі. Кеңес
Одағында штаттағы аудармашылардың айлығын санамағанда,
тек тапсырыс бойынша орындалатын аударма жұмысының өзіне
орасан үлкен қаржы жұмсалған екен. Бірақ ақпарат ағымының
(ғылыми-техникалық мәтіндер, патенттер, құжаттар мен арнаулы
қағаздар) соншалық үлкен дәрежеде болуына байланысты оларды
116
тек дәстүрлі жолмен, яғни аудармашылар күшімен аударып
шығу мүмкін емес еді. Сол себепті, қазіргі кезде автоматтандыру
арқылы техникалық стильдегі мәтіндерді аударуды жеңілдету мен
жетілдіру маңызды мәселеге айналып отыр.
Екіншіден, спеллер типті өндірістік лингвистикалық процес-
сорларды құрастыру мен оларды баспа мен лексикографиялық
жұмыстарда іс жүзінде қолдану, сол сияқты сөздерді өңдеу
жүйесінде (word processors) күшті терминологиялық банктерді
пайдалану – «лингвистикалық» автоматтанған жүйелерді қолдану
арқылы нақты практикалық нәтижелерге ие болу мүмкіндігінің
кепілі.
Үшіншіден, машиналық аударманың жаңа кезеңіне өтуге
қатысты ерекше жасалған алғышарт ретінде есептеу техникасының
дамуына байланысты барынша жағдай жасалуы – дисплейлердің
пайда болуы, дербес компьютерлер мен сканерлердің өмірге келуі,
дербес ЭЕМ-ның күш-қуатының өсуі және т.б. Міне, осының
бәрі теоретика-лингвистикалық зерттеулерге көзқарасты басқаша
өзгертіп, оны практикалық деңгейге дейін көтерді.
Машиналық аударма жүйелерін құрудың бірінші және екінші
кезеңдерін сипаттауда, біз нақты лингвистикалық ұжымдардың
жұмыстарына айрықша назар аудардық. Ал енді машиналық
аударманың қазіргі кезеңін сипаттау үшін оның стратегиясын
таңдау мен практикалық жүйелерін тиімді пайдалануға
байланысты негізгі теоретикалық және техникалық мәселелерді
анықтауға қатысты кейбір мәселелерге тоқталайық. Әрине,
машиналық аударманың мұндай негізгі мәселелерін талқылау
машиналық аударма жүйесінің болашақтағы даму жағдаятын да
сөз етуді қажет етеді.
Бірінші мәселе мынадай мүмкін болатын үш түрлі теориялық
стратегияны талқыға салуды қажет етеді:
– тікелей бинарлық машиналық аударма;
– трансфер арқылы аудару;
– аралық-тіл арқылы аудару, сонымен бірге олардың грам-
матикалық мүмкіндіктерінің ерекшеліктерін іске асыру.
Тікелей бинарлық аударма машиналық аударманың «ескі»
жүйелерінен орын алса да, сол қалыпта машиналық аударманың
көптеген практикалық жүйелерінің негізгі стратегиясына
Достарыңызбен бөлісу: |