102
Атап айтуға тұратын жайт – бірнұсқалылық пен көпнұсқалылық
талдауларды бір-біріне қарсы қою машиналық аударманың
қалыптасуының бірінші кезеңі үшін ерекше маңызды болуы.
Бірнұсқалылық талдауда кездейсоқтыққа жақын дәрежеде
таңдалып алынған сөйлем құрылымы дұрыс болмай шығуы
мүмкін, ал талдау жұмысын басынан қайталау мүмкіндігі бұл
жүйелерде алдын ала қарастырылмаған. Көпнұсқалық талдауда
біркелкіліктің бұзылу қаупі бар: құрастырылған құрылымдардың
саны нұсқаны дұрыс таңдау мүмкіндігінен де айтарлықтай үлкен
болуы мүмкін.
Сонымен бірге жақсы аудармашы (немесе автоматты аударма
жүйесі) мәтін мазмұнын түсіну үшін аударуға тиісті фразаның
дұрыс түрдегі бір ғана нұсқасын ұсынуы керек. Ал фразалардың
көпмағыналығы мәнмәтін бойынша өз шешімін табатыны
белгілі, сондықтан сөйлемдердің нақты мағыналарын ажырату
мәселесі мәтінде баяндалатын ақиқат жағдаятқа қатысты толық
мәтіннің синтаксистік және семантикалық заңдылықтарына
тікелей байланысты болып келеді. Мұндай семантикалық
мәліметтер машиналық аударманың бірінші және екінші
кезеңдерінде үзінділер түрінде ғана көрініс тауып, толығымен
қолданыла қоймады. Себебі, машиналық аударма жүйесін тиісті
лингвистикалық мәліметтермен жабдықтау ісі әлі де болса толық
зерттелмеген болатын.
Конфигурациялық талдау әдісі аударылуға тиісті мәтінді
(жүйеге енетін мәтін) сол тілдің алдын ала іріктеліп алынған
синтаксистік конструкциялар жиынымен салыстыру тәсіліне
негізделеді [33; 34; 35; 29]. Егер аударма жүйесіне енетін
мәтіннің анықталған конфигурациясы жиынның синтаксистік
конфигурацияларының біреуімен сәйкес келсе, онда мәтіндік
конфигурация танылды деп саналады және ол әрі қарайғы талдау
әрекетінде ықшамдалған түрінде көрініс табады. Синтездеу
әрекетінде анализдеу кезінде анықталған конфигурация
аударуға тиісті тілдің оған сәйкес келетін конфигурациясымен
салыстырылады.
«Фулькрумдер» әдісі бойынша жүргізілетін талдауда мәтіндегі
сөйлем төменгі сатыдағы бөліктерге ажыратылады. Осының
негізінде кез келген фразаны циклдық әдіс бойынша бірнеше
103
рет қарастыра отырып, іріленген фрагменттерге біріктіруге
болады. Әрбір кезекті циклдық қарастыру кезінде талдаудың
тірек нүктелері (fulсra) – фулькрумдер анықталады. Анықталған
фулькрумдер синтаксистік конструкциялардағы негізгі және
«басқарушы» сөздер тобына жатады. Олардың құрылымы мен
шекарасын анықтау циклдық қайталаулардың мақсатына енеді
(группа автомат. Перев. фирмы Bunker Ramo-Woldridqe Inc,
Canoqa Park, Calif., рук. П.Гарвин).
Тізбекті талдау әдісі арқылы фразаның синтаксистік
құрылымын тану үшін берілген сөйлем көрінісіндегі синтаксистік
категориялар тізбегін элементарлық тізбектерге бөлу қажет болады
(Харрис, Н.Сейгер).
Корреляциялық талдау кезінде әрбір сөзге индекстер
жиынтығы тіркеліп жазылады. Олардың әрбіреуі сол сөздің
осыған ұқсас индексі бар басқа сөздермен өзара байланыстылық
(корреляция) мүмкіндігін бейнелейді. Корреляцияның (өзара
қатынастылық) жоғары деңгейі лингвистикалық шектеулер
арқылы төмендетіледі. Мысалы, сөз, семантика және т.б. сатыларға
төмендейді.
Осымен бірге зерттеушілер машиналық аударма мәселесі үшін
толық мәтінді талдау мәселесін қарастыра бастады. Соның ішінен
толық мәтіндердің антецедент – зат есімдермен арақатынасын
анықтайтын ережелердің қарастырыла бастағанын атап кетуге
болады (антецедент – анафоралық қатынас. Мәселен, есімдіктен
бұрын тұратын есім сөз, ал есімдік осы есімге нұсқайды) [36; 37].
Қазіргі кездегі жоспарланып жатқан машиналық аударма
жүйесі екі топқа бөлінеді: бір тілден екінші тілге аударатын
– бинарлы және бірнеше тілдерден бір тілге немесе бірнеше
тілдерге аударуға арналған – көптік. Машиналық аударма
жүйелерінің бірінші түрінің әр уақытта артықтық сипаты адам
баласының аудару әрекетін модельдеудің және әрбір тілдер жұбы
деректерінің бинарлық сәйкестіктерін анықтаудың теориялық және
практикалық мүмкіндіктерінің табиғи жағдаятынан туындайды.
Машиналық аударманың бинарлық жүйелерінің кемшілігі –
аударуға тиісті «кіретін» тілге талдау жүргізу кезінде олардың
қасиеттеріне қатаң түрде тәуелді болуы және әрі қарайғы аударма
алгоритмін құрастыруда ол тәуелділіктің күрделене түсетіндігі.
104
Көптік аударма жүйесі аталған қатаң тәуелділікте болуына
қарсы мүмкіндіктер тудырып, талдау мен жинақтаудың тәуелсіз
алгоритмдерін құрастыруға жол ашты. Бинарлық аудармалардың
қосындысы ретінде түсіндірілетін көптік аудармадағы тіл
жұптарының саны n(n-1) формуласы арқылы анықталады. Бұл
өрнектегі n – аудару процесіне қатысатын тілдер жиынының саны.
Көптік жүйлерді зерттеуші ғалымдар талдау мен жинақтаудың
баламасы (инвариантты) ретінде аралық-тіл идеясын
(интерлингва) ұсынды [24].
Көптік аударма жасаудағы «аралық-тіл» идеясын іске асыруда
ең алғашқы елеулі орынға ие болатын ғалымдардың ішінен
Н.Д.Андреевтің аты бөліп айтуға тұрарлық [38].
Н.Д.Андреев
жетекшілік
еткен
зертхана
(ЭЛМП)
қызметкерлерінің осы бағыттағы көптеген ғылыми еңбектерінің
жарияланғаны осы саладағы мамандарға мәлім. Осы кезде Кеңес
Одағы мен шетелдердің ғылыми орталықтарымен басқа да ғылыми
топтар арасында аралық-тіл мәселесіне қатысты ой-пікірлер қызу
түрде талқыға түсе бастады.
Н.Д.Андреевтің концепциясы бойынша, аралық-тіл ұғымының
негізінде табиғи тілдердің табиғатында конгруэнттік сипаттың
болмайтындығы жайлы түсінік жатыр. Яғни аралық-тілдің
жасандылығының заңды екендігі, сол себепті одан конгруэнтті
емес элементтердің (артикльдер және т.б.) алынып тасталуы мен
көптеген тілдер үшін конгруэнтті элементтердің (етістіктің үш
түрлі шағы, көптік жалғау және т.б.) сақталып қалуы қажеттігі
туындайды. Сондықтан аталған мәселеге арналған алғашқы
зерттеулерге аралық-тіл өзінің құрылымы жағынан табиғи тілге
жақын тұрып, соның терминдерімен баяндалады.
Аралық-тіл идеясын өмірге әкелу мақсатындағы сан алуан
әрекеттерге қарамай, көптеген тілдерден бір тілге аудару
тәжірибесі машиналық аударма тарихында айтарлықтай өз орнын
ала алмады деуге болады. Теориялық тұрғыдан қарастырғанда
оның себебі аралық-тілдің грамматика мен лексика терминдерінде
сипатталуында деп түсіндіріледі. Шындығында, ол тек қана
семантикалық тұрғыда, семантикалық барабарлық түсінігінде
көрініс табуы қажет болатын.
Сыншылар аралық-тіл арқылы аударма жасаудың төмен
Достарыңызбен бөлісу: |