Аударманың Өзекті мәселелері алматы, 2015

жүктеу 2,8 Kb.

Pdf просмотр

бет	33/96
Дата	25.05.2018
өлшемі	2,8 Kb.
	#17606
түрі	Бағдарламасы

1 ... 29 30 31 32 33 34 35 36 ... 96

Джорджтауындық эксперимент

99
Бұл бағытты, шартты түрде, негізгі үш кезеңге бөліп қарастыруға
болады  [25;  19;  26;  27].  Мысалы,  ол  хронологиялық  жағынан
былайша айырым табады:
1-кезең: 1949 жылдан бастап 60-жылдардың ортасына дейін;
2-кезең:  60-жылдардың  ортасынан  70-жылдардың  аяғына
дейін;
3-кезең: 80-жылдардан қазіргі кезеңге дейін.
Мұндай үш кезеңге бөлуге негіз болған ғылым мен техниканың
дамуындағы қол жеткен нәтижелер екені белгілі. Міне, солардың
ішінен лингвистикалық, математикалық, техникалық машиналық
аударма жүйесін жабдықтау мәселелері айрықша орын алады.
1954 жылы АҚШ-та Джорджтаун университетінде проф. Леон
Е.Достердің жетекшілігімен GAT жүйесі негізінде құрастырылған
орыс  тілінен  ағылшын  тіліне  аударатын  машиналық  аударма
жүйесі  жұртшылық  назарына  ұсынылды.  Бұл  бір  тілден
екінші  тілге  ЭЕМ  (IBM-701)  арқылы  орындалған  ең  алғашқы
аударма  тәжірибесі  болып  саналады.  Ғылымда  бұл  тәжірибе
Джорджтауындық  эксперимент  деген  атпен  тарихта  қалды
[24].  Аталған  экспериментте  «тікелей»  машиналық  аударма
жағдаяты  (бір  тілдік  жұпқа  қатысты  жүйелер)  тексерістен  өткен
болатын.  Жүйе  сөздігінің  көлемі  бар  болғаны  250  сөзді  ғана
қамтыса,  ал  оның  грамматикасы  тек  алты  синтаксистік  ережеге
ғана негізделеді [20]. Кеңес Одағында француз тілінен орысшаға
аударатын машиналық аударманың бірінші эксперименттік жүйесі
О.С.Кулагина  мен  И.А.Мельчуктың  авторлығымен  1955-1956
жылдары  құрылғаны  осы  сала  мамандарына  белгілі  [28].  Бұл
жүйедегі  негіз  сөздер  сөздігі  1236  сөз,  ал  сөз  айналым  сөздігі
250 бірлікті қамтиды. Аударма бірлігі ретінде толық сөйлем түрі
есептеледі.  Морфологиялық  талдау  алгоритмі  жалғаулардың
кестесімен әрекет ету арқылы аударылатын фразаның (сөйлемнің)
сөздеріне  қажетті  деген  грамматикалық  ақпаратты  тіркейді.  Бұл
жүйенің  артықшылығы  –  омонимдік  сөздерді  ажырата  алатын
топтамасы  (блогі)  болуында.  Орыс  тіліндегі  фразаны  синтездеу
топтамасында  сөздердің  орналасу  тәртібінің  дұрыстығын
тексеру  мүмкіндігі  алдын  ала  қарастырылған.  Сонымен  бірге,
Т.Н.Молошнаяның  жетекшілігімен  ағылшынша-орысша  аударма
жасау жүйесінің алғашқы жобасы ұсынылды [29].

100
Машиналық аударма жұмысының бастамасы, жалпы алғанда,
өрлеу сипатында болды – тілшілер зерттеудің жаңа бағытын ашты,
ал  программистер  күн  тәртібіндегі  күрделі  және  аса  қызықты
мәселелердің шешімін табуға қызыға кірісті. Бұл кезеңде тіл мен
аударма  процесіне  қатысты  барлық  мәліметтерге  қол  жеткендей
сезілді. Сондықтан егер оларды формалды пішінге келтіру ісі жүзеге
асырылса, машиналық аударманың әмбебаптық жүйесі құрылып,
алға  қойылған  негізгі  мақсатқа  тез  арада  жететіндей  көрінген
болатын. Бірақ бастапқы және кейінгі тәжірибелердің нәтижелері
бұл мәселенің шешімі ойлағандай оңай табылмайтынын байқатты.
Солай  бола  тұра,  атқарылған  жұмыстар  тек  машиналық
аударма аясындағы зерттеулерге ғана емес, сонымен бірге ғылыми
ізденушілерді  тілдің  теориялық  және  құрылымдық  жағына  да
көңіл аударуға ынталандырды.
Қорыта айтқанда, автоматты аударманың бірінші кезеңі белгілі
дәрежеде  айтарлықтай  нәтижелі  болды.  Себебі,  аталған  кезеңде
көптеген  іргелі  мәселелердің  бастамасы  анықталып,  зерттеудің
болашағы сараланып, жолдары айқындалды. Мысалы, автоматты
сөздіктерді  құрастыру,  аралық-тілді  құрастыру,  сөздердің
омонимдік  сипаты  мен  синтаксистік  құрылымы,  яғни  сөздердің
сөйлемдегі  тіркесімі,  фразеологизмдердің  жасалу  жолдары  және
көптеген басқа да мәселелердің сыр-сипаттары анықталды.
Осы мезгілдерде, бүгінгі таңда да аса маңызды деп саналатын,
синтаксистік  талдаудың  алгоритмінің  алғашқы  нұсқалары
зерттелді: синтаксистік тәуелділік пен тікелей құрастырушыларды,
болжамдық  талдауды,  көпнұсқалы  синтаксистік  талдауды,
«фулькрумдер»  әдісімен  талдауды,  конфигурациялық  талдауды
және т.б. әдіс-тәсілдерді ескере отырып, талдау жүргізу жақтары
қарастырылды.
Терминтану  саласындағы  бағыныңқылықтың  моделі  мен
тікелей құрастырушылардың моделін талдаудан толық сөйлемнің
құрылымдық  байласымын  анықтауға  болатындығы  байқалды.
Мұндай құрылымның көпмағыналығының басын ашып алу үшін
әртүрлі  «сүзгілердің»  әдістері  қолданылады  (қара:  ЛМУ-дың
математикалық  лингвистика  зертханасындағы  С.Я.Фитиалов  пен
Г.С.Цейтиннің  жетекшілік  етулерімен  жүргізілген  жұмыстар;
GETA  атты  Гренобльдық  топ  –  Centre  d’études  pour  la  tradution

101
autmatigue, жетекшісі В.Вокуа). «Күшті» сүзгі ретінде Д.Е.Хейстің
байланыс  «күші»  ұғымы  ұсынылды  (The  Rand  Corporation
Automatic  Language  Data  Processing  Croup.  Santa  Monica  (Calif.))
[30].
Болжамдық  талдау  сөздік  мақаланың  айрықша  құрылымына
негізделеді  (Национальное  бюро  стандартов  США,  И.Родес;
Вычислительная лаборатория Гарвардского университета (Масс.),
рук.  А.Эттингер).  Мұнда  әрбір  сөзге  оның  барлық  байланыс
мүмкіндігі жайлы ақпарат тіркеледі. Талдау тәртібі (процедурасы)
мәтінді солдан оңға қарай тексеріп шығу тәсілі бойынша жүргізіледі.
Осының  нәтижесінде  әрбір  кезекті  сөздің  «өлшемінің»  алдыңғы
сөз бойынша жасалған болжамға сай келетіндігі тексеріледі. Егер
ол жасалған болжамға сай келмесе, ондай сәйкестікті іздестіру сол
жаққа қарай ауысады. И.Родестің ғылыми тобында бірварианттық
талдау қарастырылады, яғни талдауға түскен сөздің сол жағында
орналасқан бірінші сөз сәйкестік «иесі» деп саналып, кез келген
сөйлемге тек бір ғана синтаксистік құрылым сәйкес қойылады.
Сөйлемнің  синтаксистік  құрылымының  бірнеше  нұсқаларын
есепке  алуға  мүмкіндік  туғызатын  көпнұсқалық  талдауды  бір
қадам алға басу деп санауға болады (С.Куно, А.Эттингер, Гарвард
университетінің  Есептеу  зертханасы).  Көпнұсқалылық  талдауда
сөздің  синтаксистік  потенциалды  мүмкіндіктерінің  молдығының
арқасында  синтаксистік  байланыста  тұратын  сөздерге  болжам
жасауға  болатындығы  негізге  алынады.  Көпнұсқалылық
талдаудың алғашқы грамматикасы 2100 ереже мен 82 синтаксистік
болжамды қамтыды. Сөйлем құрылымының диаграммасы тікелей
құрастырушылар моделі негізінде құрылды. Осының нәтижесінде
мүмкін болатын барлық варианттар іріктеліп, олардың көпшілігі
әртүрлі сүзгілер көмегімен сан жағынан шағындалды. Болжамдық
талдау  алгоритмінде  көпнұсқалы  фразаның  синтаксистік
құрылымына тән екімәнділік ақиқаттығынан гөрі, оны таңдалып
алынған  нұсқаларды  іріктеу  әрекетінің  формалды  сипатының
салдары деуге болады. Міне, бұл жүйелердің осалдығы да осында.
Дегенмен,  синтаксистік  болжам  жайлы  идеяның  өзі  де  құнды
деуге болады. Бұл ой-пікірге қазіргі кездегі кейбір грамматикалық
болжамдарға  сүйенетін  автоматты  талдау  жүйелері  негізделуде
[31; 32].

жүктеу 2,8 Kb.

Достарыңызбен бөлісу:

1 ... 29 30 31 32 33 34 35 36 ... 96