15.4.
Деректерді интеллектуалды талдау
Қазіргі уақытта компьютерлік ақпараттық технологиялардың
жаңа бағыты дамуда — деректерді интеллектуалды талдау (ДИТ),
оның негізгі мақсаты — қабылданатын шешімдердің тиімділігін
арттыру.
ДИТ жүйелері ДҚБЖ пайдалануға жаңа интеллектуалды
көзқарасты іске асырады, əсіресе қызметтің əртүрлі салаларында
іздеу жəне заңдылықтарды анықтау
. Сонымен, «Ребус» (dBase-III)
ДҚБЖ пайдалану кезінде өндіріс жəне пайдалану үдерісінде
өнімдердің бас тартуларының себептерін есепке алу жəне кейінгі
талдау үшін дерекқорлар дамытылды. Қазіргі уақытта ДҚБЖ
дамуымен бұл ДҚ шығару бағыты қызметтің ең жауапты
салаларында — маркетингте, өндірісте, қызмет көрсетуде бизнес-
процесстерді талдау кезінде пайдаланыла бастады.
ДИТ дамуы келесі техникалық жəне əлеуметтік-экономикалық
факторлармен негізделген:
•
параллельді архитектурамен жəне желілік технологиялардың
дамуымен бірге компьютерлерің құрылуымен ақпараттарды
сақтаудың
біршама
арзан
жəне
əжептəуір
көлемді
құрылымдарының (100 Гбайтқа дейін) пайда болуымен;
•
SQL-сұрау
салулардың
негізінде
ДҚБЖ
құралдарын
стандарттаумен;
•
өнімдер мен қызмет көрсетулерді тұтынушыларға əсер етуі
үшін бəсекелік күрестің шиеленісуімен;
•
тұтынушылардың жаппай қызмет көрсетуінен дербестікке
ауысуымен;
ДИТ үдерісінің келесі кезеңдерін ажыратады:
73
деректерді таңдап алу;
деректерді трансформациялау;
ақпараттарды талдау.
Əдеттегідей, нақты міндетті шешу үшін ДҚ тұратын барлық
ақпарат талап етілмейді, яғни бар кестелерден алаңдардың
анықталған номенклатурасымен жазбаларды таңдап алу талап
етіледі.
ДИТ үшін деректерді таңдап алу технологиясы:
талап етілетін құрылыммен кесте құру (
Деректерді талдау
)
(ДҚ бар кестелерінен алаңдардың құрамымен);
кестелерден талап етілетін ақпараттарды таңдап алуға сұрау
салулар құру жəне оны
Деректерді талдау
кестесіне қосу.
Дерекерді талдау үшін кесте құрғаннан кейін кейде ақпаратты
бажайына келтіру (трансформация) жүргізіледі — қосарлаушы
жазбаларды өшіру, алаңдардағы деректерді бірыңғай форматқа
келтіру жəне басқалар.
Анықталған заңдылықтарды алу мақсатында ақпараттарды
тікелей талдау үшін математикалық статистиканың таныс əдістері
қолданылады. Сонымен бірге ақпаратты талдау үдерісі екі негізгі
рəсімдерге саяды: жорамалды тексеруге жəне заңдылықтарды
іздеуге.
Жорамалды тексеру үшін
Деректерді талдау
кестесінде
тұратын есептеме түріндегі (кесте, графика, диаграмма) ақпаратты
ұсынады, бұған қоса бұл есептеменің нəтижелері əртүрлі
математикалық əдістерді пайдалана отырып, статистикалық
талдауға ұшырауы мүмкін.
Заңдылықтарды іздеу келесі операцияларға саяды: болжамды
модельдеуге;
байланыстарды
талдауға;
ДҚ
сегменттеуге;
ауытқуларды сəйкестендіруге.
Болжамды модельдеудің мақсаты математикалық медельдерді
жасау жəне талдау негізінде деректердің талданатын жүйелерін
жүргізудің жалпыланған модельдерін құруға жасалады.
ДҚ
жекелеген
жазбаларының
арасындағы
тəуелділігі
(байланысы)
корреляциялық
жəне
кемімелдік
талдаудың
классикалық əдістерімен анықталады.
ДҚ сегменттеудің мақсаты — деректерді талдаудың салаларын
тарылту мақсатымен топтарға жазбаларды бөлгілеу — деректерді
топтастырумен есептемелерді құру болып табылады.
Ауытқуларды сəйкестендірудің мақсаты белгіленген топтарға
кірмейтін жазбаларды анықтау жəне деректерді математикалық
өңдеуді жүргізу болып табылады, яғни бұл ауытқулар «шу» немесе
олар заңды үдеріс болып табылады ма, соны белгілеу.
74
|