Дипломдық ЖҰмыс 5B070300 «Ақпараттық жүйелер»



жүктеу 1,96 Mb.
Pdf просмотр
бет11/20
Дата11.02.2023
өлшемі1,96 Mb.
#41257
түріДиплом
1   ...   7   8   9   10   11   12   13   14   ...   20
2020 БАК Марат Нұрсұлтан Олжасұлы

Мұғаліммен оқыту түсінігі.
Мұғаліммен оқыту (Supervised learning) - келесі 
міндетті шешуге арналған машиналық оқыту бөлімдерінің бірі. Көптеген 
нысандар (жағдайлар) және көптеген ықтимал жауаптар (Пікірлер, реакциялар) 
бар. Жауаптар мен объектілер арасында кейбір тәуелділік бар, бірақ ол белгісіз. 
Тек қана прецеденттердің соңғы жиынтығы белгілі - «объект, жауап» жұбы, 
оқыту үлгісі деп аталады. Бұл деректер негізінде тәуелділікті қалпына келтіру 
қажет, яғни кез келген объект үшін жеткілікті дәл жауап беруге қабілетті 
алгоритм салу. Жауаптардың дәлдігін өлшеу үшін сапа функционалы белгілі бір 
түрде енгізіледі. 
Data mining түсінігі.
 
Data mining - кең түсінік. Бүгінде оның ондаған 
анықтамалары бар. Жалпы мағынада деректерді талдау - есептеумен байланысты 
зерттеулер көптеген параметрлерге ие көп өлшемді деректер жүйесі. Деректерді 
талдау барысында зерттеуші осы деректермен сипатталатын құбылыстың сипаты 
туралы белгілі бір түсініктерді қалыптастыру мақсатында іс-әрекеттер 
жиынтығын жүргізеді. Əдетте, деректерді талдау үшін әртүрлі математикалық 
әдістер қолданылады. Деректерді талдауды тек ақпаратты өңдеу ретінде 
қарастыруға болмайды. Деректерді талдау - бұл ең алдымен, гипотезаны тексеру 
және зерттеуші есептерін шешу құралы.
«Модель» сөзі (лат . mοντέλο modelium) «Өлшем», «тәсіл», « қандай - онда 
затты». Модельдерді құру - тәуелділікті анықтауға, болжауға, топтарға бөлуге 
және басқа да көптеген міндеттерді шешуге мүмкіндік беретін қоршаған ортаны 
зерттеудің әмбебап тәсілі. Модельдеудің негізгі мақсаты модельдеуші жүйенің 
жұмысын жақсы көрсету керек. Модель - түпнұсқаны жақсы зерделеу немесе 
оның қандай да бір қасиеттерін жаңғырту үшін бір жүйені басқа жүйемен 
алмастыру үшін объектінің, жүйенің объектісі немесе сипаттамасы. Модельдеу - 
білімді алудың, сипаттау мен пайдаланудың әмбебап әдісі. 
Модельдеу түрі бойынша модель бөлінеді: 
- эмпирикалық - эмпирикалық фактілер, тәуелділік негізінде алынған; 
- теориялық - математикалық сипаттамалар, заңдар негізінде алынған; 


15 
- полуэпирикалық - эмпирикалық тәуелділік және математикалық 
сипаттамалар негізінде алынған. 
Деректерге анализ жасау - бұл шешім қабылдау үшін ұйымдастырылған 
деректерден ақпаратты алу әдістері мен құралдарының жиынтығы. Анализ жасау 
- оны алғаннан кейін және жинағаннан кейін ақпаратты өңдеу ғана емес, бұл 
гипотезаны тексеру құралы. Деректерді кез келген талдаудың мақсаты - 
зерттелетін жағдайды толығымен түсіну (үрдістерді, соның ішінде жоспардан 
жағымсыз ауытқуларды анықтау, болжамдау және ұсынымдарды алу). Осы 
мақсатқа жету үшін келесі деректерді талдау міндеттері қойылады: 
-
ақпарат жинау,
-
ақпаратты құрылымдау,
-
заңдылықтарды анықтау, талдау,
-
ұсыныстарды болжау және алу.
Барлық деректер маңызды ақпараттан тұрады, бірақ әр түрлі сұрақтар үшін. 
Барлық массивтен нақты мән-жайлар үшін пайдалы деректерді бөлу үшін оларды 
өңдеу қажет. 
Деректерді өңдеу процесінде анализге дайындау жүргізіледі, оның 
нәтижесінде олар шешілетін есептің ерекшелігімен анықталатын талаптарға 
сәйкес келтіріледі. 
Алдын ала өңдеу Data Mining маңызды кезеңі болып табылады және егер ол 
орындалмаса, одан кейінгі анализдде көптеген жағдайларда аналитикалық 
алгоритмдер жұмысына кедергі болатынды немесе олардың жұмысының 
нәтижелері дұрыс емес болуы мүмкін . Басқаша айтқанда, GIGO - garbage in, 
garbage out (кіре берістегі қоқыс, шыға берістегі қоқыс) принципі іске 
асырылады. 
Деректерді өңдеу екі бағытты қамтиды: тазалау және оңтайландыру. Тазалау 
деректер сапасын төмендететін және аналитикалық алгоритмдердің жұмысына 
кедергі келтіретін әртүрлі факторларды болдырмау мақсатында жүргізіледі. Ол 
дубликаттарды, қарама-қайшылықтарды және жалған мәндерді өңдеуді, 
рұқсатнамаларды қалпына келтіру мен толтыруды, шуды басуды және 
ауытқушылық мәндерді редакциялауды қамтиды. Сонымен қатар, тазарту 
барысында құрылымның бұзылуы, деректердің толықтығы мен тұтастығы 
қалпына келтіріледі, қате форматтар өзгертіледі. 
Деректерді оңтайландыру алдын ала өңдеу элементі ретінде өлшемдікті 
азайту, білмейтін белгілерді анықтау және алып тастау кіреді. Тазалаудан 
оңтайландырудың негізгі айырмашылығы тазалау процесінде жойылатын 
факторлар тапсырманы шешудің дәлдігін айтарлықтай төмендетеді немесе 
аналитикалық алгоритмдердің жұмысын мүмкін емес етеді. Оңтайландыру 
кезінде шешілетін мәселелер деректерді нақты міндетке бейімдейді және оларды 
талдаудың тиімділігін арттырады. 
Деректерді алдын ала өңдеу және тазалау - бұл модельді оқыту үшін 
деректер жинағын пайдаланбас бұрын орындалуы қажет маңызды міндеттер. 
Өңделмеген деректер жиі бұрмаланған және сенімсіз, және оларда мәндерді 
жіберіп алмауы мүмкін. Модельдеу кезінде мұндай деректерді пайдалану дұрыс 


16 
емес нәтижелерге әкелуі мүмкін. Бұл есептер деректер тобын өңдеу және талдау 
процесінің бір бөлігі болып табылады және әдетте қажетті алдын ала өңдеуді 
анықтау және жоспарлау үшін пайдаланылатын деректер жинағын бастапқы 
зерттеуді білдіреді. 
Нақты деректер әр түрлі көздер мен процестерден кейін өңдеу үшін 
жиналады. Олар деректер жиынтығының сапасына теріс әсер ететін қателер мен 
зақымдарды қамтуы мүмкін. Бұл деректер сапасына типтік проблемалар болуы 
мүмкін: 
Толық емес: деректерде атрибуттар жоқ немесе оларда мәндер жоқ. 
Шу: деректер қате жазбалар немесе шығарындылар бар. 
Келіспеушілік: деректер өзара қақтығысатын жазбалардан немесе 
алшақтықтардан тұрады.

жүктеу 1,96 Mb.

Достарыңызбен бөлісу:
1   ...   7   8   9   10   11   12   13   14   ...   20




©g.engime.org 2024
әкімшілігінің қараңыз

    Басты бет
рсетілетін қызмет
халықаралық қаржы
Астана халықаралық
қызмет регламенті
бекіту туралы
туралы ережені
орталығы туралы
субсидиялау мемлекеттік
кеңес туралы
ніндегі кеңес
орталығын басқару
қаржы орталығын
қаржы орталығы
құрамын бекіту
неркәсіптік кешен
міндетті құпия
болуына ерікті
тексерілу мемлекеттік
медициналық тексерілу
құпия медициналық
ерікті анонимді
Бастауыш тәлім
қатысуға жолдамалар
қызметшілері арасындағы
академиялық демалыс
алушыларға академиялық
білім алушыларға
ұйымдарында білім
туралы хабарландыру
конкурс туралы
мемлекеттік қызметшілері
мемлекеттік әкімшілік
органдардың мемлекеттік
мемлекеттік органдардың
барлық мемлекеттік
арналған барлық
орналасуға арналған
лауазымына орналасуға
әкімшілік лауазымына
инфекцияның болуына
жәрдемдесудің белсенді
шараларына қатысуға
саласындағы дайындаушы
ленген қосылған
шегінде бюджетке
салығы шегінде
есептелген қосылған
ұйымдарға есептелген
дайындаушы ұйымдарға
кешен саласындағы
сомасын субсидиялау