Машиналық оқытудың алгоритмдері. 1-сабақ
Әлемде машиналық оқытудың бір ғана тәсілі болмайды. Алгоритмдердің көптеген түрлері бар. Машиналық оқытуда төрт негізгі бағыт бар: классикалық оқыту, нығайтумен оқыту, ансамбльдер және нейрондық желілер.
Машиналық оқытудың алғашқы әдістері жиырмасыншы ғасырдың 50-жылдары пайда болды. Қазіргі уақытта интернеттің жартысы осы алгоритмдерді пайдаланады. Мысалы мақалалар тізімін көргенде, оны ары қарай оқып шығу керектігін білесің. Бұл осы классикалық машиналық оқытудың нәтижесі болып табылады. Классикалық машиналық оқыту екі негізгі топқа бөлінеді. Олар: бақыланатын оқыту және бақыланбайтын оқыту.
Бірінші жағдайда, машинада «бақылаушы» немесе «мұғалім» болады, ол машинаға барлық жауаптарды береді. Мысалы, суреттегі обьектінің адам немесе жануар екенін айқындайды. Мұғалім адам мен жануарға қатысты деректерді өзіне белгілеп алады. Машина осы мысалдарды қолданып оқытады.
Бақыланбайтын оқытуда машина әртүрлі обьектілер мен тапсырмаларды анықтайды. Бұл оқытуда деректер белгіленбейді, сондықтан алгоритм заңдылықтарды табуға тырысады. Әрине, машина мұғалімнің көмегімен тезірек үйренеді, сондықтан ол тапсырмаларда жиі қолданады. Мұндай тапсырмалардың екі түрі бар: жіктеу және регрессия.
Жіктеу объектілерді белгілерінің ерекшеліктеріне қарай киімдерді көлемі бойынша, құжаттарды тіл бойынша, музыканы жанр бойынша бөледі. Жіктеу мынадай мақсаттарда қолданылады:
спам сүзу;
тілді анықтау;
ұқсас құжаттарды іздеу;
қолмен жазылған белгілер мен сандарды тану;
алаяқтықты анықтау.
Регрессия – санды болжайтын жіктеу. Мысалы, автомобильдің жүгірісі бойынша бағасын анықтау. Тәулік уақыты бойынша кептелісті, компанияның өсуі бойынша сұраныс көлемін анықтау және т.б. Регрессия келесі мақсатта қолданылады:
акция бағасын болжау;
сұраныс пен сату көлемін талдау;
медициналық диагнозды анықтау.
Бақыланбайтын оқу бақыланатын оқудан кейін ойлап табылды. Ол көбінде бізде белгіленген деректер болмаған жағдайда қолданылады. Жүйе тапсырманы адамның көмегінсіз орындауды үйренеді. Бақыланбайтын оқытудың негізгі алгоритмдері кластерлеу, өлшемділікті азайту (жалпылау) және ережелерді іздеу болып табылады.
Кластерлеу – алдын ала анықталмаған кластар бойынша жіктеу. Мысалы, қандай түс бар екенін ұмытқан жағдайда, шұлықтарды түсі бойынша бөлу. Кластерлеу алгоритмі кейбір белгілер бойынша ұқсас объектілерді табады және оларды кластерге біріктіреді. Қазіргі уақытта кластерлеу келесі мақсатта қолданылады:
картадағы жақын нүктелерді біріктіру;
нарықты сегменттеу;
кескіндерді сығымдау;
қалыптан тыс мінез-құлықты анықтау.
Өлшемділікті азайту (жалпылау) белгілерді жоғары деңгейлі белгілерге жинайды.
Ұсыныс жүйесі – өлшемділікті төмендету әдісі. Оның көмегімен фильм, музыка, ойын және т.б. ұсынатын жүйені алуға болады. Өлшемділікті азайту келесі мақсатта қолданылады:
ұсыныс жүйелері;
ұқсас құжаттарды іздеу;
жалған суреттерді табу.
Ережелерді іздеу (ассоциация) сатып алу себетіне талдау жасау, маркетинг стратегиясын және басқа да жүйелерді автоматтандырудың барлық әдістерін қамтиды. Бұл алгоритм бір нәрсенің дәйектілігі болған кезде және одан үлгіні тапқымыз келгенде пайдалы. Қазіргі кезде келесі мақсатта қолданылады:
Достарыңызбен бөлісу: |