90
ҚазаҚ
стандағы
практикалық журналистика
3.0
90
ҚазаҚстандағы
практикалық журналистика
3.0
практикалыҚ нұсҚаулыҚ
Ашық деректерге ресми сайттардағы барлық мәліметті жатқызуға болады. Мысалы, data.egov.
kz жүйесіндегі барлық мәліметті ашық датаға жатқызамыз. Ол сайтта еліміздің ресми ұйымдары
жинақтаған деректер
тақырыптар бойынша бөлініп, ұсынылған.
Жабық деректерге заң жүзінде жүгінуге тыйым салынған. Дата журналистер қауымдастығы бұл
тұрғыда жабық деректерді қолданғанда «журналист әдебіне» қатысты ұстанымдарды ескерген жөн
деп санайды. Себебі жабық деректерді арнайы бағдарламалау тілін білетін адам жинақтай алады.
Бірақ бұл әрекетті заң бұзушылыққа жатқызатындар бар.
Мәліметтер кестеде рет-ретімен, атауымен жүйеленіп тұрса, онымен жұмыс істеу жеңіл. Бұл
жүйеленген дерекке жатады. Алайда ашық дереккөздегі мәліметті кейде қолмен реттеп, бір жүйеге
келтіретін кездер де болады. Мысалы, ашық дереккөзде Алматы қаласындағы көлік апаты туралы
мәлімет болмауы мүмкін. Бірақ ондай
ақпаратты интернет сайттардан, газеттерден жиі көреміз.
Дата журналист осы мәліметті бір кестеге жинақтап, жүйелеген соң Алматыда қай айда, қай көшеде
көлік апаты жиі болатынын анықтай алады. Kino.kz сайтындағы Алматы кинотеатрларындағы
киноның кестесі мен атауы ашық дерек болғанымен, жүйеленбеген. Ондай жағдайда Python, MySQL
тәрізді деректерді сұрыптайтын компьютер бағдарламаларын қолдануға болады. нәтижесінде
сайттағы деректер кесте күйінде түзіліп, әрі қарай есептеуге дайындалады.
MRF (Machine Readable Format) – дата журналистикада жиі естілетін сөз. Себебі дата
компьютер түсінетін форматтың бірінде болмаса, онымен анализ жасау мүмкін емес.
атыраудың
қылмыс картасы
Сүлейман Демирел университетіндегі студенттеріме ашық дереккөзден дата тауып, оны сұрыптауға
тапсырма бердім. Бұған дейінгі сабақта деректерді сұрыптаудың мысалы ретінде open Refine
(бұрынғы Google Refine) бағдарламасымен жұмыс істеген едік. Одан бөлек Google-дың Drive
қосымшасында датаны картаға түсіріп, визуализациялау функциясын қарастырдық.
Төртінші курс студенті Баубек Сағындықтың жұмысына тоқталсақ.
Баубек ең әуелі data.egov.kz сайтынан Атыраудағы қылмыс файлын .xls форматындағы нұсқасымен
жүктеп алды. Бір қызығы, «Атырау қылмысы» файлында 2016 жылдың алғашқы жарты жылында
қылмыскер қандай баппен жазаға тартылғаны, қылмыс қай айда жасалғаны, тіркелген уақыты,
мекені көрсетілген.
Кейін ол файлды open Refine бағдарламасының көмегімен реттеді. Датаны реттеу дегеніміз – ұқсас
мәліметтерді бір ізге келтіру. Бір кестедегі санды да кейде үтірмен, ал кейде нүктемен жазады.
open Refine осы әртүрлілікті оңай жолмен табуға көмектеседі. нәтижесінде тізімдегі барлық атау
бірдей жазылады. Мәселен, бір кестеде «Атырау қаласы» деп тұрса, енді бір жерде «қ.Атырау»,
«город Атырау», «Атырау қ-сы» деп әртүрлі кездесуі мүмкін. Кейбір жағдайда кестеге мәлімет дұрыс
түспеген болуы мүмкін немесе нүкте, үтір ұмытылған болуы мүмкін.
Бұдан кейін датаның ішіндегі көше атаулары мен үйдің нөмірі тәрізді географикалық мәліметті
реттестіреміз. Себебі біз Google-дың картасымен жұмыс істейтін болғандықтан, атауларымыз
Google Map атауымен сәйкескені жөн.
Excel кестеміз реттелген соң ішіндегі сандарды салыстырамыз. Әдетте ең үлкен, ең аз, орташа
көрсеткіші қайсы деген тәрізді статистикалық амалдарға жүгінеміз. Бұл арқылы орташа көрсеткіштен
ауытқып тұрғаны қайсы немесе ең кіші мәліметке иесі қайсы екенін көреміз. Бұны Excel кестесінде
жасауға болады. Қажетті бағанды ерекшелеп, AZ фильтрі арқылы өзгертесіз. нәтижесінде ең кіші
және жоғарғы көрсеткішті көресіз. SPSS, R тәрізді бағдарламалар көрсеткіштердің статиcтикалық
маңыздылығын (p value) есептеп береді. Тұжырымды практикалық түрде тексеріп көрмес бұрын
деректердің статистикалық маңызы бар-жоғын анықтайды.
Сол себепті дата журналист статистиканың күрделі деңгейін оқымаса да, статистиканың кіріспе
курсынан хабары болғаны дұрыс. Қажетті
жағдайда арнайы маманға барып, кеңес сұрай алады.
Деректеріміз статистикалық сүзгіден өткен соң арасындағы қызықты жайттарды көре аламыз. Егер
дайын визуализациялау құралдары болса, соған салып көруге болады. Мәселен, Баубек өзінің
91
ҚАзАҚСТАнДАғЫ
3.0
ПРАКтИКАлыҚ жУРнАлИстИКА
прАКТИКАлЫҚ
нҰСҚАулЫҚ
деректерін Fusion Table көмегімен Google Map картасына салды. нәтижесінде Атыраудың қай
ауданында қылмыстың жиі тіркелгенін көрдік.
Бұл картаны осы күйінде жарияласақ, оқырман «Атырау қаласы қылмыстан аяқ алып жүргісіз екен»
деген ойда қалады. Шындығында бұл бір сәтте осынша қылмыс болды деген сөз емес. Әр қылмыс
әртүрлі уақытта, әр мезгілде болғанын ескеруіміз керек. Ол үшін визуализациялағанда қылмыстың
түрі, уақыты, мезгілін әртүрлі түспен бояп, оқырманның өзіне деректі түсінуге мүмкіндік беру керек.
Дата жобамен жұмыс істегенде жиі кездесетін шатасудың бірі осы статистикалық
есепті дұрыс ескермегендіктен болып жатады. Мәселен, қылмыс санының көбеюі мен өлім
санының артуы арасында статистикалық байланыс болғанымен, шынайы байланыс
болмауы мүмкін. Яғни, өлім санының артуына қылмыстың көп болуы қатыссыз болуы
мүмкін немесе өлім көп болғандықтан қылмыс жиі болады деген қорытынды жасауға
болмайды.
ДАтА жУРнАлИстКе 7 Кеңес
1. Датаны жинамастан бұрын ойыңызда белгілі бір тақырыптың сұлбасы болғаны дұрыс.
Мәселен, «Оқу бағасының қымбаттауы». Енді осы тақырып аясында дата жоба жасайтын
болсаңыз, оқу бағасы туралы мәліметтермен танысып, оқу орындарынан деректер
жинастырасыз.
2. Датаны жинақтаған кезде бөлек кестеге «Датаның өмірбаянын» жазған дұрыс. яғни,
қағазға немесе құжат файлға деректі қайдан алғаныңызды, оны кім жариялағанын, қашан
жариялағанын, т.с.с. деректерді тізіп отырасыз. Бұл кейін мәліметті саралағанда не себепті
өзара үйлеспей тұрғанын түсінуге көмектесе алады.
3. Датамен жұмыс істемес бұрын негізгі нұсқасын бір жерге көшіріп, сақтап қойыңыз.
Себебі жұмыс барысында файлдағы кесте өзгереді. Ең соңында негізгі нұсқасына қайта
оралатын жағдай туындағанда түпнұсқасын таппай қалуыңыз мүмкін.
4. Датаны сараптағанда жасаған әрбір өзгерісті «өзгеріс парағына» жазған дұрыс. Әсіресе,
Excel файлындағы бағандарды өзгертсеңіз немесе категория атауларын өзгертсеңіз, т.с.с.
әрекеттерді түртіп алып, жазып отырған жөн. Кейін есептеуден қате туындаса, «өзгеріс
парағына» көз жүгіртіп, қай жерден сүрінгеніңізді көре аласыз.
5. Датаның ішінде оқиға табылуы үшін деректерді белгілі бір уақыт аралығындағы
көрсеткішпен салыстыру керек. Мысалы, Алматыдағы көлік апаты болса, онда кем дегенде
жарты жылдық деректі қараған жөн. Себебі бір айдың ішіндегі дерек арқылы тұжырым
жасау қате қорытындыға әкелуі мүмкін.
6. Датаны визуализациялағанда қарапайым әрі түсінікті болуды естен шығармаңыз.
Оқырман «Бұның маған не керегі бар?» деп сұрап тұр деп ойлаңыз да, датаңыз нақты
жауап беріп тұрғанына сенімді болыңыз.
7. Датаның көзін көрсетіп қойыңыз. Сізден кейін де дата журналистер қолдансын.