Мәліметтерді кэштеу кезінде Web-парақтарды жүктеуді жылдамдатуды айтқанда 3
бағытты белгілеп өткен жөн:
- IP-адрестерді кэштеу;
- Локалді компьютерде дискті кэшті оптимизациялау;
Әр бағыттың неден құралғанын түсіндіріп өтейік.
Сіз URL браузерге сол немесе басқа ресурсты жібергенде, ол DNS-серверге доменді
атты IP-мекенге жіберуге сұраныс жасайтыны белгілі. Қажетті мәліметтерді табу алдында
қаншама DNS-серверлерді сұрап өтеді. Әдетте, IP-адрес қолданушы компьютерінде
кэштелмейді және сіз бірнеше минут алдын қолданып отырған мекен қайта сұралып
отырады, ол тағы да уақыт алады. Сондықтан, Web-парақтарды көрсетуді жылдамдатудың
бір жолы DNS-серверлерді едәуір оптималды сұрау жүргізетін және IP-мекендерді
кештеуді ұйымдастыратын программаны қолдану болып табылады.
IP-мекенді алып болғаннан кейін, шолушы (обозреватель) компьютердің кэшінде
көрсетілген парақ копиясының сақталғандығын тексеріп, егер кэштегі құжат жарамды
болса, ол қолданушыға жіберіледі. Бұл процесс та уақыт алады және оны жылдамдату –
бөлек мәселе, сондықтан оны басқа программаға жүктеуге болады. Осы мәселемен
айналысатын көптеген программалар көп орын алатын, бірақ жылдам істейтін өз кэшін
құрады. Жылдамдатудың екінші бағыты осыны құрайды.
Үшінші механизмді (упреждающее чтение) түсіндіру үшін, кәдімгі браузердің
жұмысына қайта оралайық. Құжат браузермен көрсетілгеннен кейін, әдетте үзіліс болады.
Қолданушы құжатты оқығанша жүктеу процесі тоқтатылады, яғни система простаивает.
Упреждающее чтение үзіліс кезінде қосылыстарды қолдануға мүмкіндік береді, бұл кезде
осы параққа ссылкасы бар құжаттар жүктеледі. Осы құжаттардың фондық режимде
жүктелуі қолданушы сұраныс жібергенде тез көрсетуге мүмкіндік береді. Үшінші
механизм осы упреждающее чтение немесе префетчингтан (prefetch-ағылшынның
алдан-ала алып келу деген сөзінен) құралады. Кейде осы механизмді упреждающее
загрузкой (ағылшынның pre-loading деген сөзінен) деп те атайды.
Бақылау сұрақтары:
1. Web-парағын кештеу принципі неде?
2. Прокси-серверінің жұмыс механизмі неде?
3. Web-парағын кештеу оптимизациясының механизмі қандай?
4. Web-парағын кештеудің үш негізгі бағытын атаңыз?
Дәріс 7.
Интернеттің іздеу технологиялары.
Қажетті ақпаратты іздеу принциптері. Іздеу машинасының жұмыс механизмі. Индексті
құру.
Web-тен іздеу
Интернетте миллиондаған сайттар бар, соның ішінде өзекті ақпаратпен қоса
көптеген ескі қорлар орналыстырылған. Интернет – белгілі бір басқарушысы жоқ
демократиялық ақпарат көзі болып табылады. Кез келген адам желіге өзінің қорын
орналастыра алады. Қорытындылап келгенде, интернетте ақпараттың қайталанбауына,
оның стандартқа сай келуіне көп адамдар мән бере бермейді. Желіде барлығы бар екені
белгілі, бірақ желіден қажетті ақпаратты алу қиын. Яғни, мәліметті табу үшін, оны жақсы
іздей білу керек. Осы бөлімде интернет желісімен жұмыс істейтін іздеу аспаптары
сипатталып, іздеу жүйесінің жұмыс механизмі түсіндірілген, іздеу оптимизациясына
практикалық түсініктеме берілген.
Интернетте ақпаратты іздеуге арналған мынадай әртүрлі аспаптар бар: іздеу машиналары
(поисковиктер), индекстелген каталогтер (рубрикаторлар), рейтингілер, метаіздеуіш
жүйелер және тематикалық сілтемелердің тізімі, онлайн энциклопедиялары мен
анықтамалар. Осы кезде әр түрлі үлгідегі ақпаратты табуда іздеу аспаптарының түрлі
категорияларын қолдану тиімді болып келеді. Әр категорияны жеке қарастырайық.
Индекстелген каталогтер
Каталог дегеніміз тақырыптары бойынша топтастырылған иерархиялық құрылым
түрінде берілетін мәліметтер. Иерархиялық құрылымның бірінші деңгейіндегі
тематикалық бөлімі «спорт», «демалыс», «ғылым», «дүкендер» сияқты кең тараған
тақырыптардан тұрады. Ал әр бөлімнің бөлімшелері болады. Осылайша, біртіндеп каталог
бұтақтары арқылы саяхат жасап, іздеу облысын кішірейте отырып, сіз өзіңізге керекті
облысты дәл анықтай аласыз. Мысалы оқу орындарын іздеу барысында мынадай тізбек
пайда болуы мүмкін: Білім-> Оқу орындары -> Жоғары оқу орындары ->Институттар.
Қажетті ішкі катологты тапқаннан кейін, одан сілтемелер жинағын аласыз. Катологтерді
программалар емес, адамдар құрастырғандықтан, катологтегі барлық сілтемелер
профильді болып табылады. Егер сіз ортақ тақырыпта жалпы ақпарат іздесеңіз, онда
каталогке қатынаған дұрыс. Ал егер сізге нақты бір құжатты табу керек болса, онда
каталог тиімсіз іздеу құралы болып табылады.
Желіде ортақ қолданылатын каталогтардан басқа, ерекшеленген каталогтар да бар.
Егер де бір каталогта өте көп қор орналасса, онда оларды кең таралуына байланысты
бірнеше бөліктерге бөлуге (ражнирование) болады. Мысалы, Яндекс каталогында
бөліктеу басқа сайттардың біздің сайттағы сілтемелерінің индексімен жүргізіледі.
Желіде каталогтардан басқа рейтингтер де бар. Каталогтан рейтингтің айырмашылығы,
мұнда қорларды тікелей оның иесі суреттесе, ал каталогта - авторы, демек оның
редакторлары суреттейді.
Сілтемелердің тематикалық жинағы
Сілтемелердің тематикалық жинағы – бұл кәсіби топтармен немесе жеке
жинақтаушылармен құрылған тізімдер. Шектелген кәсіби тақырыпты ірі каталогтің
жұмыскерлер тобына қарағанда сол жұмыстың кәсіби маманы жақсы ашуы мүмкін.
Домендік атты теру
Каталог – бұл ыңғайлы іздеу жүйесі, бірақ егер сізге Intel немесе IBM
компаниясының сервері керек болса, сіз каталогке қатынай алмайсыз. Сәйкес сайттардың
атын табу қиын болмайды: www.intel.com, www.ibm.com.
Сол сияқты, сізге егер ауа райына арналған сайт қажет болса, оны
www.weather.com
серверінен іздеген дұрыс болады. Көп жағдайларда кілттік сөз арқылы сайтты табу
мәтінде көп кездесетін сөзден тұратын құжатты тапқаннан ыңғайлы.
Іздеу кезінде танымалы емес компаниялардың адресінің атын интуитивті ойдан тергенде,
бірде-бір іздеу жүйесінде тіркелмеген сервермен байланыс орнатуы мүмкін болғандықтан,
ол іздеудің басқа түрлерімен табысты бәсекелесе алады. Осыған ұқсас іздеулер тиімсіз,
сондықтан ізделінетін сайттың атын таба алмайтын болсаң, іздеу машинасын қолдану
керек.
Іздеу машиналары
Сұранысқа жауап ретінде сіз әдетте құжаттардың ұзын тізімін алаcыз, оның көбі
сіздің сұрағыңызға жауап бермейді және сол тақырыпқа ешқандай қатысы болмайды.
Сондай құжаттар релевантты емес (ағылшын сөзінен шыққан, relevant- лайықты, қатысты)
деп аталады, ізденіс бойынша табылған құжаттар релевантты құжаттар деп аталады.
Табылған сілтемелердің тізіміндегі релевантты құжаттардың проценті сұраныстың дұрыс
қойылуына байланысты болады.
Іздеу машинасы тапқан барлық құжаттардың ішіндегі релевант құжаттардың бөлігін іздеу
дәлдігі деп атайды. Релевантты емес құжаттарды шуы бар құжаттар деп атайды. Егер
табылған құжаттардың барлығы релевантты болып келсе (шуы жоқ құжаттар), іздеу
дәлдігі 100% құрайды. Егер барлық релевантты құжаттар табылса, онда іздеу толымдығы
100% тең.
Сайып келгенде, іздеу сапасы екі өзара тәуелді параметрлермен анықталады: дәлдікпен
және іздеу толықтығымен . Толықтықтың артуы дәлдікті төмендетеді және керісінше.