Tento skvělý text, který jistě obohatí Vaše každodenní surfování na internetu. a WIKISIFIA Vyhledávání informací na webu
Vyhledávání relevantních informací je v dnešní době jedním z největších problémů, neboť kvůli relativně snadnému zveřejňování dokumentů a informací v prostředí webu dochází k velkému nárůstu informací a dokumentů a o to složitějšímu vyhledávání. Vyhledávání informací zároveň patří mezi základní informační znalosti, a proto i znalost činnosti vyhledávacích nástrojů na internetu a jejich užití patří mezi základy funkční gramotnosti, kterým by měla být věnována patřičná pozornost.
Povrchový a hluboký web
Informace ve webovém prostředí jsou dostupné v různých úrovních zpřístupnění. Rozeznáváme dva typy webu a to takzvaný volný, či povrchový web, který je veřejně přístupný, běžně indexovaný a takzvaný hluboký web (někdy také skrytý), který vyhledávací stroje nejsou schopni indexovat.
Povrchový web
Pojmem povrchový web je myšlena ta část webu, která je běžným vyhledávačem indexovaná a kterou dokáže daný vyhledávací nástroj prohledat. Nevýhodou povrchového webu je, že v něm můžeme najít informace, které jsou často neaktuální, v zásadě se na ně nemůžeme stoprocentně spolehnout.
Nejčastěji používané vyhledávače povrchového webu jsou:
Google
Yahoo
Ask
Bing
Seznam
Hluboký web
Druhým typem webu je takzvaný neviditelný web, někdy také nazývaný hluboký web. V něm jsou ukryty dokumenty a informace, které jsou běžnými vyhledávači obtížně vyhledatelné. Dynamické stránky tvoří největší část hlubokého webu, přítomné informace jsou dynamicky generované, rychle se mění obsah stránek, a proto je jejich indexace pro normální vyhledávače složitá. Dalším problémem je, že webové stránky jsou roboty indexovány na základě vzájemného propojení. Problémem jsou tedy nepropojené stránky, stejně jako stránky soukromé, u kterých je vyžadována registrace, případně je vstup chráněn heslem. Robot tak zvládne indexaci pouze u vstupní stránky.
Vyhledávací nástroje pro hluboký web
Mimo seznamy zdrojů hlubokého webu (např. na stránkách knihoven) se můžeme setkat s portály, které poskytují informace o databázích.
V České republice mezi ně patří:
Portál Science, Technology, Medicine
Zahraničními nástroji pro hluboký web jsou například:
Beaucoup
Bubl
CompletePlanet
DataMiningResources
Deep Web Technologies
The Internet Public Library
Librarians' Index to the Internet
Vyhledávače, vyhledávací nástroje
Pro vyhledávání informací na webu lze použít různé vyhledávací nástroje, jsou to například předmětový katalog, vyhledávací stroj a metavyhledávač.
Předmětový katalog
Předmětové katalogy jsou velké databáze, nebo adresáře, které jsou nejčastěji víceoborové a polytematicky zaměřené. Dříve byly předmětové katalogy udržovány výhradně ručně. Dnes fungují na principu hierarchie, snaží se o zpřístupnění pomocí strukturovaných záznamů, pokrývají tedy i menší část webového prostoru než vyhledávací stroje. Předmětové katalogy můžeme využít například při vyhledávání informací o firmách, výrobcích. Cílem předmětových katalogů bylo odlišit se od webových robotů, kteří dokumenty chápou jen jako soubory jednotlivých slov. Jako příklad předmětových katalogů můžeme uvést portál Seznam.cz nebo Yahoo.com.
Vyhledávací stroje
Vyhledávací stroje umožňují automatizovaný sběr dat za pomoci robotů, kteří prostřednictvím hypertextových odkazů prohlížejí jednotlivé webové stránky. Vyhledávací stroje umožňují hypertextové vyhledávání, zároveň po zadání dotazu procházejí velké množství webových stránek. Do vyhledávacích nástrojů lze zařadit například Google, Jyxo, nebo Alta Vista.
Metavyhledávače
Metavyhledávače jsou trendem posledních let, neboť tyto posílají dotaz uživatele do různých heterogenních zdrojů, kdy každý z těchto zdrojů má vlastní vyhledávací systém. Vyhledávání tedy probíhá ve více zdrojích, aniž bychom se museli učit rozdílné způsoby při formulování dotazů u jednotlivých vyhledávacích systémů. Většina metavyhledávačů dokáže zkombinovat výsledky a odstranit duplicity. Příkladů metavyhledávačů je mnoho, například Dogpile, Globalsearch, případně Metacrawler.
Google Search
Google je v dnešní době asi jeden z nejvíce využívaných vyhledávačů na internetu. Tento vyhledávací nástroj nabízí mnoho funkcí a služeb, které nám mohou pomoci, abychom snadněji, rychleji a efektivněji nalezli požadované relevantní, nejlépe však pertinentní informace.
Google Search
Operátory
Ať už vyhledáme cokoli, měli bychom si být vědomi toho, že základem úspěchu je zadávání dotazu od nejjednoduššího po složitější. Nejdříve bychom měli tedy vyhledávat slova, případně sousloví a dvojice slov. Google je upraven tak, aby mezi námi zadané výrazy umisťoval operátor AND, který zabezpečuje, že výsledky budou obsahovat oba (tedy v případě, že jsme do dotazovacího řádku zadali dvě slova) vyhledávané pojmy současně. Při vyhledávání na Google můžeme také využít další Booleovský operátor OR, který prohledá obsah stránek a najde takové výsledky, které obsahuje minimálně jeden termín. OR je zároveň jediný Booleovský operátor, který Google detekuje.
Filtry v textovém zadání
Další věc, kterou bychom jako uživatelé vyhledávače Google mohli ocenit, ale často o ní nevíme je, že když do vyhledávacího pole napíšeme site: a název stránky, dojde k prohledání konkrétního webu. Využít můžeme také vyhledávání podle typu souboru, kdy stačí přidat filtr filetype: a napsat zkratku souboru (např. PDF). Pomocí textovému filtru related: lze najít související stránky, webové stránky s podobným obsahem. Musíme jenom zadat related: a za dvojtečku napsat URL adresu.
Výsledky
V seznamu výsledků jsou nejčastěji zobrazeny třířádkové výseky ze stránek. Když jsou před výpisem tři tečky (…), znamená to, že se ukázaná část textu nalézá uvnitř webové stránky, nikoliv na jejím začátku. V takovém případě můžeme využít klávesovou zkratku Ctfl+F a zadat znovu jedno z vyhledávaných slov, kurzor se přenese na hledané slovo. Google řadí výsledky vyhledávání podle PageRank. To znamená, že výsledky řadí podle předem vypočítaného algoritmu, který hodnotí důležitost webových stránek. PageRank neboli PR, je tedy číslo, které je přiřazeno každému URL. Tento vypočítaný algoritmus využívá doporučování webových stránek jinými stránkami. Vyhledávací nástroj Google tedy řadí výsledky podle četnosti a citovanosti, nepočítá pouze odkazy, které na danou webovou stránku vedou, ale do algoritmu započítává i hodnocení stránek, které na konkrétní web odkazují.
Odkazy a zdroje
Reference
ČERNÁ, Zuzana. Principy vyhledávání informací na Internetu. RVP [online]. 2011 [cit. 2015-06-13]. Dostupné z: http://clanky.rvp.cz/clanek/s/Z/14533/PRINCIPY-VYHLEDAVANI-INFORMACI-NA-INTERNETU.html/..
SOUČEK, Martin. Informační věda. Informační věda. [online]. [cit. 2015-06-13]. Dostupné z: http://www.informacniveda.cz/article.do?articleId=1130.
MEDKOVÁ, Milena. Informace a Internet. Informační věda. [online]. 2009. [cit. 2015-06-13]. Dostupné z: http://www.informacniveda.cz/article.do?articleId=1128..
HAVLOVÁ, Anna. Systémová analýza hlubokého webu. Znojmo, 2008. Bakalářská práce. Univerzita Karlova v Praze, Filozofická fakulta, Ústav informačních studií a knihovnictví. Vedoucí práce Martin Souček..
ČERNÁ, Lenka. Trendy ve vyhledávání na Internetu. Brno, 2006. Diplomová práce. Masarykova univerzita v Brně, Filozofická fakulta, Ústav české literatury a knihovnictví. Vedoucí práce Petr Škyřík..
Google. Vše o vyhledávání: Všechny tipy a triky [online]. 2015 [cit. 2015-06-13]. Dostupné z: https://www.google.com/intl/cs_cz/insidesearch/tipstricks/all.html. .
WIKISIFIA. Modely, principy a nástroje vyhledávání na webu a jeho trendy (včetně fenoménu Google) https://wikisofia.cz/wiki/Modely,_principy_a_n%C3%A1stroje_vyhled%C3%A1v%C3%A1n%C3%AD_na_webu_a_jeho_trendy_(v%C4%8Detn%C4%9B_fenom%C3%A9nu_Google)
Comments