• Antonín Havránek

ZÁKLADY VYHLEDÁVÁNÍ NA INTERNETU?

Aktualizováno: 23. 1. 2021

Tento skvělý text, který jistě obohatí Vaše každodenní surfování na internetu. a WIKISIFIA Vyhledávání informací na webu

Vyhledávání relevantních informací je v dnešní době jedním z největších problémů, neboť kvůli relativně snadnému zveřejňování dokumentů a informací v prostředí webu dochází k velkému nárůstu informací a dokumentů a o to složitějšímu vyhledávání. Vyhledávání informací zároveň patří mezi základní informační znalosti, a proto i znalost činnosti vyhledávacích nástrojů na internetu a jejich užití patří mezi základy funkční gramotnosti, kterým by měla být věnována patřičná pozornost.


Povrchový a hluboký web

Informace ve webovém prostředí jsou dostupné v různých úrovních zpřístupnění. Rozeznáváme dva typy webu a to takzvaný volný, či povrchový web, který je veřejně přístupný, běžně indexovaný a takzvaný hluboký web (někdy také skrytý), který vyhledávací stroje nejsou schopni indexovat.

Povrchový web

Pojmem povrchový web je myšlena ta část webu, která je běžným vyhledávačem indexovaná a kterou dokáže daný vyhledávací nástroj prohledat. Nevýhodou povrchového webu je, že v něm můžeme najít informace, které jsou často neaktuální, v zásadě se na ně nemůžeme stoprocentně spolehnout.

Nejčastěji používané vyhledávače povrchového webu jsou:

  • Google

  • Yahoo

  • Ask

  • Bing

  • Seznam

Hluboký web

Druhým typem webu je takzvaný neviditelný web, někdy také nazývaný hluboký web. V něm jsou ukryty dokumenty a informace, které jsou běžnými vyhledávači obtížně vyhledatelné. Dynamické stránky tvoří největší část hlubokého webu, přítomné informace jsou dynamicky generované, rychle se mění obsah stránek, a proto je jejich indexace pro normální vyhledávače složitá. Dalším problémem je, že webové stránky jsou roboty indexovány na základě vzájemného propojení. Problémem jsou tedy nepropojené stránky, stejně jako stránky soukromé, u kterých je vyžadována registrace, případně je vstup chráněn heslem. Robot tak zvládne indexaci pouze u vstupní stránky.

Vyhledávací nástroje pro hluboký web

Mimo seznamy zdrojů hlubokého webu (např. na stránkách knihoven) se můžeme setkat s portály, které poskytují informace o databázích.

V České republice mezi ně patří:

Zahraničními nástroji pro hluboký web jsou například:

  • Beaucoup

  • Bubl

  • CompletePlanet

  • DataMiningResources

  • Deep Web Technologies

  • The Internet Public Library

  • Librarians' Index to the Internet

Vyhledávače, vyhledávací nástroje

Pro vyhledávání informací na webu lze použít různé vyhledávací nástroje, jsou to například předmětový katalog, vyhledávací stroj a metavyhledávač.

Předmětový katalog

Předmětové katalogy jsou velké databáze, nebo adresáře, které jsou nejčastěji víceoborové a polytematicky zaměřené. Dříve byly předmětové katalogy udržovány výhradně ručně. Dnes fungují na principu hierarchie, snaží se o zpřístupnění pomocí strukturovaných záznamů, pokrývají tedy i menší část webového prostoru než vyhledávací stroje. Předmětové katalogy můžeme využít například při vyhledávání informací o firmách, výrobcích. Cílem předmětových katalogů bylo odlišit se od webových robotů, kteří dokumenty chápou jen jako soubory jednotlivých slov. Jako příklad předmětových katalogů můžeme uvést portál Seznam.cz nebo Yahoo.com.

Vyhledávací stroje

Vyhledávací stroje umožňují automatizovaný sběr dat za pomoci robotů, kteří prostřednictvím hypertextových odkazů prohlížejí jednotlivé webové stránky. Vyhledávací stroje umožňují hypertextové vyhledávání, zároveň po zadání dotazu procházejí velké množství webových stránek. Do vyhledávacích nástrojů lze zařadit například Google, Jyxo, nebo Alta Vista.

Metavyhledávače

Metavyhledávače jsou trendem posledních let, neboť tyto posílají dotaz uživatele do různých heterogenních zdrojů, kdy každý z těchto zdrojů má vlastní vyhledávací systém. Vyhledávání tedy probíhá ve více zdrojích, aniž bychom se museli učit rozdílné způsoby při formulování dotazů u jednotlivých vyhledávacích systémů. Většina metavyhledávačů dokáže zkombinovat výsledky a odstranit duplicity. Příkladů metavyhledávačů je mnoho, například Dogpile, Globalsearch, případně Metacrawler.

Google Search

Google je v dnešní době asi jeden z nejvíce využívaných vyhledávačů na internetu. Tento vyhledávací nástroj nabízí mnoho funkcí a služeb, které nám mohou pomoci, abychom snadněji, rychleji a efektivněji nalezli požadované relevantní, nejlépe však pertinentní informace.

Google Search

  • Operátory

Ať už vyhledáme cokoli, měli bychom si být vědomi toho, že základem úspěchu je zadávání dotazu od nejjednoduššího po složitější. Nejdříve bychom měli tedy vyhledávat slova, případně sousloví a dvojice slov. Google je upraven tak, aby mezi námi zadané výrazy umisťoval operátor AND, který zabezpečuje, že výsledky budou obsahovat oba (tedy v případě, že jsme do dotazovacího řádku zadali dvě slova) vyhledávané pojmy současně. Při vyhledávání na Google můžeme také využít další Booleovský operátor OR, který prohledá obsah stránek a najde takové výsledky, které obsahuje minimálně jeden termín. OR je zároveň jediný Booleovský operátor, který Google detekuje.

  • Filtry v textovém zadání

Další věc, kterou bychom jako uživatelé vyhledávače Google mohli ocenit, ale často o ní nevíme je, že když do vyhledávacího pole napíšeme site: a název stránky, dojde k prohledání konkrétního webu. Využít můžeme také vyhledávání podle typu souboru, kdy stačí přidat filtr filetype: a napsat zkratku souboru (např. PDF). Pomocí textovému filtru related: lze najít související stránky, webové stránky s podobným obsahem. Musíme jenom zadat related: a za dvojtečku napsat URL adresu.

  • Výsledky

V seznamu výsledků jsou nejčastěji zobrazeny třířádkové výseky ze stránek. Když jsou před výpisem tři tečky (…), znamená to, že se ukázaná část textu nalézá uvnitř webové stránky, nikoliv na jejím začátku. V takovém případě můžeme využít klávesovou zkratku Ctfl+F a zadat znovu jedno z vyhledávaných slov, kurzor se přenese na hledané slovo. Google řadí výsledky vyhledávání podle PageRank. To znamená, že výsledky řadí podle předem vypočítaného algoritmu, který hodnotí důležitost webových stránek. PageRank neboli PR, je tedy číslo, které je přiřazeno každému URL. Tento vypočítaný algoritmus využívá doporučování webových stránek jinými stránkami. Vyhledávací nástroj Google tedy řadí výsledky podle četnosti a citovanosti, nepočítá pouze odkazy, které na danou webovou stránku vedou, ale do algoritmu započítává i hodnocení stránek, které na konkrétní web odkazují.


Odkazy a zdroje

Reference


  1. ČERNÁ, Zuzana. Principy vyhledávání informací na Internetu. RVP [online]. 2011 [cit. 2015-06-13]. Dostupné z: http://clanky.rvp.cz/clanek/s/Z/14533/PRINCIPY-VYHLEDAVANI-INFORMACI-NA-INTERNETU.html/..

  2. SOUČEK, Martin. Informační věda. Informační věda. [online]. [cit. 2015-06-13]. Dostupné z: http://www.informacniveda.cz/article.do?articleId=1130.

  3. MEDKOVÁ, Milena. Informace a Internet. Informační věda. [online]. 2009. [cit. 2015-06-13]. Dostupné z: http://www.informacniveda.cz/article.do?articleId=1128..

  4. HAVLOVÁ, Anna. Systémová analýza hlubokého webu. Znojmo, 2008. Bakalářská práce. Univerzita Karlova v Praze, Filozofická fakulta, Ústav informačních studií a knihovnictví. Vedoucí práce Martin Souček..

  5. ČERNÁ, Lenka. Trendy ve vyhledávání na Internetu. Brno, 2006. Diplomová práce. Masarykova univerzita v Brně, Filozofická fakulta, Ústav české literatury a knihovnictví. Vedoucí práce Petr Škyřík..

  6. Google. Vše o vyhledávání: Všechny tipy a triky [online]. 2015 [cit. 2015-06-13]. Dostupné z: https://www.google.com/intl/cs_cz/insidesearch/tipstricks/all.html. .

  7. WIKISIFIA. Modely, principy a nástroje vyhledávání na webu a jeho trendy (včetně fenoménu Google) https://wikisofia.cz/wiki/Modely,_principy_a_n%C3%A1stroje_vyhled%C3%A1v%C3%A1n%C3%AD_na_webu_a_jeho_trendy_(v%C4%8Detn%C4%9B_fenom%C3%A9nu_Google)

8 zobrazení0 komentářů