Online keresés

Ebben a leckében 2 dologról fogunk beszélni.

ikon

Online keresőkről

Mennyire közeli barátunk a Google?

ikon

Mélywebes keresésről

Milyen mélyen van, és mivel hozzuk a felszínre?

Ennek az órának a célja, hogy bemutassa az internetes keresők működését, és segítsen hatékonyabban használni őket.

Fontos

A szövegben csillaggal jelölt fogalmakat felugró ablakban olvashatja, illetve kereshető formában az alábbi weboldalon tudja elérni, vagy az ETA-ban a Könyvtárhasználati kislexikon nevű pdf-ben láthatja az adott fogalom, szakszó részletesebb magyarázatát!


„A szakirodalom feltérképezésére, leíró kutatások elvégzésére ma már éppúgy használjuk az internetes keresőprogramok találati listáját, mint a hagyományos könyvtári forrásokat. A keresés eredményességét nagymértékben befolyásolja, hogy milyen kulcsszavakat és operátorokat (műveleteket, mint például és, vagy, tagadás) használtunk a keresés során.”

ForrásmegjelölésTarcsi Ádám, Abonyi-Tóth Andor, Horváth Győző: WEB 2-es eszközök a társadalmi és marketingkutatások szolgálatában, (2012) Eötvös Loránd Tudományegyetem, Informatikai Kar

A webes/internetes keresők*Olyan weboldal vagy szoftveres alkalmazás, amely a keresősávjába beírt keresőszóra, vagy kereső kifejezésre különböző találatokat ad ki. A találatok listáját rendszerint különböző feltételek szerint tudjuk sorba rendezni vagy tovább szűkíteni. Megkülönböztetünk keresőrobot által automatikusan, illetve ember által manuálisan épített internetes keresőket. világát nagyjából a 2000-es évek eleje óta uralja a Google. Olyannyira nem kell bemutatni, hogy a cég neve mára egybeforrt alapvető funkciójával, és a legtöbb nyelvben megjelent a „googling/guglizni” kifejezés, mint az internetes keresés igei szinonimája.
Néhány további piaci szereplőről viszont érdemes szót ejteni:

Yahoo! Honlap- a 90-es évek tájékán volt népszerű, később az örök második helyre csúszott

Bing Honlap - a Microsoft fejlesztette webes kereső, ami többszöri névváltoztatás, rengeteg fejlesztés és hirdetés ellenére sem terjedt el

Baidu Honlap - a legnépszerűbb kínai kereső

Yandex Honlap - az orosz nyelvterületen legnépszerűbb kereső

DuckDuckGo Honlap - a felhasználóbarát kereső, ami nem követi internetes tevékenységünket

Ha a kutatásaink során teljességre törekszünk, fontos tudni, hogy a Google mellett milyen további lehetőségeink vannak, illetve a keresőóriás (130 billió indexelt oldal) kínálta funkciókban is érdemes mélyebben elmerülnünk, hogy megtanuljuk hatékonyan használni.


Összegzés

A Google vitán felül uralja az internetes keresők piacát, és méreteinél fogva egyszerűen kikerülhetetlen, hogy használjuk, keressünk vele. Éppen ezért fontos, hogy jól ismerjük a már meglévő funkcióit, és lépést tartsunk az új lehetőségekkel is. Mellette pedig jó, ha ismerjük milyen további lehetőségeink vannak, és azzal sem árt tisztában lenni, hogy mivel „fizetünk” a használatáért (kereséseink, kulcsszavaink mentése, fizetett hirdetések, célzott tartalmak a találati rangsorban).

Az általános internetes keresők a teljes internetnek csupán a töredékét tárják fel, egyes elemzők szerint valamivel kevesebb, mint 10 százalékát. A különféle interneten található tartalmakat és weboldalakat pedig többféleképpen is csoportosíthatjuk a hozzáférésük szintjei alapján.

Ebben a leckében a következő, háromosztatú felosztás alapján fogjuk az adatbázisokat és keresőket besorolni.

Web: a World Wide Web egészét értjük most alatta. Minden, ami csak a világméretű hálózaton elérhető.

Látható web

Amit az általános keresők ismernek és indexelnek a webből.

A továbbiakban nézzünk meg néhány olyan keresőt, amelyek valamilyen módon mégis képesek feltárni a mélyweb egyes régióit, illetve egyes speciális keresőket is, amelyek bár a látható weben keresnek, ellenben különleges feltárási funkcióik révén messze túlmutatnak általános társaikon.

A Wolfram Alpha egy rendkívül sokoldalú kereső, összetett mesterséges intelligenciával is fejlesztett tudásbázis. Algoritmusai több oldalról is megközelítik a keresőkifejezéseket mielőtt a program összeállítaná a végleges találati listát. Legnagyobb része matematikai funkciókból áll, mivel elődje a „Mathematica” teljes egészében ennek a területnek volt szentelve és később bővítették fizikai, kémiai, biológiai, földrajzi, irodalami, ének-zenei, stb. funkciókkal és temérdek ezekhez kapcsolódó statisztikai adattal. A középiskolások körében leginkább azért népszerű, mert olyan komplex matematikai feladatokat is képes megoldani, mint a deriválás, integrálás, egyenletszámítás. Kérdésünk jellegétől függően síkban, térben, grafikonon és egyéb alternatív módokon is ábrázolja a választ. A lehetőségek száma szinte végtelen, a Wolfram Alpha “mindenre tudja a választ” a jelenleg Chicago felett tartózkodó repülőjáratok adataitól kezdve Newton teljes munkásságán át, a pontos dátumokra és földrajzi koordinátákra lekérhető földrengés-erősségi skálákig.
ForrásmegjelölésSzámítógépes Alkalmazások Szemantikus Adatbázisa: Link
A magyarul Google Tudósra keresztelt keresőalkalmazás csak tudományos publikációkban keres. Számos tudományterületről kereshetünk különféle műfajú dokumentumokat, pl. cikkeket, disszertációkat, könyveket, kivonatokat, bírósági határozatokat stb. A Google Tudós tudományos kiadói adatbázisokból, tudományos szakmai társaságok, felsőoktatási intézmények honlapjairól, intézményi repozitóriumokból, könyvtári katalógusokból gyűjti az adatokat.
Korábban: Microsoft Academic Search. A Google Tudós párja, annak egyenes rokona a Microsoft fejlesztésében. Ennek megfelelően ugyanúgy csak tudományos publikációkban keres. Rengeteget fejlesztették az utóbbi néhány évben (gépi tanulás útján is). A keresés során az egyszerű kulcsszavas metodikánál fejlettebb, szemantikus algoritmusokat is használ.
A napjainkban egyre gyakrabban emlegetett internet aratás/archiválás egyik ősatyja Wayback-machine néven vált ismertté. A Google-lel ellentétben nem csak a legutóbbi tárolt változatát nézhetjük meg az indexelt oldalaknak, hanem több ilyen mentési pont közül is választhatunk, több évre visszamenőleg. Egyes publikus weboldalakról akár havonta több mentés is készülhet, egy jól átlátható naptár segítségével tudunk a mentett verziók között navigálni. Elsősorban a szöveges részeket menti le, nagyobb méretű képek, flash alapú tartalmak, videók, stb. sok esetben hiányoznak.

Hasonló a Wolfram Alphához abban, hogy publikus weboldalakat, nyílt forrású keresési eredményeket dolgoz fel nekünk. Java alapú motorjának legfőbb erőssége a találatok prezentálásában és csoportosításában rejlik. Tematikus listákat, grafikonokat és egyéb látványos vizuális kimutatásokat készíthetünk vele néhány kattintással. Az így létrehozott tartalmakat pedig könnyedén exportálhatjuk a számunkra ideális formátumban.

A Dogpile legnagyobb előnye, hogy az organikus és fizetett találatokat saját algoritmusai alapján egy listába rendezi nekünk, ezzel lehetővé téve, hogy találati listánk egyetlen elv mentén, pusztán relevancia alapján legyen rendezve. Ráadásul több keresőóriást is egyesít nekünk, így egyszerre kereshetünk a Goggle a Yahoo! és a Bing által indexelt tartalmakban. (A kisebb keresők tételes listáját nem tették közzé.) Bízhatunk benne, hogy keresőkifejezősünk alapján kihozza nekünk a fenti oldalakból a legjobbat.
Metakereső*lásd: Kislexikon: "A metakereső olyan internetes alkalmazás, amely a felhasználó által megadott szót vagy szavakat (a bevitt mintát) különböző keresőrendszereknek és webkatalógusoknak adja át a megfelelő formátumokban, s ennek alapján egyszerre keres mindegyikben. Az így kapott találatokat egyedileg kialakított fontossági sorrendben jeleníti meg, a találatoknál feltüntetve, hogy mely szolgáltatás adatbázisában sikerült megtalálni a rekordot, s a duplumok egy részét is kiszűri." ForrásmegjelölésPálvölgyi Mihály: Információkereső nyelvek III. (2011)

Összegzés

A hatékony szakirodalmi kutatás érdekében nagyon fontos, hogy tisztában legyünk a látható és láthatatlan web fogalmával, szintjeivel, továbbá, hogy ismerjük és használni tudjuk a napjainkban rendelkezésre álló mélywebes keresőket. Ezekkel nemcsak lerövidíthetjük a beadandó, szakdolgozat vagy egyéb tudományos munka írására fordított időt, de jelentősen gazdagíthatjuk is vele a feldolgozott tudás és ismeretanyagot, hogy minél naprakészebb munkát adjunk ki végül kezeink közül.