Specijalizirane internetske tražilice. Online usluga "posebna potraga za sudskom praksom"




Specijalizirane tražilice omogućuju vam traženje informacija u drugim informacijskim slojevima Interneta: arhivskim poslužiteljima, poslužiteljima e-pošte i tako dalje.

Kako se tražilice opće namjene razlikuju od specijaliziranih tražilica? Ako se za prve proces izvršavanja upita odvija u cijeloj zajedničkoj bazi podataka, onda potonji provode obradu u čisto tematskim arhivama.

Kao rezultat toga, umjesto konačnog rezultata koji sadrži ogroman broj slabo relevantnih poveznica, često vrlo površno korespondirajućih upitu za pretraživanje, obrađena verzija u specijaliziranom sustavu će donijeti puno ispravnije rezultate.

Ako, na primjer, tražite neku vrstu e-knjige, tada će vam opća tražilica dati sve poveznice u nizu gdje se spominje naziv te knjige i srodne informacije. Specijalizirana tražilica obradit će upit za pretraživanje isključivo na sadržaju elektroničkih knjižnica, što će na kraju dovesti do najboljeg konačnog rezultata.

Za traženje medicinskih informacija na Internetu koriste se specijalizirane medicinske tražilice. Oni znatno ubrzavaju pretragu i povećavaju njenu učinkovitost. Ali specijalizirane medicinske tražilice na ruskom jeziku tek se počinju razvijati. Dovoljno potpuni katalozi još ne postoje. Svaki sustav održava veze s ograničenim rasponom resursa.

Neke adrese medicinskih tražilica:

– www.rusmedserv.com – ruski medicinski server;

– www.mr.ru – Moskovsko medicinsko tržište;

- www.medlinks.ru - MedLinks - sva medicina na internetu;

– www.mednavigator.ru – MEDNAVIGATOR - nova tražilica s katalogom medicinskih izvora;

- medagent.ru - Medicinski agent - katalog medicinskih stranica;

– www.rusmedserv.ru – RusMedServ je specijalizirani portal posvećen medicini i kozmetologiji;

– med-doc.info – MED-DOC – portal za liječnike, studente, pacijente;

- www.it-medical.ru - IT-MEDICAL - znanstveni medicinski internetski projekt, velika količina literature na ruskom za stručnjake;



– www.medclub.ru – Medclub je poseban medicinski sustav koji sadrži mnogo medicinskih informacija za specijaliste i njihove pacijente. Omogućuje vam preuzimanje aplikacije Medclub koja će vam pomoći da odredite o kojim bolestima govore vaši simptomi i reći vam o bolestima;

– www.medscape.com – Medscape;

– www.medexplorer.com - MedExplorer je besplatna medicinska tražilica za liječnike, pacijente i njihove obitelji.

1.2.1 Pronalaženje datoteka

Za traženje datoteka na poslužiteljima arhivskih datoteka postoje specijalizirani tražilice dvije vrste: - tražilice temeljene na korištenju baza podataka - direktoriji datoteka. Za traženje datoteke potrebno je unijeti naziv datoteke u polje za pretraživanje i tražilica će vratiti adrese mjesta za pohranu te datoteke. Baza podataka ruskog datotečnog sustava www.filesearch.ru sadrži podatke o 6 milijuna datoteka smještenih na dvije tisuće poslužitelja za arhiviranje datoteka u ruskom dijelu interneta.

1.2.2 Pronalaženje adresa e-pošte

Specijalizirane tražilice omogućuju pretraživanje adrese e-pošte prema imenu osobe ili, obrnuto, imenu osobe koja posjeduje određenu adresu e-pošte. Primjer takvog sustava je www.whowhere.com.

tehnologija pretraživanja. Jezik upita tražilice.

Tražilice (poslužitelji)

Sustav pretraživanja- softverski i hardverski kompleks s web sučeljem koji pruža mogućnost pretraživanja informacija na internetu. Tražilica obično znači mjesto koje ugošćuje sučelje sustava. Softverski dio tražilice je pretraživač(tražilica) - skup programa koji pruža funkcionalnost tražilice i obično je poslovna tajna tvrtke koja razvija tražilicu.

Načela tražilice

Rad na pojedinom zahtjevu korisnika (i zajedno sa svim drugim mogućim zahtjevima) započeo je davno prije nego što je uveden. Poseban program pod nazivom "pauk" indeksira sadržaj web stranica.

Njegovi su zadaci donekle slični onima konvencionalnog web preglednika, samo što umjesto da prikazuje stranice na ekranu, "pauk" njihov sadržaj prenosi u drugi program - "pauk putujući". Zadatak "putujućeg pauka" je izolirati poveznice na druge stranice s učitane stranice na koju se "pauk" ponovno usmjerava. Ovaj ciklus se ponavlja mnogo puta, točnije neprekidno.

Posao tu nije kraj. Na posao se uključuje program za indeksiranje koji, koristeći određena pravila, analizira stranice koje primaju "pauci" i formira složenu bazu podataka poslužitelja za pretraživanje. Upravo ta baza zatim daje rezultate pretraživanja koji se pojavljuju nakon obrade unesenog upita. Detaljnije ćemo se zadržati na principima indeksatora, jer o tome ovisi što će biti uključeno u rezultate pretraživanja.

Rad većine modernih tražilica temelji se na indeksu citiranja, koji izračunava indekser kao rezultat analize poveznica na trenutnu stranicu s drugih internetskih stranica. Što ih je više, to je veći indeks citiranosti analizirane stranice i to će stranica biti više prikazana u rezultatima pretraživanja. Osim toga, uzima se u obzir indeks citiranosti stranica koje povezuju na stranicu koju proučava indekser.

Osim indeksa citiranosti, u obzir se uzimaju i sljedeći parametri:

Prisutnost riječi za pretraživanje u naslovu stranice ili nazivu stranice;

Učestalost ponavljanja riječi za pretraživanje na stranici;

Veličina fonta kojim su riječi iz upita za pretraživanje ispisane na stranici, kao i isticanje tih riječi fontovima i stilovima;

Predmeti referentnih stranica i neki drugi.

Nakon što korisnik unese upit, zadnji link poslužitelja za pretraživanje, sustav za izdavanje rezultata, preuzima funkciju. Kao rezultat analize i usporedbe gore navedenih pokazatelja, ovaj sustav utvrđuje stupanj usklađenosti sadržaja stranice s uvjetima upita. Što je viši ovaj stupanj, stranica će biti prikazana na višoj poziciji na popisu pronađenih izvora.

Vraćajući se na pitanje brzine obrade zahtjeva, napominjem da je takva velika brzina osigurana činjenicom da su internetske stranice unaprijed indeksirane, a rezultati pretraživanja sastavljaju se na temelju informacija iz baze podataka poslužitelja za pretraživanje.

Ova metoda, kao što možete pretpostaviti, ima očiti nedostatak, a to je da se sadržaj web stranica može mijenjati tijekom vremena, a "pauk" ih neće imati vremena pronaći i obraditi, stoga će rezultati pretraživanja biti netočni. Još jednom, spominjući vrijeme potrebno poslužitelju za pretraživanje da pregleda i indeksira cijeli Internet, reći ću da je potrebno različitim tražilicama od nekoliko dana do nekoliko tjedana, ovisno o algoritmu obrade informacija. Dakle, stranice koje su se nedavno pojavile na webu neće biti predstavljene u rezultatima pretraživanja.

Programeri tražilica bore se s tim na mnogo načina i s različitim stupnjevima uspjeha. Na primjer, većina modernih tražilica pruža uslugu kao što je traženje feedova vijesti koji se ažuriraju svakih nekoliko minuta, pa ih tražilice češće indeksiraju. Bilo kako bilo, danas ne postoji bolji način od prethodnog indeksiranja stranica.

Alati za pretraživanje

Web-tehnologija World Wide Web (WWW) smatra se posebnom tehnologijom za pripremu i postavljanje dokumenata na Internet. WWW uključuje web stranice, elektroničke knjižnice, kataloge, pa čak i virtualne muzeje! S takvim obiljem informacija, oštro se postavlja pitanje: "Kako se snalaziti u tako velikom i velikom informacijskom prostoru?"

Alati za pretraživanje priskaču u pomoć u rješavanju ovog problema.

Alati za pretraživanje- ovo je poseban softver, čija je glavna svrha pružiti najoptimalnije i najkvalitetnije pretraživanje informacija za korisnike interneta.

Alati za pretraživanje nalaze se na posebnim web poslužiteljima, od kojih svaki obavlja određenu funkciju:

1. Analiza web stranica i unos rezultata analize na jednu ili drugu razinu baze podataka poslužitelja za pretraživanje.

2. Pretraživanje informacija na zahtjev korisnika.

3. Pružanje korisničkog sučelja za pretraživanje informacija i pregledavanje rezultata pretraživanja od strane korisnika.

Metode rada koje se koriste pri radu s ovim ili drugim alatima za pretraživanje gotovo su iste. Prije nego što nastavite s njihovom raspravom, razmotrite sljedeće koncepte:

1. Sučelje alata za pretraživanje predstavljen kao stranica s hiperlinkovima, nizom upita (niz za pretraživanje) i alatima za aktivaciju upita.

2. Indeks tražilice- Ovo je baza podataka koja sadrži rezultat analize web stranica, sastavljena prema određenim pravilima.

3. Zahtjev je ključna riječ ili fraza koju korisnik unosi u traku za pretraživanje. Posebni znakovi ("", |, !, ~), matematički simboli (*, +, ?) ... koriste se za formiranje raznih upita.

Jedna od vrsta alata za pretraživanje su zbirke poveznica.

Zbirke veza su veze poredane po temi. Sadržajno se dosta razlikuju, pa da biste pronašli izbor koji najbolje odgovara vašim interesima, morate ih sami prošetati i stvoriti vlastito mišljenje.

Kao primjer, ovdje je izbor poveznica "Blago Interneta" JSC "Relcom" http://old.relcom.ru/Internet/Treasures/.

http://old.relcom.ru/Internet/Treasures/Health/- stranica Zdravlje i medicina (Bez lijekova, ruski medicinski server, elektronička ljekarna, proizvodi proizvođača lijekova i medicinske opreme, internetski centar "Medicina", medicinska knjižnica itd.)

Prednost ove vrste alata za pretraživanje je njihov fokus, obično izbor uključuje rijetke internetske izvore koje je odabrao određeni webmaster ili vlasnik web stranice.

Katalozi web poslužitelja i tražilice stvoreni su kako bi se olakšalo pretraživanje dokumenata. U većini slučajeva, katalog je tematska zbirka poveznica na web izvore (medicina, politika, programiranje itd.). S druge strane, tražilice vam omogućuju da dođete do stranice čiji tekst sadrži zadani skup riječi. Svaka tražilica ima svoje specifičnosti, prednosti i nedostatke. Treba napomenuti da punjenje Interneta informacijama na ruskom jeziku, iako se događa velikom brzinom, još uvijek daleko zaostaje za razinom informacija na engleskom jeziku. Engleski je i dalje glavni jezik komunikacije među korisnicima interneta.

Nedavno su direktoriji za pretraživanje opće namjene i tražilice za indeksiranje uvelike integrirane. Yahoo više nije samo imenik, već i tražilica. AltaVista, poput mnogih drugih tražilica koje su izvorno nudile samo pretraživanje baze podataka, danas uključuje popis naslova koji odgovaraju temi upita u rezultatima upita za pretraživanje. Tehnologije pretraživanja ne miruju.

Google je najveća i najpopularnija tražilica na svijetu. Više od 50 milijuna upita za pretraživanje dnevno se registrira na Google stranicama, dostupnim na približno 200 jezika, dok je, prema Alexi, glavna stranica Google.com najpopularniji resurs na Internetu. Međutim, unatoč svom svjetskom priznanju i neospornom uspjehu, Google nije ni blizu tako dobar kao tražilica kao što se čini.

Sve je u svestranosti: ne možete jednako dobro pretraživati ​​blogove i znanstvene članke, digitalne slike i recepte. Zato postoje mnoge ne tako poznate specijalizirane tražilice koje rade isključivo s jednom kategorijom podataka, ali to rade na najvišoj razini. Štoviše, mnogo toga što takve tražilice pronađu općenito je nemoguće pronaći pomoću Googlea i drugih univerzalnih sustava: oni jednostavno ne vide takve informacije, koje su, osim toga, često namjerno zatvorene za takve "web pauke". Razgovarajmo o nekoliko ovih "uskih profesionalaca" koji vam možda mogu otvoriti onu stranu interneta za koju niste ni slutili.

1. Pretražite među uklonjenim s Googlea i blokiranim stranicama

Nije tajna da vlade mnogih zemalja pokušavaju utjecati na to koji će mrežni sadržaj biti dostupan na teritoriju njihovih država. To se može objasniti kako čisto političkim razlozima, tako i zahtjevima zakonodavstva o borbi protiv terorizma i dječje pornografije i, naravno, utjecajem lobista velikih nositelja prava. Kriteriji zabrane mogu biti i sasvim razumni i potpuno proizvoljni: sve ovisi o općem stanju pravne svijesti u zemlji io razumu samih službenika za provođenje zakona.

Google tražilica u većini slučajeva ispunjava motivirane zahtjeve nacionalnih vlada i iz rezultata pretraživanja uklanja mjesta i stranice kojima se ne bi smjelo pristupati putem lokaliziranih verzija tražilice. U međuvremenu, uklanjanje adrese iz Google rezultata pretraživanja, pa čak i blokiranje URL-a i IP adrese na razini lokalnog davatelja usluga uopće ne znači da je takav resurs nestao s interneta ili da više nije dostupan.

Klasičan način zaobilaženja ovih ograničenja je preglednik Tor, koji se temelji na alternativi konvencionalnom onion sustavu usmjeravanja. Jedan od najnovijih paketa, koji uključuje Tor klijent (Vidalia) i Firefox Portable preglednik s foxyproxy ekstenzijom, zove se PirateBrowser.

Razlikuje se od drugih sličnih paketa po tome što nije namijenjen za potpuno anonimno surfanje: PirateBrowser koristi Tor mrežu isključivo za zaobilaženje lokalnog blokiranja određenih stranica i stranica, zamjenjujući proizvoljne IP adrese umjesto pravih. Pomoću njega možete otići na blokiranu stranicu ako već znate njezinu adresu ili je potražiti, primjerice, putem glavnog web-mjesta Google.com ili neke druge njegove lokalne verzije.

PirateBrowser već ima ugrađene postavke za nekoliko zemalja, uključujući Iran, Sjevernu Koreju i (iznenađenje!) UK, Nizozemsku, Belgiju, Finsku, Dansku, Italiju i Irsku. Naravno, ništa vas ne sprječava da napravite vlastite postavke u sustavu. Nažalost, za razliku od "punog" Tora, PirateBrowser je dostupan samo na Windowsima.

2. Pretraživanje među nepostojećim verzijama stranica

Mnogi od nas koristili su predmemoriju Googlea ili Yandexa za pregled nedavno izmijenjene ili obrisane stranice u obliku u kojem je izvorno objavljena na webu. Obično je takva predmemorija dostupna u rezultatima pretraživanja prilično kratko vrijeme, jer je robot za pretraživanje konfiguriran da prati i uzima u obzir sve promjene kako bi pružio najažurniju verziju internetskog izvora.

Stoga, ako želite znati kako je ova ili ona stranica izgledala prije mjesec, godinu, a još više prije nekoliko godina, morat ćete upotrijebiti drugi alat, odnosno web uslugu Internet Archive, koja se zove Wayback Machine, odnosno nešto poput vremeplova. Od 1997. neprofitna organizacija The Archives of Internet prikuplja kopije web stranica, multimedijskog sadržaja i softvera koji se nalaze na webu i čini te kopije besplatno dostupnima svima. Uz pomoć Wayback Machine možete pronaći ne samo verziju stranice koju poznajete od prije mnogo godina, već čak i one stranice koje dugo ne postoje i koje su jednostavno uklonjene s "normalnog" Interneta. Danas se u arhivi nalazi oko 366 milijardi stranica, a velika je vjerojatnost da će se među njima naći i ona koja Vama treba.

Evo kako je portal Computerra izgledao posjetiteljima 18. kolovoza 2000., prije više od trinaest godina, kada je internet bio spor, a 14-inčni CRT monitori zauzimali pola stola.

3. Pretraživanje slika

Najčešći način pronalaska slike je, naravno, korištenje Google slika. Ali što ako još uvijek niste mogli pronaći odgovarajuću sliku uobičajenim sredstvima? Možete, primjerice, isprobati specijalizirani servis Picsearch u kojem je, prema riječima njegovih kreatora, indeksirano više od tri milijarde digitalnih slika.

Ne samo da Picsearch ima višejezično korisničko sučelje, već ima i potpuno višejezično pretraživanje, kao i nekoliko korisnih filtara, uključujući pronalaženje samo crno-bijelih slika ili slika u boji, slika s prevladavanjem određene boje, traženje "pozadine" za radnu površinu , kao i lica ili animirane slike.

Tražilica Everystockphoto može se pohvaliti puno manjim volumenom deklarirane indeksirane baze podataka: sadrži više od 20 milijuna slika pohranjenih na internetskim stranicama za fotografije, uključujući Flickr, Fotoliju i Wikimedia Commons. Ipak, rezultati njezina rada su vrlo impresivni. Većina pronađenih fotografija može se besplatno koristiti, ali uz uvjet da se navede ime fotografa ili nositelja autorskih prava.

4. Sustav za računalstvo i pretraživanje

Kao što znate, tražilica Google može izvoditi jednostavne izračune, pretvarati iz jedne jedinice u drugu i raditi neke druge korisne stvari koje nisu izravno povezane s pretraživanjem. Međutim, ako trebate odgovore na zaista složena pitanja iz područja matematike, fizike, medicine, statistike, povijesti, lingvistike i drugih područja znanosti, onda ne možete bez WolframAlpha "računarske i tražilice", koja može korisniku ponuditi gotovo enciklopedijske odgovore na najneobičnija pitanja.

Zapravo, ovo čak nije ni tražilica, već ogromna baza podataka, čiji se dio pretvara u računalne algoritme, koji vam omogućuju da dobijete gotove informacije o tome koliko grama proteina ima u desetak M&M's bombona, što je očekivani prosječni životni vijek u SAD-u, Švedskoj i Japanu u tekućoj godini ili kako se rješava algebarska jednadžba.

Umjesto dugog opisivanja funkcionalnosti WolframAlpha, predlažemo da odete na stranicu s primjerima, koja sadrži uzorke razvrstane po područjima znanja o tome na kakva pitanja ovaj sustav može odgovoriti i kako će izgledati rezultati problema.

Nažalost, WolframAlpha radi samo s engleskim jezikom i morat ćete biti prilično vješti u njemu da biste ga koristili. Osim toga, ne biste trebali slijepo vjerovati rezultatima koje sustav izračunava prema vašim zahtjevima, budući da najmanja pogreška u bazi podataka dovodi do potpune netočnosti izdanja, a to se događa s vremena na vrijeme (samo pretražite web).

5. Potraga za ljudima

Čini se da je pronaći osobu na internetu, znajući njeno ime i prezime, lako kao guliti kruške. Da, ako je to neka slavna osoba, filmska zvijezda, sportaš ili redoviti posjetitelj društvenih mreža. Tada će vam već prva stranica rezultata Google pretraživanja dati gotovo iscrpne informacije o tome tko je on i što je radio u posljednje vrijeme. Ako osoba koju tražite ne žudi za širokom popularnošću i nije ljubitelj mrežnog egzibicionizma, pronaći informacije o njoj na internetu neće biti tako lako.

U tom slučaju možete isprobati tražilicu Pipl koja traži osobe u brojnim javnim registrima, online bazama podataka, servisima, a opet na društvenim mrežama, uključujući i one profesionalne. Za razliku od većine sličnih usluga, Pipl također radi s ćirilicom, tako da dobro funkcionira i s prezimenima na ruskom jeziku.

Domaća usluga SpravkaRU.NET pomoći će vam pronaći adresu i kućni telefonski broj stanovnika Rusije, Ukrajine, Bjelorusije, Kazahstana, Latvije i Moldavije. Ova stranica je elektronički telefonski imenik nekih većih gradova navedenih zemalja, ali je, nažalost, daleko od potpune. Veće su šanse pronaći stanovnike Moskve ili Sankt Peterburga, i to samo one koji imaju kućni broj. Za razliku od alternativnih usluga, SpravkaRU.NET sadrži prilično ažurne baze podataka, a ako imate barem neke informacije o rodbini ili približnom mjestu prebivališta tražene osobe, on vam može pomoći da odredite njegov broj telefona i adresa.

6. Potraga za znanstvenim informacijama

Ako se bavite znanošću i želite pronaći najnovije znanstvene publikacije o svojoj temi na Googleu, tada morate pod hitno zaboraviti na otkrića i baviti se nečim manje intelektualnim. Na Googleu možete pronaći samo poveznice na pojedinačna djela objavljena na nekim javnim stranicama poput Wikipedije. Naime, gotovo svi znanstveni članci pohranjeni su na web poslužiteljima koji pripadaju kategoriji tzv. deep weba, koji iz različitih razloga nije dostupan univerzalnim tražilicama.

Radi se o prisilnoj zabrani indeksiranja svih podataka koji, iako nisu klasificirani kao tajni, predstavljaju neku vlasničku informaciju ili nisu od interesa za širu javnost. To su knjižnični katalozi, medicinske ili prometne baze podataka te katalozi svih vrsta industrijskih proizvoda. Pauci ne mogu zaobići obveznu registraciju ili ograničenja pristupa, tako da u Google rezultatima rijetko vidite znanstvene materijale koji su jednostavno nerazumljivi ljudima koji se ne bave sličnim istraživanjima.

Specijalizirana tražilica CompletePlanet, koja ima pristup više od 70.000 znanstvenih baza podataka i visokospecijaliziranih tražilica, sposobna je otvoriti vrata znanstvenog "deep weba".

Još jedna izvrsna znanstvena tražilica Scirus, nažalost, živi svoje posljednje tjedne: početkom 2014. prestaje postojati, a redovni korisnici pozvani su da pronađu alternativu u preostalom vremenu (koje, nažalost, nije jasno). U međuvremenu, Scirus ima pristup višestrukim arhivama znanstvenih članaka i omogućuje pretraživanje informacija o 575 milijuna izdanja, uključujući publikacije u visokospecijaliziranim i popularno-znanstvenim časopisima, patentne tekstove i informacije iz digitalnih arhiva.

Postojanje specijaliziranih tražilica ne negira zasluge istih Google, Yandex i drugih univerzalnih tražilica: još uvijek ne možemo bez njih. Ali pravi profesionalac ne koristi čekić tamo gdje je potreban odvijač ili nož gdje je skalpel prikladan. Posebni sustavi omogućuju suptilnije pretrage i stoga mogu dati točnije i pouzdanije odgovore. Uzmimo, na primjer, najpopularniju vrstu posebnih tražilica - trgovačke i tražilice poput Yandex.Market i Price.Ru. Da, možemo pronaći iste proizvode u univerzalnom Yandexu ili Googleu, ali ovdje odmah dobivamo strukturirane i sistematizirane informacije o dostupnosti i cijeni robe, prodavačima i njihovoj lokaciji, načinima plaćanja i dostave. Ne samo da štedimo vrijeme, imamo točnije i potpunije podatke koji se mogu poredati određenim redoslijedom i međusobno usporediti. Ovaj jednostavan primjer jasna je demonstracija koliko su vrijedne specijalizirane tražilice i zašto su toliko bolje od Googlea u brojnim slučajevima.

Što je to

DuckDuckGo je prilično poznata tražilica otvorenog koda. Serveri se nalaze u SAD-u. Osim vlastitog robota, tražilica koristi rezultate drugih izvora: Yahoo, Bing, Wikipedia.

Bolji

DuckDuckGo se pozicionira kao ultimativni pretraživač privatnosti i privatnosti. Sustav ne prikuplja nikakve podatke o korisniku, ne pohranjuje zapise (nema povijesti pretraživanja), korištenje kolačića je maksimalno ograničeno.

DuckDuckGo ne prikuplja niti dijeli osobne podatke korisnika. Ovo je naša politika privatnosti.

Gabriel Weinberg, osnivač DuckDuckGo

Zašto ti ovo treba

Sve veće tražilice pokušavaju personalizirati rezultate pretraživanja na temelju podataka o osobi ispred monitora. Taj se fenomen naziva "mjehurić filtera": korisnik vidi samo one rezultate koji su u skladu s njegovim preferencijama ili koje sustav takvima smatra.

Formira objektivnu sliku koja ne ovisi o vašem prethodnom ponašanju na webu i uklanja Google i Yandex tematsko oglašavanje na temelju vaših zahtjeva. Uz pomoć DuckDuckGo-a lako je pretraživati ​​informacije na stranim jezicima, dok Google i Yandex prema zadanim postavkama preferiraju stranice na ruskom jeziku, čak i ako je upit unesen na drugom jeziku.


Što je to

not Evil je sustav koji pretražuje anonimnu Tor mrežu. Da biste ga koristili, trebate otići na ovu mrežu, na primjer, pokretanjem specijaliziranog .

not Evil nije jedina tražilica te vrste. Postoji LOOK (zadano pretraživanje u Tor pregledniku, dostupno s običnog interneta) ili TORCH (jedna od najstarijih tražilica na Tor mreži) i drugi. Odlučili smo se za not Evil zbog nepogrešive aluzije na Google (samo pogledajte početnu stranicu).

Bolji

On traži gdje je Googleu, Yandexu i drugim tražilicama načelno zabranjen pristup.

Zašto ti ovo treba

Postoje mnogi resursi na mreži Tor koji se ne mogu pronaći na Internetu koji poštuje zakon. A njihov broj će rasti kako se kontrola vlasti nad sadržajima na webu bude pojačavala. Tor je vrsta mreže unutar weba sa svojim društvenim mrežama, torrent trackerima, medijima, tržnicama, blogovima, knjižnicama i tako dalje.

3. YaCy

Što je to

YaCy je decentralizirana tražilica koja radi na principu P2P mreže. Svako računalo na kojem je instaliran glavni softverski modul samostalno skenira internet, odnosno analog je robota za pretraživanje. Dobiveni rezultati skupljaju se u zajedničku bazu podataka koju koriste svi sudionici YaCy-a.

Bolji

Ovdje je teško reći je li to bolje ili lošije, budući da je YaCy potpuno drugačiji pristup organizaciji pretraživanja. Nedostatak jedinstvenog poslužitelja i vlasničke tvrtke čini rezultate potpuno neovisnima o bilo čijim preferencijama. Autonomija svakog čvora isključuje cenzuru. YaCy može pretraživati ​​duboki web i neindeksirane javne mreže.

Zašto ti ovo treba

Ako ste pobornik softvera otvorenog koda i besplatnog interneta koji nije pod utjecajem državnih agencija i velikih korporacija, onda je YaCy vaš izbor. Također se može koristiti za organiziranje pretraživanja unutar korporativne ili druge autonomne mreže. Iako YaCy nije baš koristan u svakodnevnom životu, dostojna je alternativa Googleu u smislu procesa pretraživanja.

4. Pipl

Što je to

Pipl je sustav dizajniran za traženje informacija o određenoj osobi.

Bolji

Autori Pipla tvrde da njihovi specijalizirani algoritmi pretražuju učinkovitije od "običnih" tražilica. Posebno su prioritetni profili na društvenim mrežama, komentari, popisi sudionika te razne baze podataka u kojima se objavljuju podaci o osobama, poput baza sudskih odluka. Vodstvo Pipla u ovom području potvrđuju Lifehacker.com, TechCrunch i druge publikacije.

Zašto ti ovo treba

Ako trebate pronaći informacije o osobi koja živi u SAD-u, tada će Pipl biti puno učinkovitiji od Googlea. Baze podataka ruskih sudova, očito, nedostupne su tražilici. Stoga se ne nosi tako dobro s građanima Rusije.

Što je to

FindSounds je još jedna specijalizirana tražilica. Pretražuje otvorene izvore za različite zvukove: kuća, priroda, automobili, ljudi i tako dalje. Usluga ne podržava zahtjeve na ruskom, ali postoji impresivan popis oznaka na ruskom jeziku koje možete pretraživati.

Bolji

U izdavanju samo zvukova i ništa više. U postavkama možete postaviti željeni format i kvalitetu zvuka. Svi pronađeni zvukovi dostupni su za preuzimanje. Postoji pretraživanje uzorka.

Zašto ti ovo treba

Ako trebate brzo pronaći zvuk pucnja iz muškete, udarac djetlića koji siše ili krik Homera Simpsona, onda je ova usluga za vas. I ovo smo odabrali samo među dostupnim upitima na ruskom jeziku. Na engleskom je spektar još širi.

Ozbiljno, specijalizirana usluga podrazumijeva specijaliziranu publiku. Ali hoće li i vama dobro doći?

Što je to

Wolfram|Alpha je računalna tražilica. Umjesto poveznica na članke koji sadrže ključne riječi, daje gotov odgovor na korisnikov upit. Na primjer, ako u formu za pretraživanje unesete "usporedi stanovništvo New Yorka i San Francisca" na engleskom jeziku, Wolfram|Alpha će odmah prikazati tablice i grafikone s usporedbom.

Bolji

Ova je usluga bolja od drugih za pronalaženje činjenica i izračunavanje podataka. Wolfram|Alpha prikuplja i organizira znanje dostupno na webu iz različitih područja, uključujući znanost, kulturu i zabavu. Ako ova baza podataka sadrži gotov odgovor na traženi upit, sustav ga prikazuje, ako ne, izračunava i prikazuje rezultat. U ovom slučaju korisnik vidi samo i ništa više.

Zašto ti ovo treba

Ako ste, na primjer, student, analitičar, novinar ili istraživač, možete koristiti Wolfram|Alpha za pronalaženje i izračunavanje podataka vezanih uz vaše aktivnosti. Usluga ne razumije sve zahtjeve, već se stalno razvija i postaje sve pametnija.

Što je to

Metatražilica Dogpile prikazuje kombinirani popis rezultata s Googlea, Yahooa i drugih popularnih tražilica.

Bolji

Prvo, Dogpile prikazuje manje oglasa. Drugo, usluga koristi poseban algoritam za pronalaženje i prikaz najboljih rezultata iz različitih tražilica. Prema programerima Dogpilea, njihov sustav generira najkompletniji problem na cijelom Internetu.

Zašto ti ovo treba

Ako ne možete pronaći informacije na Googleu ili nekoj drugoj standardnoj tražilici, potražite ih u nekoliko tražilica odjednom koristeći Dogpile.

Što je to

BoardReader je sustav za pretraživanje teksta za forume, Q&A usluge i druge zajednice.

Bolji

Usluga vam omogućuje sužavanje polja pretraživanja na društvene stranice. Zahvaljujući posebnim filtrima, možete brzo pronaći objave i komentare koji odgovaraju vašim kriterijima: jeziku, datumu objave i nazivu stranice.

Zašto ti ovo treba

BoardReader može biti koristan PR stručnjacima i drugim medijskim profesionalcima koji su zainteresirani za mišljenje masovnih medija o određenim pitanjima.

Konačno

Život alternativnih tražilica često je prolazan. Lifehacker je pitao bivšeg izvršnog direktora ukrajinske podružnice tvrtke Yandex Sergeja Petrenka o dugoročnim izgledima za takve projekte.


Sergej Petrenko

Bivši izvršni direktor Yandex.Ukraine.

Što se tiče sudbine alternativnih tražilica, ona je jednostavna: biti vrlo nišni projekti s malom publikom, dakle, bez jasnih komercijalnih izgleda ili, obrnuto, s potpunom jasnoćom njihovog odsustva.

Ako pogledate primjere u članku, možete vidjeti da su takve tražilice ili specijalizirane za usku, ali traženu nišu, koja, možda tek do sada, nije dovoljno narasla da bude uočljiva na radarima Googlea ili Yandexa, ili testiraju izvornu hipotezu u rangiranju, koja još nije primjenjiva u konvencionalnom pretraživanju.

Na primjer, ako se iznenada ispostavi da je pretraživanje Tor-a traženo, to jest da će barem postotak Google publike trebati rezultate odatle, tada će, naravno, obične tražilice početi rješavati problem kako pronaći ih i pokazati korisniku. Ako ponašanje publike pokaže da značajan udio korisnika u značajnom broju upita ima relevantnije rezultate, podatke bez uzimanja u obzir faktora koji ovise o korisniku, tada će Yandex ili Google početi davati takve rezultate.

"Biti bolji" u kontekstu ovog članka ne znači "biti bolji u svemu". Da, u mnogim su aspektima naši junaci daleko od Yandexa (čak i od Binga). Ali svaka od ovih usluga daje korisniku nešto što divovi pretraživačke industrije ne mogu ponuditi. Sigurno i vi znate slične projekte. Podijelite s nama - razgovarajmo.

Dali si znao, što je misaoni eksperiment, gedanken eksperiment?
To je nepostojeća praksa, onostrano iskustvo, mašta o onome čega zapravo nema. Misaoni eksperimenti su poput sanjarenja. Rađaju čudovišta. Za razliku od fizičkog eksperimenta, koji je eksperimentalni test hipoteza, “misaoni eksperiment” magično zamjenjuje eksperimentalni test sa željenim, neprovjerenim zaključcima, manipulirajući logičkim konstrukcijama koje zapravo krše samu logiku korištenjem nedokazanih premisa kao dokazanih, tj. zamjena. Dakle, glavna zadaća podnositelja zahtjeva za "misaone eksperimente" je prevariti slušatelja ili čitatelja zamjenom stvarnog fizičkog eksperimenta njegovom "lutkom" - fiktivnim razmišljanjem na uvjetnoj slobodi bez same fizičke provjere.
Ispunjavanje fizike imaginarnim, "misaonim eksperimentima" dovelo je do apsurdne, nadrealne, zbunjujuće slike svijeta. Pravi istraživač mora razlikovati takve "omotače" od stvarnih vrijednosti.

Relativisti i pozitivisti tvrde da je "misaoni eksperiment" vrlo koristan alat za provjeru dosljednosti teorija (također nastalih u našim umovima). Time varaju ljude, jer svaku provjeru može izvršiti samo izvor neovisan o predmetu provjere. Sam predlagatelj hipoteze ne može biti test vlastite tvrdnje, budući da je razlog za samu tu tvrdnju nepostojanje proturječnosti koje podnositelj zahtjeva vidi u izjavi.

Vidimo to na primjeru SRT-a i GR-a koji su se pretvorili u svojevrsnu religiju koja upravlja znanošću i javnim mnijenjem. Nikakve činjenice koje im proturječe ne mogu nadvladati Einsteinovu formulu: "Ako činjenica ne odgovara teoriji, promijenite činjenicu" (U drugoj verziji, "Činjenica ne odgovara teoriji? - Utoliko gore po činjenicu ").

Maksimalno što "misaoni eksperiment" može zahtijevati samo je unutarnja dosljednost hipoteze unutar okvira podnositeljeve vlastite, često nimalo istinite, logike. Sukladnost s praksom to ne provjerava. Pravi test može se održati samo u stvarnom fizičkom eksperimentu.

Eksperiment je eksperiment, jer to nije usavršavanje misli, već test misli. Misao koja je unutar sebe dosljedna ne može se testirati. To je dokazao Kurt Gödel.

Sekcija 3. Informacijske i komunikacijske tehnologije u medicini.

Internet. Sustavi za pronalaženje informacija i automatiziranu obradu podataka.

Predavanje br.9. Internetske tražilice. Jezik upita"

Plan

1. Usluge pretraživanja interneta. Pretražite poslužitelje WWW.

2. Rad s poslužiteljima za pretraživanje. Jezik upita tražilice.
tehnologija pretraživanja.

Usluge pretraživanja Interneta. Pretražite poslužitelje WWW.

Svake godine obujam Interneta višestruko se povećava, pa se vjerojatnost pronalaska potrebnih informacija dramatično povećava. Internet ujedinjuje milijune računala, mnogo različitih mreža, broj korisnika se povećava za 15-80% godišnje. Pa ipak, sve češće pri pristupu Internetu glavni problem nije nedostatak potrebnih informacija, već mogućnost njihovog pronalaženja. U pravilu, običan čovjek, zbog različitih okolnosti, ne može ili ne želi potrošiti više od 15-20 minuta tražeći odgovor koji mu treba. Stoga je posebno važno pravilno i kompetentno naučiti – gdje i kako tražiti da bismo dobili željene odgovore.

Da biste pronašli informacije koje su vam potrebne, morate pronaći njihovu adresu. Za to postoje specijalizirani poslužitelji za pretraživanje (indeksni roboti (tražilice), tematski internetski imenici, sustavi za meta-pretraživanje, servisi za pretraživanje ljudi itd.).

Web tehnologija WorldWideWeb (WWW) se smatra posebnom tehnologijom za pripremu i objavu dokumenata na Internetu. WWW uključuje web stranice, elektroničke knjižnice, kataloge, pa čak i virtualne muzeje. S takvim obiljem informacija, oštro se postavlja pitanje: "Kako se snaći u tako velikom i velikom informacijskom prostoru?". U rješavanju ovog problema u pomoć priskaču tražilice.

Sustav pretraživanja- softverski i hardverski kompleks s web sučeljem koji pruža mogućnost pretraživanja informacija na internetu. Uobičajeno rečeno, tražilica se odnosi na web stranicu koja ugošćuje sučelje sustava. Softverski dio tražilice je tražilica.

Većina tražilica traži informacije na World Wide Web stranicama, ali postoje i sustavi koji mogu tražiti datoteke na ftp poslužiteljima, stavke u online trgovinama i informacije o Usenet grupama.
Poboljšanje pretraživanja jedan je od prioriteta suvremenog interneta

Popularne tražilice

Svejezično:

http://www.google.com

Google je jedna od najpopularnijih svjetskih tražilica. Google omogućuje pretraživanje hipertekstualnih dokumenata koji se nalaze u bilo kojoj jezičnoj zoni - engleskom, ruskom, ukrajinskom, njemačkom, itd. Google tražilica ima vlastite poddomene za većinu zemalja, na primjer, za Rusiju - http://www.google.ru /.


http://www.yahoo.com/

Yahoo osnovan je 1994. godine, a danas je najstariji i najpotpuniji katalog internetskih izvora.

Iznenađujuće, ovaj nevjerojatno popularan sustav, koji dnevno opslužuje milijune zahtjeva, započeo je kao jednostavna kolekcija knjižnih oznaka, koju su dopunjavale samo dvije osobe - David Philo i Jerry Yang.
Yahoo je najpopularnija tražilica. Tajna uspjeha Yahooa leži u ljudima. Yahoo ima oko 150 urednika koji pišu i uređuju sadržaj svojih imenika. Yahoo ima bazu podataka s više od milijun indeksiranih stranica. Također, u slučaju nedostatka vlastite baze podataka, Yahoo koristi Google bazu (prije srpnja 2000. Yahoo je koristio Inktomi bazu podataka).

http://www.bing.com/

bing(bing) je tražilica u vlasništvu Microsofta.
Bing je trenutno treća najkorištenija tražilica na svijetu. Tražilica ima niz jedinstvenih značajki, kao što je mogućnost pregledavanja rezultata pretraživanja na jednoj web stranici (umjesto listanja stranica s rezultatima pretraživanja) i mogućnost dinamičke prilagodbe količine informacija prikazanih za svaki rezultat pretraživanja ( npr. samo naslov, kratki sažetak ili veliki sažetak).

Ruske tražilice:

http://www.yandex.ru (pojednostavljeno - http://www.ya.ru)

Yandex vrši pretragu ruskog dijela interneta, vodeći računa o morfologiji ruskog jezika. Imajući vrlo moćan mehanizam za odabir mjesta za upite, ova tražilica pomaže u pronalaženju najprikladnijih web stranica u ruskom dijelu Interneta. Yandex skenira stotine tisuća web stranica svaki dan u potrazi za promjenama ili novim poveznicama. Zbirka poveznica neprestano raste.

http://www.mail.ru/

Mail.ru- glavni komunikacijski portal ruskog interneta. Njegova mjesečna publika prelazi 50 milijuna jedinstvenih posjetitelja.
Osim stvarne poštanske usluge, portal mail.ru sadrži mnoge druge internetske usluge.

ü skupina usluga vezanih uz komunikaciju korisnika: Mail.ru Agent - program za izravnu razmjenu poruka, Moi [email protected] - društvena mreža, [email protected], najpopularniji sustav pitanja i odgovora u Runetu Answers@mail. ru, itd.

grupa usluga "dobra i usluge"

ü usluge pretraživanja: [email protected], usluge pretraživanja fotografija, videozapisa, elektronička karta ruskih gradova itd.

ü grupa zabavnih usluga ([email protected] i drugi)

ü grupa informacijskih usluga ([email protected], [email protected], [email protected], [email protected], [email protected] i drugi), uključujući [email protected].

http://www.rambler.ru (pojednostavljeno - http://www.r0.ru)

Danas Rambler zauzima treće mjesto među tražilicama Runeta, bio je prvi program za pretraživanje kreiran posebno za rusku mrežu od strane programera tvrtke StackLtd Dmitry Kryukov (1996).

Rambler neprestano poboljšava svoj algoritam pretraživanja. U tijeku je rad na optimizaciji sustava za točnost i relevantnost pretraživanja. Kao i većina ruskih tražilica, Rambler uzima u obzir morfologiju ruskog jezika. Prilikom izdavanja rezultata, položaj stranice u ocjeni Rambler's Top100 također ima utjecaj.

Wikipedia je besplatna javna višejezična enciklopedija. Lansiran u siječnju 2001.

YouTube je video hosting usluga koja pruža usluge amaterskog video hostinga. Čini oko 63% svih korisnika video hostinga. YouTube korisnici mogu dodavati, pregledavati i komentirati video zapise. Projekt je nastao u veljači 2005.

Rad s poslužiteljima za pretraživanje. Jezik upita tražilice.
tehnologija pretraživanja.

Upit za pretraživanje može se sastojati od jedne ili više riječi, može sadržavati interpunkcijske znakove. Možete sastaviti jednostavne upite bez zalaženja u zamršenost jezika upita. Dakle, ako u niz za pretraživanje unesete nekoliko riječi bez interpunkcijskih znakova i logičkih operatora, pronaći će se dokumenti koji sadrže sve te riječi (i to na ograničenoj udaljenosti jedan od drugog).

Međutim, poznavanje i pravilna primjena jezika upita tražilice pomoći će da vaša pretraživanja budu brza i učinkovita.