Test Google Caffeine: Spam i SEO do kosza. Co jeszcze?
- .. » Internet » Informacje o Sieci » Wyszukiwarki » Google
Czym jest Google Caffeine?
Google Caffeine to odświeżona wersja silnika wyszukiwania Google. Implementacja finalnej wersji Caffeine nie powinna przynieść żadnych zmian wizualnych dla internautów - projekt dotyczy bowiem "wnętrza" silnika. Możliwości wyszukiwarki można sprawdzić na stronie www2.sandbox.google.com. Witryna działa wyłącznie w wersji standardowej i jeszcze nie jest dostępna dla urządzeń mobilnych. Wiadomo, że projekt będzie w najbliższych miesiącach dopracowywany. Wszyscy, którzy chcą pomóc w jego rozwoju, mogą zrobić to poprzez stronę deweloperów.
Postanowiliśmy przeprowadzić szybki test nowej wersji silnika wyszukiwarki i sprawdzić, w jakim kierunku zmierza Google.
Szybkość i zasięg
Test szybkości Caffeine postanowiliśmy przeprowadzić na pięciu hasłach o zróżnicowanym poziomie trudności i z różnych dziedzin. Były to kolejno słowa: kot (bardzo popularne), doda (popularne), torrent (popularne), pc world (średnio popularne) oraz dezoksyrybonukleina (absolutnie niszowe).
Wyniki dla wyszukiwania PL (Zasięg/Szybkość)
Google.pl / Caffeine
kot: 5,800,000 w 0,11 sek. // 6,410,000 w 0.07 sek.
doda: 3,120,000 w 0,22 sek. // 4,210,000 w 0.09 sek.
torrent: 2,340,000 w 0,09 sek. // 2,710,000 w 0.07 sek.
Pc world: 1,630,000 w 0,08 sek. // 1,770,000 w 0.07 sek.
Dezoksyrybonukleina: 519 w 0,25 sek. // 524 w 0.10 sek.
Widać, że nowy silnik Google jest faktycznie szybszy i prezentuje więcej wyników wyszukiwania od poprzednika. Warto dodać, że sprawdzając wiele innych wyrazów bardzo często zdarzało się, że Google Caffeine notowało po pierwszym kliknięciu nieco gorsze wyniki od starszej wersji. Po kolejnych kliknięciach silnik wyszukiwał jednak te same wyrazy znacznie szybciej.
Szukamy osób
Wydaje się, ze Google Caffeine będzie dostarczało nam jeszcze więcej informacji o osobach. Po wpisaniu hasła "Łukasz Bigo" w google.pl otrzymaliśmy na pierwszej i najważniejszej stronie wyników wyszukiwania wyniki z serwisów Twitter, Blip, GoldenLine i Facebook. Sandbox wyświetlił natomiast linki do profilów na Twitterze, Facebooku, Blipie i Naszej-klasie. Największą różnicę widać natomiast w liczbie wyświetlonych wyników - 47,100 w starej wersji w stosunku do 110 tysięcy w Google Caffeine.
Ciekawostką jest fakt, że sandbox nie wyświetla na głównej stronie obrazków. Materiały wideo zostały natomiast przesunięte na górę strony. Nie wiadomo czy są to zmiany wprowadzone do wyszukiwarki na stałe.
Spam i viagra
Relacje pomiędzy Google Caffeine a spamem tymczasowo ograniczyliśmy do sprawdzenia hasła "viagra" w wynikach wyszukiwania obu wersji silnika. Dlaczego lek na impotencję? Z badań Panda Security, Symanteca i wielu innych firm zajmujących się bezpieczeństwem w Sieci wynika rokrocznie, że hasła związane z lekami i seksem są najczęściej występującymi w wiadomościach spamowych. Viagra wydaje się być idealnym hasłem do testu.
W pierwotnym google po wpisaniu hasła "viagra" i wyszukiwaniu w zasobach Internetu użytkownik trafi na 8 sklepów oferujących lek w sprzedaży, link do Wikipedii oraz dwa materiały wideo na dole strony. Sandbox prezentuje ciekawsze wyniki: mamy tutaj tylko 7 linków prowadzących bezpośrednio do stron sprzedających medykament. Oprócz tego Caffeine wyświetla link do Wikipedii, oficjalnej strony viagra.com oraz artykułu na temat leku w serwisie drugs.com. Materiały wideo, choć te same co w pierwotnej wersji, umieszczone są na górze strony z wynikami wyszukiwania.
Wyniki dotyczą wyszukiwania przez google.pl. W google.com Sandbox nie daje zbyt wielkiej ochrony przed setkami reklam sklepów, które dominują wynikach wyszukiwania.
Co ciekawe, po wpisaniu hasła "apteka" czy "bank", nowy silnik Google wyświetla mniej wyników od poprzedniego. Seth H. Weintraub z amerykańskiego magazynu Computerworld sugeruje, że może być to efekt zastosowania lepszych filtrów odrzucających fałszywe strony internetowe.
SEO do kosza?
Wiele wskazuje na to, że wprowadzenie nowego silnika Google spowoduje spore poruszenie wśród specjalistów od pozycjonowania i marketingu wyszukiwarkach. Już teraz wielu użytkowników zauważa, że sandbox zmienia pozycję witryn czy blogów.
Prosty przykład otrzymujemy po wpisaniu w google.pl oraz sandboksa hasła "bank". W wynikach wyszukiwania widać bardzo poważne zmiany w pozycjonowaniu stron przez oba silniki, np. strona Alior Bank (aliorbank.pl) spada z trzeciej pozycji w Google na trzecią stronę wyników.
- drag
- 2009-08-12 16:01:25
tak tak szanowne redaktorstwo, drugs to narkotyki a strona drugs.com mowi co wziac zeby sie na(pii)ac ;-) nie wiem co braliscie ale tez to chce
- SEO
- 2009-08-12 16:31:55
A ciekawe kociaki jak zmierzyliscie te czasy wyszukiwania? Przypadkiem nie przepisaliscie tych co wam google wyswietla? ;)
- marx64
- 2009-08-12 16:39:26
"...w serwisie o narkotykach (drugs.com)" Chyba ktoś nie rozumie innego znaczenia słowa "drug" który w tym wypadku oznacza poprostu "lek". Jest to serwis o lekach, ale jak widać "głodnemu chleb na myśli" ;)
- Linux_Syf
- 2009-08-12 17:19:46
Google chrome do kosza i mamy spokój. :)
- ~gość
- 2009-08-12 17:30:52
drugstore nieuku to apteka a nie punkt dilowania
- omfg
- 2009-08-12 19:00:10
nawet jeżeli w tych wynikach jest brana pod uwagę średnia to i tak jest to bez sensu. Przy wyszukiwaniu słowa "sex", "stare" google lepiej sobie poradziło... ale amatorów tego typu wyszukiwań zasmuci fakt, że "stare" google ma jednak dużo mniej wyników tej tematyki... ;)
- bartolini
- 2009-08-12 19:33:58
ciekawe co stanie się z firmami, które bawią się w pozycjonowanie:P
- Dżyszla
- 2009-08-12 20:34:06
Beznadziejnie przeprowadzone testy. "Łukasz Bigo" (a w zasadzie: Łukasz Bigo - bez znaków "") jest na 276 linkach, a nie 47000! - wystarczy tylko udać się na ostatnią stronę wyszukiwania, by przekonać się, jak Google interpretuje słowo "około". Jeśli nawet pozwolimy na pokazywanie powielonych stron, to bliższe szacunki mówią o jedynie 46700 stronach (Google wyświetla tylko 1000 pierwszych). Tak więc spojrzenie wyłącznie na to, co pokazuje pierwsza strona to dowód braku kompetencji w ocenie. Ponadto każda jedna strona oparta o bazy danych zawsze zaoferuje wynik tego samego zapytania szybciej, niż za pierwszym razem. Ktoś chyba nie słyszał o mechanizmach cachowania stosowanych w bazach danych! BRAK KOMPETENCJI! Redaktorzy portalu IT...
- bwgg
- 2009-08-12 21:22:44
@Dżyszla: odniosę się do drugiej części Twojej wypowiedzi - nie pomyślałeś o tym, że w google.pl dane hasło było już wyszukiwane (może nawet nie raz)? Tak więc brakiem kompetencji możnaby raczej nazwać właśnie porównywanie wyniku "starego" i "nowego" wyszukiwania.
- Dżyszla
- 2009-08-12 22:50:46
@bwgg - to też jest pewna szansa, choć wyniki w cachu bazy, w zależności od konfiguracji i ilości zapytań, raczej utrzymują się co najwyżej kilka minut, a dla google.pl może to być zaledwie kilka sekund.
- LukaszH
- 2009-08-13 10:53:22
Nie oszukujmy się jeżeli chodzi o czas dostępu to w głównej mierze zależy to od Data Center z jakiego pobierane są dane, sam dzis zrobilem z ciekawosci ten test i wyszedl mi MIX, czyli czesc bylo szybciej z starego google a czesc z sandboxa. Co do ilosci wyswietlanych wynikow to rowniez kwestia DC. Aby snuc takie wnioski nalezaloby sprawdzac te wszystkie rzeczy w oparciu o 1 DC.
- indian
- 2009-08-13 14:04:19
Chciałem sprawdzić jak jest z trafnością ale: "We are upgrading elements of our data center. The Caffeine sandbox should be available for searching again in a few hours." Jeśli dodatkowe 10 sekund oczekiwania na wynik wyszukiwania ma mi oszczędzić choć jednego błędnego kliknięcia to wolę poczekać. Dla mnie liczy się tylko kilka, kilkanaście stron - odpowiednich do zapytania... i niech to będę różne strony a nie ta sama powielona. Pozostałe 10kk mnie nie interesują... Ale ok, google rulez, nie ma przebacz;).
- indian
- 2009-08-13 14:11:57
proponuję mimo wszystko czasem kasować niektóre komentarze bo dzieciaki z klawiaturkami zamiast joystickami siedzą (bez wskazywania na nicki, wiadomo o kogo chodzi;) ) Dla mnie spoko artykulik.
- Dżyszla
- 2009-08-13 21:32:45
LukaszH - dokładnie!
- bwgg
- 2009-08-13 22:32:41
@Dżyszla: słusznie - zastanówmy się jednak z jaką częstotliwością w google.pl wyszukuje się hasło takie jak "kot" lub "viagra" (wybór z listy przypadkowy ; )). Jak duże są szanse, że ich wyniki znajdują się w cachu niema cały czas, nawet przy dość krótkim czasie ważności. Z Kofeiny na pewno nie korzystało w tamtym momencie wiele osób - stąd i była możliwość wstrzelenia się z hasłem w pustkę. IMVHO oczywiście.
- Dżyszla
- 2009-08-15 19:32:00
@bwgg - ale w artykule zaznaczyli "za drugim razem było szybciej" (czy jakoś podobnie) i to ten właśnie punkt zdyskredytowałem, gdyż za drugim razem doszło do wykorzystania pamięci podręcznej.
- wp
- 2009-08-28 21:50:08
Kiepski ten test w przypadku alior banku. Na haslo ''bank'' w ''starym'' googlu jest na 3 miejscu, a w ''nowym'' na 5tym miejscu a nie na 4 ekranie jak sugeruje artykul.
Aparat NIKON COOLPIX L23
Pobierz bezpłatnego e-booka 


