Test Google Caffeine: Spam i SEO do kosza. Co jeszcze?

12 sierpnia 2009 15:03 Dominik Błaszczykiewicz
Personalizacja wyników wyszukiwania, wyeliminowanie treści spamowych, zwiększenie zasięgu i dokładności botów przeszukujących strony internetowe oraz wreszcie - renesans w segmencie SEO - wnioski z pierwszych testów Google Caffeine są obiecujące. Quo Vadis, Google? Publiczny sandbox Caffeine daje nam pewne wskazówki do odpowiedzi.
Google umożliwiło wczoraj przetestowanie nowego silnika swojej wyszukiwarki - Caffeine. Matt Cutts, inżynier oprogramowania w Google, oznajmił przy tym, że nowa wersja działa szybciej i wyświetla więcej wyników od pierwowzoru. Jakie jeszcze tajemnice kryje Caffeine?

Czym jest Google Caffeine?

Google Caffeine to odświeżona wersja silnika wyszukiwania Google. Implementacja finalnej wersji Caffeine nie powinna przynieść żadnych zmian wizualnych dla internautów - projekt dotyczy bowiem "wnętrza" silnika. Możliwości wyszukiwarki można sprawdzić na stronie www2.sandbox.google.com. Witryna działa wyłącznie w wersji standardowej i jeszcze nie jest dostępna dla urządzeń mobilnych. Wiadomo, że projekt będzie w najbliższych miesiącach dopracowywany. Wszyscy, którzy chcą pomóc w jego rozwoju, mogą zrobić to poprzez stronę deweloperów.

Postanowiliśmy przeprowadzić szybki test nowej wersji silnika wyszukiwarki i sprawdzić, w jakim kierunku zmierza Google.

Szybkość i zasięg

Test szybkości Caffeine postanowiliśmy przeprowadzić na pięciu hasłach o zróżnicowanym poziomie trudności i z różnych dziedzin. Były to kolejno słowa: kot (bardzo popularne), doda (popularne), torrent (popularne), pc world (średnio popularne) oraz dezoksyrybonukleina (absolutnie niszowe).

Wyniki dla wyszukiwania PL (Zasięg/Szybkość)
Google.pl / Caffeine
kot: 5,800,000 w 0,11 sek. // 6,410,000 w 0.07 sek.
doda: 3,120,000 w 0,22 sek. // 4,210,000 w 0.09 sek.
torrent: 2,340,000 w 0,09 sek. // 2,710,000 w 0.07 sek.
Pc world: 1,630,000 w 0,08 sek. // 1,770,000 w 0.07 sek.
Dezoksyrybonukleina: 519 w 0,25 sek. // 524 w 0.10 sek.

Widać, że nowy silnik Google jest faktycznie szybszy i prezentuje więcej wyników wyszukiwania od poprzednika. Warto dodać, że sprawdzając wiele innych wyrazów bardzo często zdarzało się, że Google Caffeine notowało po pierwszym kliknięciu nieco gorsze wyniki od starszej wersji. Po kolejnych kliknięciach silnik wyszukiwał jednak te same wyrazy znacznie szybciej.

Szukamy osób

Wydaje się, ze Google Caffeine będzie dostarczało nam jeszcze więcej informacji o osobach. Po wpisaniu hasła "Łukasz Bigo" w google.pl otrzymaliśmy na pierwszej i najważniejszej stronie wyników wyszukiwania wyniki z serwisów Twitter, Blip, GoldenLine i Facebook. Sandbox wyświetlił natomiast linki do profilów na Twitterze, Facebooku, Blipie i Naszej-klasie. Największą różnicę widać natomiast w liczbie wyświetlonych wyników - 47,100 w starej wersji w stosunku do 110 tysięcy w Google Caffeine.

Ciekawostką jest fakt, że sandbox nie wyświetla na głównej stronie obrazków. Materiały wideo zostały natomiast przesunięte na górę strony. Nie wiadomo czy są to zmiany wprowadzone do wyszukiwarki na stałe.

Spam i viagra

Relacje pomiędzy Google Caffeine a spamem tymczasowo ograniczyliśmy do sprawdzenia hasła "viagra" w wynikach wyszukiwania obu wersji silnika. Dlaczego lek na impotencję? Z badań Panda Security, Symanteca i wielu innych firm zajmujących się bezpieczeństwem w Sieci wynika rokrocznie, że hasła związane z lekami i seksem są najczęściej występującymi w wiadomościach spamowych. Viagra wydaje się być idealnym hasłem do testu.

W pierwotnym google po wpisaniu hasła "viagra" i wyszukiwaniu w zasobach Internetu użytkownik trafi na 8 sklepów oferujących lek w sprzedaży, link do Wikipedii oraz dwa materiały wideo na dole strony. Sandbox prezentuje ciekawsze wyniki: mamy tutaj tylko 7 linków prowadzących bezpośrednio do stron sprzedających medykament. Oprócz tego Caffeine wyświetla link do Wikipedii, oficjalnej strony viagra.com oraz artykułu na temat leku w serwisie drugs.com. Materiały wideo, choć te same co w pierwotnej wersji, umieszczone są na górze strony z wynikami wyszukiwania.

Wyniki dotyczą wyszukiwania przez google.pl. W google.com Sandbox nie daje zbyt wielkiej ochrony przed setkami reklam sklepów, które dominują wynikach wyszukiwania.

Co ciekawe, po wpisaniu hasła "apteka" czy "bank", nowy silnik Google wyświetla mniej wyników od poprzedniego. Seth H. Weintraub z amerykańskiego magazynu Computerworld sugeruje, że może być to efekt zastosowania lepszych filtrów odrzucających fałszywe strony internetowe.

SEO do kosza?

Wiele wskazuje na to, że wprowadzenie nowego silnika Google spowoduje spore poruszenie wśród specjalistów od pozycjonowania i marketingu wyszukiwarkach. Już teraz wielu użytkowników zauważa, że sandbox zmienia pozycję witryn czy blogów.

Prosty przykład otrzymujemy po wpisaniu w google.pl oraz sandboksa hasła "bank". W wynikach wyszukiwania widać bardzo poważne zmiany w pozycjonowaniu stron przez oba silniki, np. strona Alior Bank (aliorbank.pl) spada z trzeciej pozycji w Google na trzecią stronę wyników.


Komentarze (17)

  • drag
  • 2009-08-12 16:01:25

tak tak szanowne redaktorstwo, drugs to narkotyki a strona drugs.com mowi co wziac zeby sie na(pii)ac ;-) nie wiem co braliscie ale tez to chce

  • SEO
  • 2009-08-12 16:31:55

A ciekawe kociaki jak zmierzyliscie te czasy wyszukiwania? Przypadkiem nie przepisaliscie tych co wam google wyswietla? ;)

  • marx64
  • 2009-08-12 16:39:26

"...w serwisie o narkotykach (drugs.com)" Chyba ktoś nie rozumie innego znaczenia słowa "drug" który w tym wypadku oznacza poprostu "lek". Jest to serwis o lekach, ale jak widać "głodnemu chleb na myśli" ;)

  • Linux_Syf
  • 2009-08-12 17:19:46

Google chrome do kosza i mamy spokój. :)

  • ~gość
  • 2009-08-12 17:30:52

drugstore nieuku to apteka a nie punkt dilowania

  • omfg
  • 2009-08-12 19:00:10

nawet jeżeli w tych wynikach jest brana pod uwagę średnia to i tak jest to bez sensu. Przy wyszukiwaniu słowa "sex", "stare" google lepiej sobie poradziło... ale amatorów tego typu wyszukiwań zasmuci fakt, że "stare" google ma jednak dużo mniej wyników tej tematyki... ;)

  • bartolini
  • 2009-08-12 19:33:58

ciekawe co stanie się z firmami, które bawią się w pozycjonowanie:P

  • Dżyszla
  • 2009-08-12 20:34:06

Beznadziejnie przeprowadzone testy. "Łukasz Bigo" (a w zasadzie: Łukasz Bigo - bez znaków "") jest na 276 linkach, a nie 47000! - wystarczy tylko udać się na ostatnią stronę wyszukiwania, by przekonać się, jak Google interpretuje słowo "około". Jeśli nawet pozwolimy na pokazywanie powielonych stron, to bliższe szacunki mówią o jedynie 46700 stronach (Google wyświetla tylko 1000 pierwszych). Tak więc spojrzenie wyłącznie na to, co pokazuje pierwsza strona to dowód braku kompetencji w ocenie. Ponadto każda jedna strona oparta o bazy danych zawsze zaoferuje wynik tego samego zapytania szybciej, niż za pierwszym razem. Ktoś chyba nie słyszał o mechanizmach cachowania stosowanych w bazach danych! BRAK KOMPETENCJI! Redaktorzy portalu IT...

  • bwgg
  • 2009-08-12 21:22:44

@Dżyszla: odniosę się do drugiej części Twojej wypowiedzi - nie pomyślałeś o tym, że w google.pl dane hasło było już wyszukiwane (może nawet nie raz)? Tak więc brakiem kompetencji możnaby raczej nazwać właśnie porównywanie wyniku "starego" i "nowego" wyszukiwania.

  • Dżyszla
  • 2009-08-12 22:50:46

@bwgg - to też jest pewna szansa, choć wyniki w cachu bazy, w zależności od konfiguracji i ilości zapytań, raczej utrzymują się co najwyżej kilka minut, a dla google.pl może to być zaledwie kilka sekund.

  • LukaszH
  • 2009-08-13 10:53:22

Nie oszukujmy się jeżeli chodzi o czas dostępu to w głównej mierze zależy to od Data Center z jakiego pobierane są dane, sam dzis zrobilem z ciekawosci ten test i wyszedl mi MIX, czyli czesc bylo szybciej z starego google a czesc z sandboxa. Co do ilosci wyswietlanych wynikow to rowniez kwestia DC. Aby snuc takie wnioski nalezaloby sprawdzac te wszystkie rzeczy w oparciu o 1 DC.

  • indian
  • 2009-08-13 14:04:19

Chciałem sprawdzić jak jest z trafnością ale: "We are upgrading elements of our data center. The Caffeine sandbox should be available for searching again in a few hours." Jeśli dodatkowe 10 sekund oczekiwania na wynik wyszukiwania ma mi oszczędzić choć jednego błędnego kliknięcia to wolę poczekać. Dla mnie liczy się tylko kilka, kilkanaście stron - odpowiednich do zapytania... i niech to będę różne strony a nie ta sama powielona. Pozostałe 10kk mnie nie interesują... Ale ok, google rulez, nie ma przebacz;).

  • indian
  • 2009-08-13 14:11:57

proponuję mimo wszystko czasem kasować niektóre komentarze bo dzieciaki z klawiaturkami zamiast joystickami siedzą (bez wskazywania na nicki, wiadomo o kogo chodzi;) ) Dla mnie spoko artykulik.

  • Dżyszla
  • 2009-08-13 21:32:45

LukaszH - dokładnie!

  • bwgg
  • 2009-08-13 22:32:41

@Dżyszla: słusznie - zastanówmy się jednak z jaką częstotliwością w google.pl wyszukuje się hasło takie jak "kot" lub "viagra" (wybór z listy przypadkowy ; )). Jak duże są szanse, że ich wyniki znajdują się w cachu niema cały czas, nawet przy dość krótkim czasie ważności. Z Kofeiny na pewno nie korzystało w tamtym momencie wiele osób - stąd i była możliwość wstrzelenia się z hasłem w pustkę. IMVHO oczywiście.

  • Dżyszla
  • 2009-08-15 19:32:00

@bwgg - ale w artykule zaznaczyli "za drugim razem było szybciej" (czy jakoś podobnie) i to ten właśnie punkt zdyskredytowałem, gdyż za drugim razem doszło do wykorzystania pamięci podręcznej.

  • wp
  • 2009-08-28 21:50:08

Kiepski ten test w przypadku alior banku. Na haslo ''bank'' w ''starym'' googlu jest na 3 miejscu, a w ''nowym'' na 5tym miejscu a nie na 4 ekranie jak sugeruje artykul.

reklama

Popularne produkty

Nokaut

PC World z prezentem!

Tak, zamawiam 12 wydań PC World po 14,09 zł każde (zamiast 19,90 zł) od numeru 6/2012.
Dodatkowo program Panda Antyvirus Pro 2012,
chroniący aż 3 komputery, dostanę za darmo.

PC World 6/2012
Nowy numer PC World 6/2011
Razem: 169


  • Z darmową wysyłką
Wyrażam zgodę na wykorzystywanie mojego adresu email do celów marketingowych. rozwiń »

Pobierz bezpłatnego e-booka

20 lat polskiej sieci
Ebook 20 lat polskiej sieci to kompletna charakterystyka polskiego internetu (oraz polskiego internauty). Odpowiadamy na pytanie, jak wygląda nasz kraj na tle bliższych i dalszych europejskich sąsiadów pod względem popularyzacji szerokopasmowych łączy internetowych i rynku mobilnego. Wymieniamy również wady i zalety korzystania z bezpłatnych punktów dostępowych.
Jeśli chcesz otrzymać darmowego e-booka, wpisz swój adres e-mail. Wyślemy Ci go natychmiast!
Wyrażam zgodę na wykorzystywanie mojego adresu email do celów marketingowych. rozwiń »

  Kariera w IT 2012

Kariera w IT 2012
Uczelnie, rynek pracy, rekrutacja, pracodawcy, rozwój zawodowy - czyli wszystko, co chcielibyście wiedzieć o pracy specjalistów IT w Polsce. Piszemy jakie uczelnie wybrać, dlaczego warto studiować informatykę i kierunki techniczne, jak wygląda proces rekrutacji i jak dobrze wypaść przed pracodawcą, opisujemy pracodawców - firmy IT - i możliwe ścieżki kariery.

  Rekomendacje

reklama
Warunki obsługi - Kontakt - Regulamin - Polityka prywatności
Serwis zgodny z ASME - Serwisy IDG - Reklama -

Prenumerata: PC World, Computerworld, Networld
© Copyright 2012 International Data Group Poland S.A.
04-204 Warszawa ul. Jordanowska 12
tel.(+4822)321-78-00   fax(+4822)321-78-88
Archiwum wiadomości: 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001