Wyszukiwarka Onetu ulepszona

Internet Standard 30 września 2005 16:49, Magdalena Górak
3 października Onet na poważnie włączy się do wyścigu o użytkowników wyszukiwarek. Stary OnetSzukaj zostanie zaprezentowany w nowej postaci. Sam indeks wrośnie do ponad 200 mln stron, będzie więc trzykrotnie większy niż liczba stron indeksowanych przez ostatnio wzbogacony NetSprint, jednak twórcy nowego produktu podkreślają, że nie to jest jego główną zaletą.
Dr Marek Jerzy Minakowski, dyrektor serwisów wyszukiwawczych Onet.pl - nasza pozycja na polskim rynku internetowym motywowała nas do wytężonych prac nad udoskonaleniem oferowanej wyszukiwarki. O skali dokonanego postępu świadczyć może to, że dwudziestokrotnie zwiększyliśmy liczbę odwiedzanych adresów internetowych. Kierując się ambicją stałego udoskonalania OnetSzukaj, rozbudowaliśmy zespół ludzi zajmujący się weryfikacją wyników wyszukiwania, doskonalący je i eliminujący pozycje niepożądane. Wykorzystaliśmy też dziesięcioletnie doświadczenie w tworzeniu serwisów, które są wygodne i przyjazne w użyciu - skomentował.

- Serwis ma być przezroczysty. Użytkownik powinnien po prostu dostać to, czego szuka - dodał. Dodajmy, że wyszukiwarka Onetu skupia się na indeksowaniu polskich stron, czyli stron w języku polskim i domenie .pl.

od lewej: dr Marek Jerzy Minakowski, dyrektor BU Wyszukiwarki i Katalog oraz Radosław Krawczyk, redaktor naczelny Onetuod lewej: dr Marek Jerzy Minakowski, dyrektor BU Wyszukiwarki i Katalog oraz Radosław Krawczyk, redaktor naczelny Onetu Algorytm wyszukiwarki bierze pod uwagę informacje z OnetKatalogu, czyli katalogu polskich stron WWW, który jest tworzony od prawie 10 lat i stale doskonalony ręcznie, dzięki czemu można efektywnie eliminować spam oraz niepożądane rezultaty. Znajduje się w nim ponad 200 tys. opisanych serwisów internetowych, pogrupowanych w 10 tys. głównych kategorii, z których każda ma swojego opiekuna. Liczba gwiazdek przy danym serwisie opisująca jego tematyczną adekwatność, ma wpływ na miejsce w wynikach wyszukiwania.

Przy ocenie danego serwisu, obok informacji z katalogu, pomocne są też dane o popularności danego serwisu pochodzące z Megapanelu.

- O pozycji w wynikach wyszukiwania decyduje przede wszystkim zgodność tematyczna z zapytaniem. Liczymy ją według szeregu parametrów. Bierzemy pod uwagę, czy dane słowa występują w tytule, a jeżeli występują, to w jakim przypadku, czy są w adresie strony czy domenie - wyjaśnia Marek Minakowski. Tzw. page rank ma wpływ na wysokość rezultatów wyszukiwania w tych sytuacjach, gdy strony nie różnią się ze względu na inne aspekty.

Użytkownicy mogą aktywnie włączyć się w redagowanie wyników zgłaszając, że dana strona jest nie na temat, dzieki widocznej koło każdego rezulatatu wyszukiwania ikonki kosza na śmieci. W okienko wyszukiwarki można wpisywać pełne zwroty w języku polskim czyli zwroty z języka naturalnego. Stąd hasło promocyjne "Szukaj jak człowiek".

Silnik nowej wyszukiwarki Onetu został dopracowany dzięki kooperacji z czeskimi i słowackimi specjalistami od wyszukiwarek pracującymi dla Centrum.cz oraz Centrum.sk.

Komentarz Artura Banach, prezesa NetSprint
Informacja, która znalazła się na stronie głównej serwisu, mówiła o "przegladaniu przez Onet ponad 201 mln stron miesięcznie". Jest to więc zupełnie inna wielkość niż liczba stron w indeksie przeszukiwanym przez wyszukiwarkę (jak również inna liczba niż 67.395.841 stron w polskim Internecie, jakie przeszukuje NetSprint). Prawdopodobnie liczba dotyczyła liczby stron, jaką spider Onetu miesięcznie odwiedza.

Z posiadanych przez nas informacji oraz przeprowadzonych badań wynika, że wielkość indeksu NetSprint.pl i Onet.pl są porównywalne, zaś tempo odswieżania stron na NetSprincie jest istotnie większe (np. wszystkie serwisy opiniotwórcze są odwiedzane przez spidery NetSprinta codziennie).

Oczywiście, nie zmienia to faktu, że wielkość indeksu jest ważnym, ale nie najważniejszym kryterium porównawczym dla użytkowników. Rozwiązanie wdrożone przez Onet z pewnością prowadzi do poprawy jakości wyników jaką otrzymują użytkownicy korzystający z wyszukwiarki na tym portalu.

Jesteśmy jednak przekonani, że wykorzystywana przez NetSprint unikalna wiedza na temat ruchu na kilkuset tysiącach polskich serwisów internetowych w połączeniu z całym szeregiem innych czynników przez nas analizowanych przez zaawansowane algorytmy, zaowocuje dużo lepszymi rezultatami niż w konkurencyjnych wyszukiwarkach.



Aktualizacja 3 października 2005 15:41

Informację uzupełniliśmy o komentarz Artura Banacha, prezesa spółki NetSprint, który zwraca uwagę, że 201 mln stron, o jakich mowa w naszej informacji, nie jest tożsama z liczbą indeksowanych stron. Jest to natomiast liczba stron odwiedzanych przez "pajączka" wyszukiwarki Onetu.

Jednocześnie dr Marek Jerzy Minakowski, dyrektor BU "Wyszukiwarki i Katalog" poinformował nas, że informacja o liczbie stron odwiedzanych przez "spidera" OnetSzukaj zniknęła z wyszukiwarki. "Dla użytkownika nie jest ważna liczba indeksowanych stron, lecz trafność wyników" - powiedział nam. Ruch ten wpisuje się więc w strategię Google, która również usunęła informację o liczbie indeksowanych stron.



Komentarze (12)

  • m2k4
  • 2005-09-30 18:33:29

byłem na wersji beta... fakt ilość dokumentów zaindeksowana podobno 200mln... ale na hasło jednej z najbardziej znanych firm internetowych pierwsze dokumenty to podstrony jakiś wiadomości o tej firmie... brak na pierwszej stronie wyników strony głównej!!!! nie ilośc ale jakość wyników powinna być brana pod uwagę... porażka jak dla mnie

  • dab
  • 2005-09-30 21:06:58

a gdzie ta wersja beta ??? a ikonka śmietnika to jakiś żart ??

  • luman
  • 2005-09-30 21:20:35

kolejne nieprzemślane podejście, nastawione komercyjnie do twórców. TAaaak katalog i gwiazdki to podstawa do oceny wartości strony :P Megapanel kolejna bzdura już przerabiana na forum pio w stosunku do netsprint. Kosz na śmieci co za bzdura, na pewno nie będzie miał zabezpieczeń naklikiwania, tak jak to miało miejsce w wp i jej słynnym acz krótkowtrwałym kilohicie :P Ludzie opamiętajcie się!! Jak ten algo nowy z onetu będzie taki jak jest teraz to szukając czegokolwiek z polskimi znakami dostaniemy takei bzdury że hej np: żupa - no wiadomo dawna nazwa kopalni, ale nie nie Onet wie lepiej i co wyświetla na pierwszyh miejscach ??!! (No oczywiście wspominając o wyniku poprostugotuj.onet.pl/home (total!!)) a wyświetla na pozycji 2 !! taraaa - www.bitwykomiksowe.gaa.pl/bojownicymenu.php z tytułem "BK Site: ...bo zupa była za słona" 3 pozycja to "mizeria: zupa gud" To jest żałosne!

  • Abgan
  • 2005-09-30 21:50:04

luman, czepiasz się. Wpisz "żupy" i będziesz miał dobrze. Liczba mnoga tego rzeczownika jest bardziej rozpowszechniona, zachowała się w nazwach własnych i jest w OnetWIEM. A jestem skłonny uwierzyć, że ludzie szukający kulinariów wpisywali "żupa" przez pomyłkę :)

  • libra
  • 2005-09-30 23:28:21

Taaa, jasne. Na pewno będzie taka jak wszystko na Onecie. Użytkownicy natomiast nie będą mogli wyrazić swojej opinii na jakimkolwiek forum, albowiem, z niewiadomych przyczyn, komentarze zamieszczane są z czterogodzinnym opóźnieniem. Albo wcale.

  • nashaden
  • 2005-10-01 09:28:26

być może zostanę posądzony o przemądrzałość, liozusostwo, konserwatywność, i wiele innych rzeczy, ale... jedyną godną uwagi wyszukiwarką jest - i będzie jeszcze przez długi czas - http://www.google.pl/. Od ponad 4 lat nie zdażyło mi się, nawet raz, skorzystać z innej wyszukiwarki...

  • lesioand
  • 2005-10-01 18:05:23

wiele jest wyszukiwarek, ale jak powiedziano chyba google jest super przeglądarka i napewno wiele wody upłynie, aby ktos mógł przebic.

  • lesioand
  • 2005-10-01 18:10:16

jak napisano o google to tak jest, więc co tu gadac gogle to jest to!! www.tvsat24.dt.pl

  • pirat
  • 2005-10-02 12:00:53

"Bierzemy pod uwagę, czy dane słowa występują w tytule, a jeżeli występują, to w jakim przypadku, czy są w adresie strony czy domenie" - faktycznie bardzo nowatorskie rozwiązanie ;)

  • Piter
  • 2005-10-03 18:59:10

niech Panowie z onet.pl i netsprint.pl pomyślą nad jakością wyników a nie chwalą się ilością. bo masa śmieci zalega u nich, goorzej niż na najgorszym wysypisku. strony nieistniejące fizycznie od 2-3 miesięcy są ciągle w indexach. do tego masa contentu spamerskiego pozycjonerów typu biblie etc. i wychodzi ze na przeciętnego Polaka (netsprint.pl) przypada niecałe 2 strony. ha ha ha

  • zdziwiony
  • 2005-10-06 11:54:11

Gdzie ta nowa wyszukwiarka ????????? Wyniki jaki były takie są Zmianie uległa tylko oprawa graficzna !!!!! przestańcie ściemniać !!!!

  • edek
  • 2005-12-28 18:44:50

Faktycznie wyszukiwarki Onetu i Netsprint,to się zrobiło największe śmieciowisko.Na pierwszych pozycjach wyskakuja wyrazy nie związanie z serwisami.Mam stronę z PR 5 google a w netsprincie,nie wiem gdzie ona jest.

reklama

Popularne produkty

Nokaut

Pobierz bezpłatnego e-booka

20 lat polskiej sieci
Ebook 20 lat polskiej sieci to kompletna charakterystyka polskiego internetu (oraz polskiego internauty). Odpowiadamy na pytanie, jak wygląda nasz kraj na tle bliższych i dalszych europejskich sąsiadów pod względem popularyzacji szerokopasmowych łączy internetowych i rynku mobilnego. Wymieniamy również wady i zalety korzystania z bezpłatnych punktów dostępowych.
Jeśli chcesz otrzymać darmowego e-booka, wpisz swój adres e-mail. Wyślemy Ci go natychmiast!
Wyrażam zgodę na wykorzystywanie mojego adresu email do celów marketingowych. rozwiń »

  Kariera w IT 2012

Kariera w IT 2012
Uczelnie, rynek pracy, rekrutacja, pracodawcy, rozwój zawodowy - czyli wszystko, co chcielibyście wiedzieć o pracy specjalistów IT w Polsce. Piszemy jakie uczelnie wybrać, dlaczego warto studiować informatykę i kierunki techniczne, jak wygląda proces rekrutacji i jak dobrze wypaść przed pracodawcą, opisujemy pracodawców - firmy IT - i możliwe ścieżki kariery.

  Rekomendacje

reklama
reklama
Warunki obsługi - Kontakt - Regulamin
Polityka prywatności - Serwis zgodny z ASME
Serwisy IDG - Reklama -
© Copyright 2011 International Data Group Poland S.A.
04-204 Warszawa ul. Jordanowska 12
tel.(+4822)321-78-00   fax(+4822)321-78-88
Archiwum wiadomości: 2011 2010 2009 2008 2007 2006 2005 2004 2003 2002 2001