Google: Ludzie nam ufają
26 października 2007 12:21, Piotr Zalewski
-Jeśli odnajdziesz długo poszukiwanego przyjaciela lub ważne informacje dotyczące trudnej do zdiagnozowania choroby myślisz "ale mam szczęście". I ten moment, każdy z nich kiedy najważniejsza dla Ciebie strona WWW ukazuje się jako pierwszy wynik w Google, zostaje w twojej pamięci- mówi Marissa Mayer, wiceprezes Google Inc. ds. wyszukiwania i satysfakcji użytkownika. W wywiadzie udzielonym IDG News Service, opowiada o przyszłości wyszukiwania: wyszukiwaniu uniwersalnym i wideo oraz problemach z nimi związanych. Wspomina o tym czego obawia się Google, o tym ile lat będą jeszcze trwały prace nad wyszukiwaniem oraz o tym, że firma... analizuje rozmowy głosowe.
Google Video rozwijało się w interesujący sposób. Przy starcie wyszukiwanie opierało się na załączonych opisach i, co ciekawe, nie można było odtwarzać wideo. Zmieniliśmy to. Dzisiaj jest możliwość odtwarzania wideo [przy wynikach wyszukiwania - przyp. red.] i przeszukiwania treści na poziomie meta. Jeden z kolejnych elementów, który prawdopodobnie pojawi się w wyszukiwaniu wideo, jest związany z rozpoznawaniem mowy.
Prawdopodobnie słyszałeś o naszej usłudze 1-800-GOOG411 [darmowa usługa telefoniczna działająca w USA - rozmówca komunikuje się głosowo z automatem by uzyskać informacje lokalne, np. o najbliższej pizzerii - przyp. red].
To czy -411 może być rentownym biznesem na razie nie jest jasne. Ja jestem dość sceptyczna. Powodem dla którego naprawdę stworzyliśmy ten system jest zbudowanie doskonałego systemu przetwarzania mowy na tekst... I ten system będzie miał bardzo wiele różnych zastosowań, także wyszukiwanie wideo.
Nasi eksperci od rozpoznawania mowy mówią: jeśli chcecie byśmy zbudowali dobry model rozpoznawania mowy, potrzebujemy jak najwięcej fonemów, czyli jak nawięcej sylab wymawianych przez szczególne głosy o szczególnej intonacji. Więc potrzebujemy wielu rozmawiających ludzi, mówiących różnorodne kwestie, żebyśmy mogli "wytrenować" nasz system. Podsumowując 1-800-GOOG411 opiera się na pozyskaniu wielu różnorodnych sampli zawierających mowę, po to by rozpoznając głos w wideo, zrobić to z jak największą dokładnością.
Marissa Mayer, Vice President of Search Product and User Experience, Google
Marissa Mayer ma 32 lata. Do Google dołączyła w 1999 r. i była jednym z pierwszych pracowników firmy, która dzisiaj na całym świecie zatrudnia kilkanaście tysięcy osób.
Została pierwszą kobietą na stanowisku inżynierskim w Google. Ukończyła informatykę na Uniwersytecie Stanforda.
A co z niemą treścią wideo, np. akcją?
To będzie szczególnie trudne, większość dzisiejszych rozwiązań Google bazuje na tekście. Potrzebujemy tekstu i dlatego pracujemy nad jak najlepszym modelem rozpoznawania mowy i przekształcania jej w tekst. Zgadzam się, że jest bardzo wiele sytuacji humorystycznych, takich, w których dużą rolę gra kontekst i wiele scen, które nie zawierają żadnych dialogów. I w tego typu wypadkach musimy zdać się na społeczność, która będzie na przykład "tagowała" filmy.
Badania nad rozpoznawaniem twarzy i obiektów w wideo są na bardzo wczesnym etapie. Można stwierdzić: tak, w tej klatce pokazywana jest piłka, ale to dużo za mało i za wcześnie aby to miało jakiekolwiek komercyjne zastosowanie.
Niektórzy krytykują Google za to, że analizuje zapytania ze względu na pojedyncze słowa kluczowe, a nie język naturalny, jak całe zdania.
Na dzień dzisiejszy Google naprawdę dobrze sobie radzi ze słowami kluczowymi, myślimy, że to ograniczenie powinno znikać wraz z upływem czasu. Ludzie powinni mieć możliwość zadawania pytań, a my powinniśmy mieć możliwość rozumienia tych pytań. Albo powinni mieć możliwość komunikowania się z wyszukiwarką na różnych poziomach ogólności. Otrzymujemy wiele zapytań ogólnych - nie o konkretne słowa, ale bardziej w stylu "o co w tym chodzi?". Wielu ludzi uważa, że rozwiązaniem tego typu problemów jest sieć semantyczna. My jednak patrzymy na sprawę inaczej - przy dużej ilości danych, zaczynasz dostrzegać rzeczy, które w działaniu sprawiają wrażenie inteligentnych, chociaż w istocie dotarcie do nich odbywało się na najniższym poziomie.
Na przykład kiedy wpiszesz do Google "GM", to wiemy, że chodzi o "General Motors". Z kolei jeśli wpiszesz "GM foods", odpowiadamy "genetically-modified foods" [ang. żywność modyfikowana genetycznie]. Ponieważ przetwarzamy ogromne pokłady informacji, mamy wiele danych o kontekście, np. wokół akronimów. I dochodzi do tego, że silnik wyszukiwarki wygląda na sprytny, tak jakby znał semantykę, tymczasem naprawdę tak nie jest. Opiera się to po prostu na rozwiązaniach typu "brute force". Moim zdaniem, najlepszym algorytmem dla wyszukiwania powinny być metody obliczeniowe typu brute-force, wynikające ze zwykłej złożoności analizy dużej ilości danych oraz metoda jakościowa opierająca się na ludziach.
Komentarze (5)
- bozia
- 2007-10-26 12:50:13
Czy przypadkiem nie chodzi o Blinkx'a?
- pz
- 2007-10-26 13:08:12
Oczywiście. Poprawione. Pozdrawiam.
- dw
- 2007-10-26 13:08:28
fajna laska
- whatever
- 2007-10-26 18:16:35
sluchalem kiedys tej baby(dokument na planete). pomijajac och i achy "jakie to google jest wspaniale" itp. to gubila sie w zeznaniach na temat bezpieczenstwa i wykorzystywania przechowywanych danych. dziewcze przypominalo cymanskiego - albo skupiala sie na nieistotnych szczegolach, albo zmieniala temat
- domino00
- 2007-10-26 20:01:24
a czy można ufać firmie? a jeśli tak co to oznacza? Megalomania Googa pożre go sama, bo ma wszystko największe jak sam Goog
reklama
Ekspres DE LONGHI ECO 310
Ekspres DE LONGHI ECO 310
w 54
sklepach od 313,00 zł
Ekspres DE LONGHI ECO 310
Gra Xbox 360 Kinect Sports
Gra Xbox 360 Kinect Sports
w 47
sklepach od 135,30 zł
Gra Xbox 360 Kinect Sports
Pobierz bezpłatnego e-booka 

Ebook 20 lat polskiej sieci to kompletna charakterystyka polskiego internetu (oraz polskiego internauty). Odpowiadamy na pytanie, jak wygląda nasz kraj na tle bliższych i dalszych europejskich sąsiadów pod względem popularyzacji szerokopasmowych łączy internetowych i rynku mobilnego. Wymieniamy również wady i zalety korzystania z bezpłatnych punktów dostępowych.
Kariera w IT 2012
Uczelnie, rynek pracy, rekrutacja, pracodawcy, rozwój zawodowy - czyli wszystko, co chcielibyście wiedzieć o pracy specjalistów IT w Polsce. Piszemy jakie uczelnie wybrać, dlaczego warto studiować informatykę i kierunki techniczne, jak wygląda proces rekrutacji i jak dobrze wypaść przed pracodawcą, opisujemy pracodawców - firmy IT - i możliwe ścieżki kariery.
Rekomendacje
reklama
Program miesiąca
reklama


