Jak technologia wyszukiwania głosowego przenika do naszego codziennego życia?

10.03.2016

 

Pomimo iż wyszukiwanie głosowe jest nam znane już od kilku lat, ostatnimi czasy trend przybiera na sile. Dzieje się tak między innymi dlatego, że następuje automatyzacja naszych codziennych aktywności, dzięki czemu możemy za pomocą prostych aplikacji w telefonie sterować urządzeniami elektrycznymi, lub nawiązywać między nimi współpracę. Innym z powodów jest to, ze przestajemy się bać nowych technologii, a do małego wyręczenia z prostych czynności nie trzeba nas długo namawiać.

Producenci nowych technologii wykorzystujących wyszukiwanie głosowe dostrzegli jak wielki potencjał może mieć skomunikowanie tych urządzeń nie dzięki dostępnej klawiaturze, lub ekranie dotykowym, ale właśnie dzięki użyciu głosu.

Jak to działa?

Przed przejściem do tematu sterowania urządzeniami głosem przypomnijmy w skrócie jak działa ta technologia na podstawie systemu „Ok Google” wdrożonego na smartfonach najnowszej generacji. System ten opiera się na kombinacji przetwarzania języka naturalnego (NLP – Natural Language Processing) oraz programowej syntezy mowy danego języka typu Text-to-Speech (TTS), które potrafią przeprocesować zapytanie, a następnie wyciągnąć dane ze swojej bazy i zwrócić najbardziej trafną odpowiedź. Ta technologia dodatkowo opiera się między innymi na historii wyszukiwań użytkownika i kontekście wyszukiwanej frazy. Tak między innymi działa Alexa w witrynie Amazonu, Cortana w systemie Windows, lub Siri w Apple.

Czy trend faktycznie ostatnio przybiera na sile?

Przed rokiem 2015, ilość zapytań z użyciem wyszukiwania głosowego w USA była znikoma. Obecnie stanowi już 10% wszystkich wyszukiwań. Według ComScore, firmy od lat zajmującej się badaniami rynku, do 2020 roku ilość wyszukiwań głosowych przekroczy 200 bilionów (!) zapytań. Podobnie, Tim Tuttle, założyciel firmy technologicznej ExpectLabs bazującej na technologii sztucznej inteligencji, przewiduje, że do 2020 roku rynek systemów sterowania głosem będzie wart 40 bilionów dolarów. Szacunkowo jedynie 5% z 3 bilionów urządzeń będzie wyposażonych w klawiaturę, zatem wdrożenie takiego systemu będzie niezbędne.

Warto również spojrzeć na wyniki badania przeprowadzonego w grudniu 2015 przez technologiczną platformę Mindmeld, która przedstawia najnowsze statystyki dotyczące wyszukiwania głosowego. Z badania przeprowadzonego na grupie 1800 dorosłych użytkowników smartfonów dowiadujemy się między innymi, że:

  • 60% zaczęło używać wyszukiwania głosowego w zeszłym roku, w tym aż 40% w ciągu ostatnich 6 miesięcy
  • Częstotliwość korzystania z wyszukiwania głosowego w ciągu ostatnich miesięcy wzrosła u 40% respondentów, w tym 20% uważa, że wzrosła znacznie
  • Obecnie prym w wyborze asystenta wyszukiwania głosowego wiedzie Siri (40,4%), zaraz po niej OK Google (25,9%)

Screen-Shot-2015-12-10-at-11.52.23-AM-800x490

Najnowsze trendy

Jakie urządzenia, poza telefonami, które w pionierski sposób wykorzystują systemy głosowe, dają nam obecnie możliwość sterowania głosem? Od kilku lat znane są już systemy, które za pomocą aplikacji, po odpowiednim skonfigurowaniu z centralą, nie tylko wykonają proste polecenia „włącz światło” lub „zamknij rolety”, lecz dopytają, w którym pomieszczeniu wykonać te czynności.

Obecnie te systemy mocno się rozwinęły. Jednym z najciekawszych i najczęściej komentowanych trendów na tegorocznym CES w Las Vegas (Consumer Electronics Show) był system kontroli głosowej Amazon Echo, który umożliwia skomunikowanie różnych aplikacji w domu i sterowanie nimi głosowo. Asystuje nam tutaj syntezator mowy Alexa, którą w ramach podstawowej funkcjonalności możemy poprosić o włączenie wybranej piosenki, stacji radiowej, odczytanie audiobooka, podanie lokalnej pogody lub wiadomości ze świata sportu. Lecz to nie wszystko na co stać Alexę.

System rozwija się w bardzo szybkim tempie, obejmując na dzień dzisiejszy ponad sto funkcjonalności, a różni producenci prześcigają się w pomysłach na to, jak wykorzystać potencjał głosowej asystentki. Najnowszą kompatybilność z systemem Echo zaprezentował podczas CES 2016 system bezpieczeństwa Vivint, dzięki któremu nie tylko włączysz i wyłączysz głosem wszystkie zabezpieczenia w domu, ale również w razie potrzeby zadzwonisz na wybrany numer telefonu. Innym przykładem jest producent termostatów Ecobee3, który wykorzystał możliwości sterowania mową do regulacji temperatury wnętrza na różnym poziomie w całym domu.

Również dobrze znana firma Uber zakomunikowała kilka dni temu zintegrowanie swojego API (Application Program Interface) z systemem Amazonu. Dzięki temu wystarczą trzy magiczne słowa „zamów mi Uber” w dowolnej kombinacji lub z dowolnymi synonimami (również słowo „taxi” rozumiane jest tutaj jako Uber) i kilka minut później czeka na nas zamówiony samochód.

amazon_echo

Jednocześnie dużym zainteresowaniem cieszy się trend instalowania mikrofonów w urządzeniach domowych. Zapytaj swoją lodówkę LG „co przyrządzić ze składników, które obecnie znajdują się w lodówce”, a w odpowiedzi dostaniesz listę przepisów. Wybierz ten, który cię interesuje, a lodówka prześle dalej sygnał do twojego inteligentnego piekarnika, który nastawi odpowiednią temperaturę i voila, obiad (prawie) gotowy. Fakt, że odpowiedzi pojawiają się w wersji cyfrowej, a nie głosowo, jak w przypadku rozmowy z asystentką na smartfonie, jest tu całkowicie uzasadniona. Jak podkreślają producenci tych technologii, w odpowiedzi zwracane jest kilka wyników jednocześnie, co ułatwia nam dalszy wybór.

Widząc to, w jakim kierunku rozwija się technologia głosu, firmy takie jak Google, Samsung lub Intel inwestują nie tylko w swoje własne systemy, ale również w rozwój zewnętrznych firm, między innymi wspomnianej już platformy MindMeld, z niezwykle zaawansowaną technologią rozumienia mowy. Poniższy film doskonale obrazuje moment, w którym wyszukiwanie głosowe Apple „gubi się” i nie potrafi już zwrócić żadnej odpowiedzi, podczas gdy Mindmeld analizuje mowę dalej i zwraca dokładne i poprawne wyniki.

A jak technologia wykorzystania metod głosowych rozwija się w Polsce? Co prawda Amazon wykupił syntezator polskiej mowy IVONA, jednak system Echo nie posiada polskiej wersji językowej. Obecnie wykorzystamy możliwości wyszukiwania głosowego w naszych smartfonach, jednak na pełną kompatybilność z językiem polskim szerokiego spektrum urządzeń producenci każą nam jeszcze poczekać.

Podsumowując, tradycyjna wyszukiwarka internetowa ewoluuje, powoli stając się naszym osobistym, prawie wszystkowiedzącym, asystentem, a futurystyczne sceny z głosową asystentką w roli głównej, rodem z filmu „Her”, które obecnie wydają się abstrakcją, niedługo nikogo nie będą dziwić.

Autor: Marta Bujna, MEC

Źródła:  2 3 4 5 6 7 8 9