Niedziela, 17 października 2021

Spotify może wykorzystywać nagrania głosowe do ulepszania sugestii muzycznych

14 czerwca 2021

Naukowcy ze Spotify, popularnego serwisu streamingowego, zgłosili patent na technologię, która w przyszłości może zostać wykorzystana do poprawy sugestii muzycznych. Choć brzmi to interesująco i obiecująco, kontrowersyjnym aspektem tej technologii jest fakt, że polega ona na śledzeniu i wykorzystywaniu nagrań głosów użytkowników, dzięki czemu algorytm może "ocenić" nastrój danej osoby i zasugerować jej odpowiednie utwory muzyczne.

W poszukiwaniu lepszego sposobu na znalezienie preferencji użytkownika lub odpowiedniej muzyki, Spotify może w przyszłości polegać m.in. na głosach słuchaczy. Według patentu, informacje prozodyczne, takie jak intonacja czy rytm głosu, mogłyby zostać wykorzystane do określenia nastroju użytkownika. Na tej podstawie można by następnie sugerować odpowiednie piosenki lub muzyków.

Oprócz głosu użytkownika, w takich sugestiach mogłyby być uwzględnione również odgłosy z otoczenia. Na ich podstawie można np. określić, czy słuchacz jest sam, czy też otaczają go inni ludzie.

Optymalizacja sugestii muzycznych poprzez rozpoznawanie mowy

Jednym z powodów takich badań jest obecnie stosowana technologia "poznawania" użytkowników. Często wiąże się to z wypełnianiem długich i czasochłonnych dialogów lub wybieraniem listy preferowanych muzyków, aby na ich podstawie otrzymywać spersonalizowane sugestie.

Zgodnie z patentem, "potrzebne jest zupełnie inne podejście do zbierania atrybutów smaku użytkownika". Celem jest sprawienie, by ręczne wprowadzanie danych było przynajmniej częściowo zbędne. Właśnie w tym miejscu ma się pojawić analiza sygnału audio, czyli mowy i szumu tła.

muzyka

Co mowa może ujawnić o użytkowniku

W patencie podano kilka przykładów tego, co nowy system powinien być w stanie rozpoznać. Oprócz samego rozumienia tego, co powiedział użytkownik, powinien on być w stanie odfiltrować metadane. Obejmuje to, na przykład, stan emocjonalny, płeć, wiek i ewentualny akcent użytkownika.

Na podstawie odgłosów z otoczenia możliwe jest również rozpoznanie otoczenia. Dotyczy to nie tylko tego, czy użytkownik znajduje się w pociągu, samochodzie, parku lub sklepie, ale także tego, czy jest sam, w małej grupie lub na imprezie.

Wszystkie te informacje będą następnie łączone na przykład z poprzednimi prośbami słuchacza, jego istniejącą biblioteką muzyczną, a także opiniami znajomych, aby zasugerować nadchodzące treści.

Nagrania audio: co z prywatnością?

Opisany system pozostawia otwartą kwestię, jak dokładnie Spotify zamierza uzyskać te dane audio od swoich użytkowników. Można by sobie wyobrazić na przykład funkcję bezpośredniego wprowadzania głosu w aplikacji. Ale co dzieje się np. z nagraniami po ich przeanalizowaniu? I co z samymi wynikami tych analiz? To byłyby pytania otwarte.

Ponieważ jednak jest to na razie tylko patent, możemy jedynie spekulować na ten temat. Odblokowanie mikrofonu dla aplikacji musi być jawnie włączone przez użytkownika, więc niechciane podsłuchiwanie przez Spotify jest mało prawdopodobne.

Co więcej, firmy często patentują technologie dla siebie, nie znajdując ich ostatecznie w końcowych produktach. Jest więc całkiem możliwe, że taka funkcja nigdy nie zostanie zintegrowana ze Spotify.

Więcej znajdziesz na: http://foto-raj.pl/