Jak działają aplikacje do tłumaczenia mowy kota?

Jak działają aplikacje do tłumaczenia mowy kota?

Prawdopodobnie widziałeś aplikacje, które twierdzą, że tłumaczą to, co mówi Twój kot. Ale czy naprawdę potrafią przetłumaczyć miauczenie twojego kota na angielski? Krótka odpowiedź brzmi tak, poniekąd. Jest to trudne ze względu na to, jak wyjątkowy jest „język” każdego kota, ale potrafią zbliżyć się do nowoczesnej technologii.





Aplikacje do tłumaczenia Cat, takie jak MeowTalk, wykorzystują formę rozpoznawania mowy, która kładzie nacisk na uczenie maszynowe. Przyjrzyjmy się bliżej.





Rozpoznawanie mowy i uczenie maszynowe

Mary Teresa McLean/ Pixabay





Rozpoznawanie mowy działa poprzez nagrywanie mowy i przekształcanie dźwięku w cyfrowy plik danych. Koduje dane, takie jak wysokość i głośność, jako punkty danych, które aplikacja może analizować i dopasowywać do znaczeń. Mikrofony DPA wyjaśnia, że ​​te punkty danych mogą wyglądać bardzo różnie w zależności od dźwięków tła i sposobu wypowiadania słowa.

Czasami uznajemy rozpoznawanie głosu za rzecz oczywistą, ale to niesamowite osiągnięcie technologiczne. Zwłaszcza biorąc pod uwagę, jak złożona jest ludzka mowa. Jak Naukowiec wyjaśnia, że ​​każde słowo zawiera szeroką gamę dźwięków lub „fonemów” zmieszanych ze sobą. Zrozumienie mowy przez komputer jest bardzo trudne. Nowa granica dźwięków kotów będzie jeszcze trudniejsza.



Aplikacje korzystające z rozpoznawania mowy są zaprogramowane za pomocą „słownictwa” słów zwanego zbiorem danych. Następnie aplikacja dopasowuje twoją mowę do najbliższej opcji w swoim słowniku danych.

Kiedy popełni błąd, poprawiasz go, a on zapisuje te dane na następny raz. To część uczenia maszynowego. W ten sposób program uczy się rozpoznawać mowę, nawet jeśli nie jest ona identyczna z zestawem danych, od którego zaczął.





Powiązane: Czym są algorytmy uczenia maszynowego? Oto jak one działają

Rozpoznawanie głosu nadal ma problemy, zwłaszcza z zaburzeniami mowy i akcentami. Niektóre firmy ulepszają jednak uczenie maszynowe, aby przezwyciężyć te problemy. Z biegiem czasu uczenie maszynowe może zmienić rozpoznawanie mowy w potężne narzędzie.





znajdź mój iphone mówi offline, co to znaczy

Tak działa rozpoznawanie mowy u ludzi. Ale czy to działa u kotów?

Rozpoznawanie mowy a rozpoznawanie miauczenia

Ariana Suarez / Unsplash

Po pierwsze, musimy zrozumieć, dlaczego tłumaczenie pewnego rodzaju miauczenia jako „jestem głodny” różni się od analizy ludzkiej mowy. Problem polega głównie na tym, że komunikacja kota w większym stopniu opiera się na niewerbalnych sygnałach, takich jak postawa. Innym problemem jest brak uniwersalnego „języka kota”.

Według ASPCA , dorosłe zdziczałe koty nigdy nie miauczą do siebie, tylko do ludzi. Inne badania autorstwa Towarzystwo Humanitarne dodaje, że te dźwięki „nie pojawiają się w próżni”. Musimy je interpretować wraz z mową ciała i innymi kontekstami. W wielu przypadkach te ciche sygnały są jedyną różnicą między miauczeniem, które oznacza „jestem głodny”, a takim, który oznacza „chcę się bawić”.

Dodając do tego problem, żadne dwa koty nie mają tego samego języka. Koty rozwijają spersonalizowane „języki” dla swoich właścicieli. Opierają się one częściowo na imitowaniu głosu właściciela, a częściowo na osobowości kota. Żadne dwa koty nie brzmią tak samo, nawet gdy wyrażają to samo pragnienie lub potrzebę. Jak więc można przetłumaczyć słownictwo mowy jednej aplikacji dla wszystkich?

Elastyczne uczenie maszynowe dla kotów

Darmowe w użyciu dźwięki/ Unsplash

Chociaż kilku wirtualnych asystentów lubi Automatyczny próba zrozumienia tonu i emocji, rozpoznawanie mowy jest nadal okropne w przypadku sygnałów niewerbalnych. Ale to nie znaczy, że nie da się ich zinterpretować.

oglądaj filmy za darmo online bez pobierania i rejestracji

MeowTalk wykorzystuje bardziej elastyczny rodzaj uczenia maszynowego, aby pomóc przezwyciężyć te problemy.

Pobierać: Miaurozmawiaj dla Android | ios (Darmowy)

Meowtalk został stworzony przez Javiera Sancheza, który również pracował w zespole Alexa. Wyobraził sobie aplikację jako krok w kierunku inteligentnych obroży. Obroże te tłumaczyłyby dźwięki kotów na mowę ludzką, opierając się na złożonych strategiach uczenia maszynowego, aby pomóc ludziom lepiej zrozumieć i opiekować się swoimi kotami.

Zespół MeowTalk zrekompensował problemy z wyjątkowością, tworząc bardziej szczegółowe profile dla każdego kota. W aplikacji rejestrujesz każdego kota osobno. Nauka Norwegia informuje, że kocięta miauczą inaczej niż dorosłe koty, więc aplikacja prosi również o urodziny kota. Każdy profil generuje unikalną sieć danych dla kota, włączając trochę głębokiego uczenia się do uczenia maszynowego.

Powiązane: Głębokie uczenie a uczenie maszynowe a sztuczna inteligencja: jak one idą w parze?

Jeśli chodzi o słownictwo, MeowTalk zaczyna się od 10 profili dźwiękowych w swoim zbiorze danych. Każdy ma inne znaczenie, takie jak „szczęśliwy” lub „polowanie”. Gdy aplikacja usłyszy dźwięk i pomyli się, możesz go poprawić lub stworzyć nową interpretację.

Dane CATSOUNDS zebrane z Akvelon

Korekta nakazuje aplikacji zastąpienie podstawowego słownictwa nowym dźwiękiem.

darmowe oprogramowanie do produkcji muzyki dla systemu Windows

Na przykład możesz powiedzieć aplikacji, aby dopasowała „Polowanie” do krótkich ćwierkań zamiast długiego skowytu. Ten rodzaj korekty jest bardziej przydatny niż dodawanie wielu dźwięków w celu dopasowania do jednego znaczenia, jak działa rozpoznawanie mowy, co byłoby jak informowanie aplikacji, że długie skowyt i krótkie ćwierkanie Zarówno znaczy „Matka Wezwanie”.

Uczenie maszynowe w aplikacjach do rozpoznawania mowy zwykle opiera się tego typu nadpisywaniu. To tak, jakby próbować nauczyć Siri, że kiedy mówisz „blog technologiczny”, naprawdę masz na myśli „gruszkę”. Ale bardziej elastyczna forma uczenia maszynowego, z której korzysta MeowTalk, może łatwiej poradzić sobie z tą korektą.

Tworzenie nowej interpretacji dodaje znaczenie, które nie było wcześniej zakodowane. Na przykład, jeśli Twój kot ma konkretne wezwanie, gdy chce mieć ulubioną zabawkę, możesz dodać „Chcę moją mysz” jako opcję. Jest to podobne do dodawania słowa do słownika autokorekty.

Związane z: Jak zdefiniować własne słowa autokorekty na Androidzie?

Z biegiem czasu możesz opracować wysoce spersonalizowany profil mowy dla swojego kota. W końcu może być nawet wystarczająco wyrafinowany, aby być przydatnym dla opiekunów zwierząt lub do rozwiązywania problemów behawioralnych. Co więcej, pomaga właścicielom kotów zwracać większą uwagę na swoje zwierzęta.

Werdykt: Czy aplikacje do tłumaczenia Cat działają?

Ostatecznie „tłumaczenie kota” nadal w dużej mierze polega na tym, że użytkownik uczy aplikację, jak mówi ich kot. Prawdopodobnie zawsze tak będzie ze względu na wyjątkową komunikację każdego kota.

Ale fakt, że uczenie maszynowe zaszło tak daleko, że programiści mogą w tym nawet częściowo odnieść sukces, jest niesamowity. Uczenie maszynowe i sztuczna inteligencja rozwijają się z zawrotną prędkością i nie możemy się doczekać, aby zobaczyć, dokąd pójdą dalej.

Udział Udział Ćwierkać E-mail Powiązane tematy
  • Wyjaśnienie technologii
  • Nauka języka
  • Nauczanie maszynowe
O autorze Natalie Stewart(47 opublikowanych artykułów)

Natalie Stewart jest autorką MakeUseOf. Po raz pierwszy zainteresowała się technologią na studiach i rozwinęła pasję do pisania o mediach na uniwersytecie. Natalie koncentruje się na technologii, która jest dostępna i łatwa w użyciu. Uwielbia aplikacje i urządzenia ułatwiające życie codziennym ludziom.

Więcej od Natalie Stewart

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować