Jak przekonwertować nagranie głosowe na tekst na komputerze i smartfonie?

Pamiętasz horrory z czasów rozpoznawania mowy w systemie Windows XP? Był to jednak bałagan, jednak wraz z rozwojem sztucznej inteligencji i uczenia maszynowego transkrypcja z mowy na tekst (nie z tekstu na mowę ) stała się bardziej niezawodna i wydajna niż kiedykolwiek. Istnieje wiele aplikacji mowy na tekst, które robią to w czasie rzeczywistym, ale co, jeśli chcesz transkrybować nagranie głosowe na tekst? Zrobiłem listę najlepszych rozwiązań do konwersji nagrań głosowych na tekst na telefonie komórkowym, przeglądarce internetowej i komputerze. Sprawdźmy je.

To test the accuracy of the following software we will use first one minute recording of this YouTube video.

Konwertuj swoje nagrania głosowe na tekst

1. Transkrypcja

Transkrypcja umożliwia transkrypcję nagrań wideo i audio na tekst. Chociaż aplikacja jest bezpłatna, zarabia na czasie transkrypcji co godzinę. W porównaniu z wyższymi opcjami z tej listy, takimi jak Happyscribe, stawki są dość rozsądne i wynoszą zaledwie 4,99 USD. Deweloper nie określa, czy używa interfejsu API zamiany mowy na tekst, takiego jak Google Cloud Input, czy rozwiązania niestandardowego.

Przeczytaj: Najlepsze oprogramowanie TTS dla komputerów Mac

Aplikacja dała wyraźny wynik z brakiem interpunkcji tu i tam. Miał kłopoty tylko ze słowami, które albo były niewyraźne, albo były trochę zniekształcone. Tak czy inaczej, aplikacja nadal wyświetla najbliższe słowo i ocenia samą transkrypcję. Niemniej jednak wydajność jest świetna, wyraźny krok naprzód w porównaniu z darmowymi rozwiązaniami, takimi jak Bear Converter, a przy 4,99 USD za godzinę transkrypcji nie rozbije banku.

Dokładność: 96%

Zainstaluj Transkrypcję ( iOS )

2. Wydra.AI

Wydra to świetna aplikacja do transkrypcji dla studentów i pomaga im w ułatwieniu żmudnego zadania transkrypcji notatek. Nie tylko Studentów, jest równie popularny wśród profesjonalistów, którzy używają go do spisywania protokołów ze spotkań i konferencji. Mimo że jest przeznaczony do transkrypcji w locie, nadal możesz przesłać nagranie głosowe z pamięci lokalnej i dokonać transkrypcji pliku audio. Cała transkrypcja odbywa się w chmurze i otrzymujesz dwa warianty skryptu. Pierwsza wersja robocza to szybka transkrypcja generowana w ciągu kilku sekund i może zawierać błędy, jednak dźwięk jest ponownie przetwarzany w chmurze i znacznie poprawia dokładność transkrypcji. Aplikacja jest bezpłatna i dostępna zarówno na Androida, jak i iOS, możesz transkrybować do 600 minut.

Powiązane: Najlepsze aplikacje OCR na iPhone'a

Podczas moich testów stwierdziłem, że aplikacja jest nadal bardzo dokładna i poprawnie odczytała wszystkie słowa, nadal miała problemy z interpunkcjami. Nie mógł również zidentyfikować żadnych zmian akapitów, ale to nie jest wielka sprawa, ponieważ i tak mogę później edytować skrypt.

Dokładność: 94%

Zainstaluj Otter ( Android | iOS )

3. Happyscribe

Happyscribe to pierwsza opcja online na tej liście. Jest to płatna oferta skierowana bezpośrednio do profesjonalistów, w tym dziennikarzy — a ceny zdecydowanie pokazują, że: plan płacony na bieżąco w Happyscribe kosztuje 12 euro za godzinę. Za takie pieniądze musi być sensowna wypłata. Ma to postać wysoce zaawansowanego algorytmu uczenia maszynowego Happyscribe — używanego do identyfikacji i transkrypcji mowy. Algorytm Happyscribe jest na tyle zaawansowany, że rozpoznaje wielu różnych mówców — przyspiesza proces drugiego przejścia, oferując tryb mapy termicznej, który pokazuje dokładnie, gdzie w transkrypcji zmagał się jego algorytm. Otrzymujesz również szeroką gamę opcji eksportu plików, od dokumentów Word i zwykłych plików tekstowych po pliki SRT ze znacznikami czasu.

Przeczytaj: Najlepsze aplikacje dla samotnych seniorów

Pokazał niesamowite wyniki i poprawnie odczytał prawie wszystkie słowa, wykrył nawet zmiany akapitów, co jest świetne, jeśli w rozmowie bierze udział wielu mówców. Happyscribe oferuje bezpłatną wersję próbną, która daje dostęp do 30 minut transkrypcji. Podsumowując, jeśli szukasz najlepszego w swojej klasie rozwiązania audio-tekstowego online, Happyscribe jest świetną opcją.

Dokładność: 99%

Sprawdź Happyscribe

4. Sonix

Sonix jest bardzo podobny do Happyscribe i jest skierowany do tego samego rodzaju rynku docelowego — użytkowników biznesowych, którzy chcą niezawodnego, opartego na sztucznej inteligencji rozwiązania do transkrypcji, które faktycznie wykona zadanie, choć za ułamek kosztów transkrypcji u ludzi. Ceny Sonix odzwierciedlają to: patrzysz na miesięczną subskrypcję w wysokości 11,25 USD za licencję dla jednego użytkownika oprócz stawki 6,00 USD za godzinę za nagrania. Jeśli chcesz obsłużyć duży wolumen, to czyni go bardziej konkurencyjnym niż Happyscribe, ale ten ostatni wygrywa w przypadku zastosowań o mniejszej objętości. Sonix ma również bezpłatną 30-minutową wersję próbną, ale aby uzyskać do niej dostęp, musisz podać dane karty kredytowej/debetowej. Wypróbowaliśmy to i byliśmy mile zaskoczeni jakością transkrypcji.

Przeczytaj: To najlepsze oprogramowanie do transkrypcji dla komputerów Mac

Podobnie jak w przypadku Hyperscribe, Sonix wykazał się wyjątkowo dobrymi wynikami. Ani jedno słowo nie zostało błędnie przepisane. Inną kwestią, na którą należy zwrócić uwagę, jest to, że Sonix potrzebował znacznie mniej czasu na zakończenie transkrypcji niż Happyscribe.

Dokładność: 97%

Sprawdź Sonix

5. Konwerter plików niedźwiedzia

Profesjonalne oprogramowanie do transkrypcji może być drogie! Nawet jeśli brakuje Ci najlepszej w branży transkrypcji, bezpłatne alternatywy są lepsze, jeśli Twój budżet wynosi zero. Wypróbowaliśmy konwerter Bear jako bezpłatną opcję. Jest to konwerter multimediów, który pozwala na konwersję dowolnego typu pliku na dowolny inny, a nawiasem mówiąc ma konwerter MP3 na TXT , który wykorzystuje silnik rozpoznawania mowy Baidu.

Chociaż rozpoznawanie Baidu nie było doskonałe, poprawnie transkrybowało około 70 procent mowy. Nieźle jak na konwerter multimediów, który nie jest nawet reklamowany jako oprogramowanie do transkrypcji! Pliki audio do transkrypcji są ograniczone do 3 MB. Możesz zmniejszyć rozmiar pliku, ponownie kodując do niższej przepływności, ale może to pogorszyć rozpoznawanie.

Dokładność: 70%

Sprawdź Bear File Converter

6. Sobolsoft MP3 do konwertera tekstu

Sobolsoft ma ponad 1500 aplikacji, a transkrypcja audio to tylko jedna z nich. Konwerter Sobolsoft Speech to Text wymaga nieco więcej konfiguracji niż większość. Aby to działało, potrzebujesz klucza IBM Speech to Text API. Przemówienie Watsona na tekst daje Ci 100 minut transkrypcji za darmo miesięcznie, po czym jest wyceniane według stawki za minutę. Sam Sobolsoft ma darmową wersję i płatną wersję za 19,99 USD. Poza ekranem gderania nie zauważyłem żadnej znaczącej różnicy podczas korzystania z darmowej wersji.

Wyniki testów są oczywiste, gdy na zdjęciu widać Watsona firmy IBM. Jednak wyniki nie były lepsze niż w przypadku niektórych bardziej zaawansowanych aplikacji, takich jak Happyscribe i Otter. Nie rozpoznał żadnych interpunkcji ani zmian akapitów.

Dokładność: 93%

Sprawdź Sobol Mp3 to Text Converter 

Słowa zamykające

To były moje typy najlepszych aplikacji do konwersji nagrań głosowych na tekst. Otter i Transscribe to najlepsze rozwiązania dla użytkowników mobilnych. Sonix jest tańszy niż Hyperscribe, jeśli zamierzasz transkrybować więcej. Sobolsoft MP3 to Text jest trochę przestarzały, ale wciąż jest świeży i mocny w kościach. Jakie aplikacje lubisz najbardziej na tej liście lub jeśli masz lepsze rozwiązanie, daj mi znać w komentarzach poniżej?

Przeczytaj: Najlepsze aplikacje Teleprompter na Androida


5 rozszerzeń Chrome do pobierania filmów z YouTube

5 rozszerzeń Chrome do pobierania filmów z YouTube

Chociaż aplikacja YouTube umożliwia pobieranie filmów do oglądania w trybie offline, nie wszystkie filmy są dostępne do pobrania. Co więcej, film pozostaje w aplikacji YouTube, co oznacza, że ​​nie możesz go udostępniać ani odtwarzać nigdzie indziej.

Co to jest plan Facebooka?

Co to jest plan Facebooka?

Jeśli zastanawiasz się nad możliwościami kariery w brandingu lub marketingu w mediach społecznościowych, Facebook Blueprint może być najlepszym wyborem. Opanowanie umiejętności takich jak marketing, budowanie marki i reklama na platformach społecznościowych może być męczącą pracą.

Co to jest przeglądanie InPrivate w Microsoft Edge?

Co to jest przeglądanie InPrivate w Microsoft Edge?

W dzisiejszych czasach nie możesz zbytnio uważać na swoją prywatność w Internecie, ponieważ podejrzani reklamodawcy i cyberprzestępcy chcą położyć palce na Twoich danych. Jednym ze sposobów na powstrzymanie ich jest przeglądanie w trybie prywatnym. Popularne przeglądarki, takie jak Chrome i Firefox, obsługują przeglądanie prywatne, ale czy wiesz, że Microsoft Edge obsługuje również przeglądanie prywatne?

Jak utworzyć listę obserwowanych akcji w Google Finance

Jak utworzyć listę obserwowanych akcji w Google Finance

Jeśli jesteś ciekawy rynku akcji lub sam jesteś inwestorem, wiesz, jak zmienny może być rynek. Ponieważ większość z nas nie jest doświadczonymi inwestorami giełdowymi, możesz chcieć prostego i wygodnego sposobu śledzenia swoich inwestycji i wiadomości, które na nie wpływają.

Jak skonfigurować i zarządzać funkcją czytania na głos w Microsoft Edge

Jak skonfigurować i zarządzać funkcją czytania na głos w Microsoft Edge

Microsoft Edge jest wyposażony w funkcję o nazwie Czytaj na głos, która umożliwia czytanie artykułów na głos. Dostępna w wielu językach i na wielu platformach funkcja Czytaj na głos pozwala Ci cieszyć się czytaniem w Twoim ulubionym języku i na Twoich ulubionych urządzeniach.

6 najlepszych stron internetowych do nauki SEO

6 najlepszych stron internetowych do nauki SEO

Gdy wszystko jest teraz online, marketing treści stał się kluczowy. Samo posiadanie świetnych treści nie wystarczy, jeśli nie możesz ich poprzeć solidnymi strategiami SEO, gdy coś publikujesz.

7 sklepów internetowych z produktami dla leworęcznych

7 sklepów internetowych z produktami dla leworęcznych

Bycie leworęcznym w świecie praworęcznych ludzi wiąże się z własnym zestawem wyzwań. Od nożyczek i zeszytów po biurka i gitary, osoby leworęczne mają trudności z używaniem codziennych narzędzi.

Do czego służy OnlyFans?

Do czego służy OnlyFans?

Od Facebooka, przez LinkedIn, po Reddit, wydaje się, że co kilka lat pojawia się nowa platforma społecznościowa, która zdominuje uwagę i staje się gwiazdą internetu. Najnowszym pretendentem jest OnlyFans.

Wszystko, co musisz wiedzieć o nowej, ukierunkowanej na prywatność wyszukiwarce Braves

Wszystko, co musisz wiedzieć o nowej, ukierunkowanej na prywatność wyszukiwarce Braves

Brave to przeglądarka open-source oparta na projekcie Chromium, ale w przeciwieństwie do Chrome, które pochłania pamięć RAM, Brave oferuje lepszą wydajność i znacznie szybsze przeglądanie. Brave zyskał sławę jako przeglądarka skoncentrowana na prywatności i anonimowości.

9 najlepszych kursów edycji wideo online

9 najlepszych kursów edycji wideo online

Edycja wideo to sztuka, która łączy materiał wideo, aby opowiedzieć historię. Przy szczytowym zapotrzebowaniu na edytory wideo kursy edycji wideo online mogą pomóc w nauce lub wzmocnieniu umiejętności.