Pamiętasz horrory z czasów rozpoznawania mowy w systemie Windows XP? Był to jednak bałagan, jednak wraz z rozwojem sztucznej inteligencji i uczenia maszynowego transkrypcja z mowy na tekst (nie z tekstu na mowę ) stała się bardziej niezawodna i wydajna niż kiedykolwiek. Istnieje wiele aplikacji mowy na tekst, które robią to w czasie rzeczywistym, ale co, jeśli chcesz transkrybować nagranie głosowe na tekst? Zrobiłem listę najlepszych rozwiązań do konwersji nagrań głosowych na tekst na telefonie komórkowym, przeglądarce internetowej i komputerze. Sprawdźmy je.
To test the accuracy of the following software we will use first one minute recording of this YouTube video.
Konwertuj swoje nagrania głosowe na tekst
1. Transkrypcja
Transkrypcja umożliwia transkrypcję nagrań wideo i audio na tekst. Chociaż aplikacja jest bezpłatna, zarabia na czasie transkrypcji co godzinę. W porównaniu z wyższymi opcjami z tej listy, takimi jak Happyscribe, stawki są dość rozsądne i wynoszą zaledwie 4,99 USD. Deweloper nie określa, czy używa interfejsu API zamiany mowy na tekst, takiego jak Google Cloud Input, czy rozwiązania niestandardowego.
Przeczytaj: Najlepsze oprogramowanie TTS dla komputerów Mac
Aplikacja dała wyraźny wynik z brakiem interpunkcji tu i tam. Miał kłopoty tylko ze słowami, które albo były niewyraźne, albo były trochę zniekształcone. Tak czy inaczej, aplikacja nadal wyświetla najbliższe słowo i ocenia samą transkrypcję. Niemniej jednak wydajność jest świetna, wyraźny krok naprzód w porównaniu z darmowymi rozwiązaniami, takimi jak Bear Converter, a przy 4,99 USD za godzinę transkrypcji nie rozbije banku.
Dokładność: 96%
Zainstaluj Transkrypcję ( iOS )
2. Wydra.AI
Wydra to świetna aplikacja do transkrypcji dla studentów i pomaga im w ułatwieniu żmudnego zadania transkrypcji notatek. Nie tylko Studentów, jest równie popularny wśród profesjonalistów, którzy używają go do spisywania protokołów ze spotkań i konferencji. Mimo że jest przeznaczony do transkrypcji w locie, nadal możesz przesłać nagranie głosowe z pamięci lokalnej i dokonać transkrypcji pliku audio. Cała transkrypcja odbywa się w chmurze i otrzymujesz dwa warianty skryptu. Pierwsza wersja robocza to szybka transkrypcja generowana w ciągu kilku sekund i może zawierać błędy, jednak dźwięk jest ponownie przetwarzany w chmurze i znacznie poprawia dokładność transkrypcji. Aplikacja jest bezpłatna i dostępna zarówno na Androida, jak i iOS, możesz transkrybować do 600 minut.
Powiązane: Najlepsze aplikacje OCR na iPhone'a
Podczas moich testów stwierdziłem, że aplikacja jest nadal bardzo dokładna i poprawnie odczytała wszystkie słowa, nadal miała problemy z interpunkcjami. Nie mógł również zidentyfikować żadnych zmian akapitów, ale to nie jest wielka sprawa, ponieważ i tak mogę później edytować skrypt.
Dokładność: 94%
Zainstaluj Otter ( Android | iOS )
3. Happyscribe
Happyscribe to pierwsza opcja online na tej liście. Jest to płatna oferta skierowana bezpośrednio do profesjonalistów, w tym dziennikarzy — a ceny zdecydowanie pokazują, że: plan płacony na bieżąco w Happyscribe kosztuje 12 euro za godzinę. Za takie pieniądze musi być sensowna wypłata. Ma to postać wysoce zaawansowanego algorytmu uczenia maszynowego Happyscribe — używanego do identyfikacji i transkrypcji mowy. Algorytm Happyscribe jest na tyle zaawansowany, że rozpoznaje wielu różnych mówców — przyspiesza proces drugiego przejścia, oferując tryb mapy termicznej, który pokazuje dokładnie, gdzie w transkrypcji zmagał się jego algorytm. Otrzymujesz również szeroką gamę opcji eksportu plików, od dokumentów Word i zwykłych plików tekstowych po pliki SRT ze znacznikami czasu.
Przeczytaj: Najlepsze aplikacje dla samotnych seniorów
Pokazał niesamowite wyniki i poprawnie odczytał prawie wszystkie słowa, wykrył nawet zmiany akapitów, co jest świetne, jeśli w rozmowie bierze udział wielu mówców. Happyscribe oferuje bezpłatną wersję próbną, która daje dostęp do 30 minut transkrypcji. Podsumowując, jeśli szukasz najlepszego w swojej klasie rozwiązania audio-tekstowego online, Happyscribe jest świetną opcją.
Dokładność: 99%
Sprawdź Happyscribe
4. Sonix
Sonix jest bardzo podobny do Happyscribe i jest skierowany do tego samego rodzaju rynku docelowego — użytkowników biznesowych, którzy chcą niezawodnego, opartego na sztucznej inteligencji rozwiązania do transkrypcji, które faktycznie wykona zadanie, choć za ułamek kosztów transkrypcji u ludzi. Ceny Sonix odzwierciedlają to: patrzysz na miesięczną subskrypcję w wysokości 11,25 USD za licencję dla jednego użytkownika oprócz stawki 6,00 USD za godzinę za nagrania. Jeśli chcesz obsłużyć duży wolumen, to czyni go bardziej konkurencyjnym niż Happyscribe, ale ten ostatni wygrywa w przypadku zastosowań o mniejszej objętości. Sonix ma również bezpłatną 30-minutową wersję próbną, ale aby uzyskać do niej dostęp, musisz podać dane karty kredytowej/debetowej. Wypróbowaliśmy to i byliśmy mile zaskoczeni jakością transkrypcji.
Przeczytaj: To najlepsze oprogramowanie do transkrypcji dla komputerów Mac
Podobnie jak w przypadku Hyperscribe, Sonix wykazał się wyjątkowo dobrymi wynikami. Ani jedno słowo nie zostało błędnie przepisane. Inną kwestią, na którą należy zwrócić uwagę, jest to, że Sonix potrzebował znacznie mniej czasu na zakończenie transkrypcji niż Happyscribe.
Dokładność: 97%
Sprawdź Sonix
5. Konwerter plików niedźwiedzia
Profesjonalne oprogramowanie do transkrypcji może być drogie! Nawet jeśli brakuje Ci najlepszej w branży transkrypcji, bezpłatne alternatywy są lepsze, jeśli Twój budżet wynosi zero. Wypróbowaliśmy konwerter Bear jako bezpłatną opcję. Jest to konwerter multimediów, który pozwala na konwersję dowolnego typu pliku na dowolny inny, a nawiasem mówiąc ma konwerter MP3 na TXT , który wykorzystuje silnik rozpoznawania mowy Baidu.
Chociaż rozpoznawanie Baidu nie było doskonałe, poprawnie transkrybowało około 70 procent mowy. Nieźle jak na konwerter multimediów, który nie jest nawet reklamowany jako oprogramowanie do transkrypcji! Pliki audio do transkrypcji są ograniczone do 3 MB. Możesz zmniejszyć rozmiar pliku, ponownie kodując do niższej przepływności, ale może to pogorszyć rozpoznawanie.
Dokładność: 70%
Sprawdź Bear File Converter
6. Sobolsoft MP3 do konwertera tekstu
Sobolsoft ma ponad 1500 aplikacji, a transkrypcja audio to tylko jedna z nich. Konwerter Sobolsoft Speech to Text wymaga nieco więcej konfiguracji niż większość. Aby to działało, potrzebujesz klucza IBM Speech to Text API. Przemówienie Watsona na tekst daje Ci 100 minut transkrypcji za darmo miesięcznie, po czym jest wyceniane według stawki za minutę. Sam Sobolsoft ma darmową wersję i płatną wersję za 19,99 USD. Poza ekranem gderania nie zauważyłem żadnej znaczącej różnicy podczas korzystania z darmowej wersji.
Wyniki testów są oczywiste, gdy na zdjęciu widać Watsona firmy IBM. Jednak wyniki nie były lepsze niż w przypadku niektórych bardziej zaawansowanych aplikacji, takich jak Happyscribe i Otter. Nie rozpoznał żadnych interpunkcji ani zmian akapitów.
Dokładność: 93%
Sprawdź Sobol Mp3 to Text Converter
Słowa zamykające
To były moje typy najlepszych aplikacji do konwersji nagrań głosowych na tekst. Otter i Transscribe to najlepsze rozwiązania dla użytkowników mobilnych. Sonix jest tańszy niż Hyperscribe, jeśli zamierzasz transkrybować więcej. Sobolsoft MP3 to Text jest trochę przestarzały, ale wciąż jest świeży i mocny w kościach. Jakie aplikacje lubisz najbardziej na tej liście lub jeśli masz lepsze rozwiązanie, daj mi znać w komentarzach poniżej?
Przeczytaj: Najlepsze aplikacje Teleprompter na Androida