NukeBoards

Wszystko czyli nic - Dragon Naturally Speaking

kamiledi15 - 19-11-2005, 20:43
: Temat postu: Dragon Naturally Speaking
Pewnie każdy słyszał o syntezatorach mowy, które czytają to, co piszemy. Ale czy ktoś słyszał o antysyntezatorze, programie, który działa zupełnie odwrotnie? :shock:
Otóż program ten przerabia nasz głos na tekst. My gadamy przez mikrofon, a on pisze w notatniku, co chcemy, można też za jego pomocą częściowo sterować komputerem (w grach nie bardzo, ale w większości programów jak najbardziej). Wybieramy, ktore okno ma zaznaczyć, skopiować, jaki plik otworzyć itd. Wystarczy, że dopowiemy polecenie, np click edit, click select all, close program itd. Możliwości jest wiele. Strona programu (po angielsku): http://speechwiki.org/SR/...lySpeaking.html
Ale nie po to założyłem ten temat. Mam film anglojęzyczny, do którego nie ma napisów. Przekopałem się przez internet wielorotnie i nic nie znalazłem. A muszę mieć napisy, żeby lepiej go zrozumieć. Czy taki antysyntezator mowy mógłby mi napisać tekst z filmu? Puściłbym mu film, a on by mi wszystkie teksty postaci zapisał w notatniku, a ja bym sobie to przetłumaczył (z tekstu się bez porównania łatwiej tłumaczy, niż ze słuchu). Zapewne musiałbym wyciągnąć ścieżkę dźwiękową z filmu, a potem po kolej śceżki z głosami postaci, ale czy to w ogóle jest możliwe? Szukałem w necie, ale chyba nikt nie próbował czegoś trakiego. Proszę o pomoc, bo mam ochotę załatwić sobie ten program. Jest jeszcze inna metoda: nagrać dźwięk na magnetofon z komputera, potem puścić go z magnetofonu przez komputerowy mikrofon. Tylko, że ja nie mam mirofonu :cry: Proszę o szybką pomoc, nigdzie nie znalazłem żadnej wzmianki na ten temat.
Minty - 19-11-2005, 21:17
:
Raczej wątpię, by taki program do rozpoznawania mowy mógłby spisać dialogi z filmu, np. nie wyrobiłby na scenach, gdzie aktorzy krzyczą, szepczą lub są czymś zagłuszani. Człowiek to rozpozna, program- chyba nie.
Podaj tytuł filmu :)
Tasmpol - 19-11-2005, 21:19
:
Zaciekawił mnie ten program. To w ogóle możliwe? Można to skąś pobrać?
bmatrix - 19-11-2005, 21:44
:
Tasmpol.... w poście wyżej masz link do strony programu a jak tam nie ma to zawsze pozostaje p2p ;) .
kamiledi15 - 20-11-2005, 12:14
:
Na to wygląda, że to możliwe, jest sporo stron o tym programie, są różne wersje językowe. Ja ściągam na emulu angielską, zajmuje 627 mb. Na stronie, którą wam wyżej podałem, można ściągnąć instrukcję pdf. Nie mam mikrofonu, a nic nie napisali o wykorzystaniu innych źródeł dźwięku, np. od razu z kompa. Pewnie odgłosy otoczenia będą przeszkadzać, dlatego pewnie trzeba będzie poszukać jeszcze innego programu, który wyciągnie ścieżkę dźwiękową z samymi głosami postaci. Pomyliłem się, to nie film, tylko serial, właściwie kreskówka :oops: Nie myślcie, że jestem jakiś dziecinny, to jedyna kreskówka, jaką mam i nie będę ściągał innych, ściągnąłem ją ze względu na grę, ale sam serial też jest fajny, a nazywa się Earthworm Jim. 23 odcinki. Do 2 odcinków znalazłem angielskie scenariusze i przetłumaczyłem, jeden anglik zgodził się robić napisy do innych, ale robi to tak wolno, że zajmie mu to chyba parę lat. KIlka fanów serialu robi to prywatnie, ale to strasznie długo trwa. Dlatego muszę sam zrobić napisy.
PoW - 20-11-2005, 15:49
:
Kamiledi15 - jeśli da się z mikrofonu to da się też prosto z kompa, wystarczy tylko pogrzebać w windosowskich ustawieniach
kamiledi15 - 20-11-2005, 19:21
:
Hmm, ten program najpierw musi się nauczyć rozpoznawać głos użytkownika... Tu macie polską stronę z fajnymi informacjami o programie:
http://www.t-p.com.pl/tps...DragonEsent.php
Ciekawe, czy jest wersja polska? Wyobraźcie sobie, jak szybko by się pisało wypracowania!
Przy okazji, spójrzcie na to:
http://www.telnetpartners....php?id_opisu=7
Inny program, ale jeszcze dziwniejszy od tamtego! Wkładacie zapisaną długopisem kartkę papieru do skanera, a program wam przerabia to na tekst do Worda, nie trzeba tego przepisywać!
k@rgul - 20-11-2005, 19:24
:
Taki chwyt (zamienianie słów na tekst) ma być zastsowany w nowym Samsungu (chodzi o telefon komórkowy oczywiście). Gadamy to słuchawki a ten nam pisze sms....
kamiledi15 - 22-11-2005, 19:02
:
Hurra, program ściągnięty i działa pod Win98 (a wszędzie było napisane, że działa tylko pod XP :x ). Można wybrać ścieżkę dźwiękową prosto z dysku w formacie wav, ale musi mieć co najmniej 15 minut, więc nie mam jak przetestować. Mógłby mi ktoś dać linka, lub chociaż nazwę do jakiegoś programu, służącego do wyciągania ścieżki dźwiękowej z filmu, zapisywania jej jako wav i to 16 bitowy? Bo tylko takie obsługuje. Z góry dzięki.
Minty - 22-11-2005, 19:11
:
Po szybkiej rundzie w Googlu (audio extractor)
http://www.mp3towav.org/Video-to-Audio-Converter/
http://www.aviexpert.com/
kamiledi15 - 23-11-2005, 16:35
:
Hmm, ściągnąłem jeden z tych programów i wyciągnął mi ścieżkę dźwiękową jako wav, ale jak ją otworzyłem w Dragon Naturally Speaking, to mi się pokazało takie coś:
http://www.bilder-hosting.../c134348a45.gif
O co tu chodzi? Co mam zrobić? Jeśli dobrze rozumiem, to zapisało się jako wav, ale nie 16-bitowy.
msg - 23-11-2005, 16:51
:
Tam pisze:

Plik musi być prawidłowym, instniejącym plikiem .WAV. Proszę się upewnić, czy używasz sprzętu audio obsługującego dźwięk od 11025 Hz do 99000 Hz, 16 bitowy monofoniczny.

Albo twój wav nie mieści się w podanych częstotliwościach (daj mu np. 22050 Hz; 16 bit mono), albo masz coś z k. muzyczną. Może plik jest za duży? Jaki on jest długi/ile zajmuje?
kamiledi15 - 23-11-2005, 17:23
:
Hmm, już nieważne, udało mi się ustawić na 12000 khz, teraz mi pokazuje, że ,,adapting new user to the sound of your recorded speech. This may take an hour to complete" :shock: Więc zobaczymy, co się stanie za godzinę :P

[ Dodano: 2005-11-23, 17:33 ]
Hmm... NIe wiem, czy to wypali, z tego co zrozumiałem, to program teraz dostosowuje się do głosu ,,usera", nagranego na dysku, żeby w przyszłości łatwiej się z niego korzystało. Mam nadzieję, że to się uda... Na razie stoi w miejscu, nic się nie dzieje.

[ Dodano: 2005-11-23, 18:31 ]
To działa!!! Tylko, że muszę jeszcze mieć jeden program, który wyciąga ścieżkę z mową ze ścieżki dźwiękowej z dźwiękami otoczenia i mową. Kapujecie, o co chodzi? Mam ścieżkę dźwiękową i muszę z niej wyizolować tylko ścieżkę z mową... Nie wiem, jak to lepiej wytłumaczyć, jest jakiś program do tego? Z góry dzięki. Na razie wyciągnęło mi coś takiego z jednego z odcinków:
I. I. and I knew him who I know I will and he alone rejoined I might hear them to you thing we with a loss of I will well III
Trochę to bez sensu, ale to dlatego, że program próbuje przełożyć na tekst WSZYSTKO, nie tylko mowę, ale też wybuchy, uderzenia itd.
PoW - 23-11-2005, 21:28
:
Może w audiacity udałoby ci się wyciszyć niepotrzebne fragmenty, bo jako tako oddzielic sie tego raczej nie da...tzn. da sie ale to wyższa droga technologia (kumpel interesował sie kiedys tym, ale w drugą stronę - chciał wyciąć wokal z piosenki).
kamiledi15 - 23-11-2005, 23:22
:
Hmm, pomogło, ale teraz mam nowy problem. Sory, że tyle pytań wam zadaję co do programów, ale naprawdę ich szukałem i nie mogę znaleźć, więc jestem wam bardzo wdzięczny za pomoc.
Otóż okazało się, że program musi się dostosować do głosu jednej postaci, jak mu się puści głosy innych, to pisze jakieś badziewia. Teraz potrzebuję programu, który dzieli i skleja plik wav na części. Muszę powycinać fragmenty z głosem jednej postaci i je posklejać, potem następną i tak w kółko. Po prostu program, który podzieli jeden plik wav na kilka mniejszych i taki, który kilka mniejszych sklei w jeden większy. Z góry dzięki, mam nadzieję że już ostatni raz muszę was pytać o takie coś. :oops: