Subtitle Edit - program

markocheda

Iskusan
Moderator
Poruka
5.050
Ma ja sam oduševljen njime, da kažem za početak. Čuo sam za njega ranije, ali sam mislio da TI lično pišeš preko njega prevod za neki film ili epizodu serije ili videa generalno, što je verovatno i bilo slučaj ranije...ali SAD, braleee, sad ima automatsko generisanje prevoda. Iz mog kratkog iskustva, sa engleskog videa na engleski prevod, sa novom Whisper opcijom i medium i large modelom, je 99% precizan, problem su reči koje se ne izgovore jasno da se čuju, pa podsećaju na neku drugu, ali je to retkost, pošto sam preveo celu jednu seriju iz osamdesetih, koja nema prevod čak ni na engleski. Medjutim kasnije prevod sa engleskog na srpski, nalaze se greške, to je 10tak procenta u većini slučajeva, mada bolje prevodi od google translate, definitivno, uporedio bih ga sa chat GPT, ali se ne jednači sa njim sigurno.
Koja su vaša iskustva sa ovim programom, i da li ste čuli za njega, ako niste, da li planirate da ga isprobate?
Subtitle Edit 3.6.12 / 3.6.13 Beta Free Download - VideoHelp
 
Već duže vreme se amaterski bavim prevođenjem, i u tu svrhu koristim Subtitle Workshop. On naravno ne pravi titlove na osnovu zvuka niti prevodi sam od sebe. Ali služi svrsi za prevođenje.

Ovaj program deluje dosta interesantno, mada za prevođenje, koliko vidim, i dalje koristi Google Translate. Ali može biti koristan za pravljenje titlova za serije i filmove za koje ih nema.
 
Mnooogo je bolji od Google Translate, to su razlike tako očigledne da je poredjenje smešno :)
Za automatsko generisanje koristi naučene algoritme kao što je "whisper" to je najnoviji, a imaš i starije opcije "vosk" i "kaldi".
 
Poslednja izmena:
Ja sam još pre nekog vremena provukao jedan titl kroz GT, a sad sam isti taj titl provukao kroz Subtitle Edit, sa Whisper algoritmom, i bili su identični. Možda nešto ne radim kako treba?
koji model si koristio na whisper, to jest skinuo? ima tiny, tiny en., base, base en., small, small en, medium, medium en.,large i large v1.
i svi su različiti po kvalitetu.
 
Pardon, ne s Whisper algoritmom, on je za vađenje teksta na osnovu zvuka. Nego sam išao na Auto Translate, a tamo pod Service stoji samo Google Translate V1 API. Pretpostavljam da ne treba tako? Kako treba?

Pogledajte prilog 1323960
to google translate v1 ne možeš da promeniš.
Encoding stavi: 1250 Central European (windows) mada predlažem na croatian, iz nekog razloga je bolje, i latinica je, nisam otkrio kako da srpski stavim na latinicu.
 
Promena enkodinga ne donosi nikakvu promenu u prevodu sa engleskog na srpski; i dalje je isto kao da sam preveo preko GT. Prevod na hrvatski opet ne daje neki naročito bolji kvalitet.

Šta treba da se podesi pa da se dobije bolji kvalitet prevoda?

koji model si koristio na whisper, to jest skinuo? ima tiny, tiny en., base, base en., small, small en, medium, medium en.,large i large v1.
i svi su različiti po kvalitetu.
base.en.
 
Promena enkodinga ne donosi nikakvu promenu u prevodu sa engleskog na srpski; i dalje je isto kao da sam preveo preko GT. Prevod na hrvatski opet ne daje neki naročito bolji kvalitet.

Šta treba da se podesi pa da se dobije bolji kvalitet prevoda?


base.en.
Neće se dobiti savršen. Čak sa engleskog na srpski ili hrvatski zna i da preskoči 10 minuta da ništa ne prevede, mada se ne dešava često.
Ali je bolji od google translate definitivno iz mog ugla. Bolje se snalazi sa zamenicama, ali nije savršen, greške ima.
Base en, nemoj više da koristiš, preskače reči, ne stavlja interpunkcijske znake, nema tačke, zareza, samo redja i preskače reči. Medium en. i large predlažem, to je 99%, retke su greške, ali naćiće se greška.
 
Nisam rekao savršen, rekao sam bolji od GT pošto kažeš da Subtitle Edit može bolje a meni su rezultati isti. Pa pitam šta treba da se podesi da prevede bolje od GT. Sa pravljenjem titla na osnovu zvuka nemam problema, odstupanja su minimalna čak i sa base.en.
 
Nisam rekao savršen, rekao sam bolji od GT pošto kažeš da Subtitle Edit može bolje a meni su rezultati isti. Pa pitam šta treba da se podesi da prevede bolje od GT. Sa pravljenjem titla na osnovu zvuka nemam problema, odstupanja su minimalna čak i sa base.en.
Izgleda se iskustva razlikuju. MOžda je to od titla do titla. Nemam drugo objašnjenje. Po meni GT strašno brka zamenice u poredjenju.
 
Što se tiče prevođenja, i dalje ne kapiram kako da se dobije malo smisleniji prevod od GT. Što se tiče konvertovanja iz ćirilice u latinicu, to nije problem jer imam add-on u Wordu koji to radi.

Ali zato sam poprilično zadivljen kako izvlači titlove na osnovu zvuka. Ako stavim base-en kao model proces će trajati kraće, nekoliko minuta. Ako stavim medium.en, trajaće dosta duže, bar za polovinu duže nego što traje sâm video snimak. A ne vidim neku naročitu razliku u kvalitetu, pa ne znam ima li smisla stavljati taj veći model?

Nekad stavlja znake >> ispred rečenica (koji se lako pobrišu) i neki titlovi dugo traju (kada između dve izgovorene rečenice postoji veća pauza), ali svejedno, i dalje sam impresioniran tačnošću transkribovanja. Sad mogu da napravim titlove za neke serije koje bih gledao a koje nemaju titl (on mi je potreban da bih bolje razumeo, jer strani jezik bolje razumem kada ga čitam nego kada ga slušam).

Vidim da postoje opcije za transkribovanje i sa drugih jezika, ali nažalost još nisu ubacili srpski a ni hrvatski. Valjda će uskoro i oni doći na dnevni red.
 
Što se tiče prevođenja, i dalje ne kapiram kako da se dobije malo smisleniji prevod od GT. Što se tiče konvertovanja iz ćirilice u latinicu, to nije problem jer imam add-on u Wordu koji to radi.

Ali zato sam poprilično zadivljen kako izvlači titlove na osnovu zvuka. Ako stavim base-en kao model proces će trajati kraće, nekoliko minuta. Ako stavim medium.en, trajaće dosta duže, bar za polovinu duže nego što traje sâm video snimak. A ne vidim neku naročitu razliku u kvalitetu, pa ne znam ima li smisla stavljati taj veći model?

Nekad stavlja znake >> ispred rečenica (koji se lako pobrišu) i neki titlovi dugo traju (kada između dve izgovorene rečenice postoji veća pauza), ali svejedno, i dalje sam impresioniran tačnošću transkribovanja. Sad mogu da napravim titlove za neke serije koje bih gledao a koje nemaju titl (on mi je potreban da bih bolje razumeo, jer strani jezik bolje razumem kada ga čitam nego kada ga slušam).

Vidim da postoje opcije za transkribovanje i sa drugih jezika, ali nažalost još nisu ubacili srpski a ni hrvatski. Valjda će uskoro i oni doći na dnevni red.
Ispostavilo se da si u pravu kad si rekao da su Google T. i Subtitle E. identični, samo nisam SADA proveravao, već moje sećanje vuče na raniji GT, koji je bio gori, haha izgleda ga malo poboljšali od trenutka kakvog ga ja pamtim :)
Što se tiče brzine, koliko traje generisanje prevoda na engleski pomoću whisper-a, zavisi od jačine procesora, ako koristiš CPP, šta koristiš, piše u gornjem desnom uglu, možeš da koristiš i Const-me, koji koristi GPU umesto CPU, da bi promenio samo desnim klikom na belu površinu, da izabereš.
Screenshot 2023-04-11 111105.png
Screenshot 2023-04-11 111020.png
 
Ispostavilo se da si u pravu kad si rekao da su Google T. i Subtitle E. identični, samo nisam SADA proveravao, već moje sećanje vuče na raniji GT, koji je bio gori, haha izgleda ga malo poboljšali od trenutka kakvog ga ja pamtim :)
Rekoh ja. :) Provučem titl kroz GT i provučem ga kroz SE, i dobijem isto. Proći će još neko vreme dok mašine ne budu tako dobro prevodile da posle toga čovek unese samo neke minimalne korekcije i da rezultat bude na nivou onog što u celosti prevede čovek.

Što se tiče brzine, koliko traje generisanje prevoda na engleski pomoću whisper-a, zavisi od jačine procesora, ako koristiš CPP, šta koristiš, piše u gornjem desnom uglu, možeš da koristiš i Const-me, koji koristi GPU umesto CPU, da bi promenio samo desnim klikom na belu površinu, da izabereš.
Pogledajte prilog 1324690 Pogledajte prilog 1324693
Pa kao što rekoh, kad stavim taj base.en traje kraće, kad stavim model.en traje duže.

Ovo u gornjem desnom uglu nisam ni primetio. Do sad mi je stajalo CPP. Sad sam stavio na ConstMe i zadao naredbu da napravi titl, koristeći model medium.en, od epizode jedne serije u trajanju od oko 20 minuta. I osetno brže je obavio posao, za nekih pet-šest minuta. :ok: Takođe, kod uvodne špice nije, kao ranije, stavio samo [MUSIC] više puta, već je naveo i tekst pesme. Vrhunski.

Sve u svemu, odličan programčić, koji će nadam se nastaviti da napreduje u pravom smeru pa da uskoro dobijemo i stvarno kvalitetne prevode a i transkripciju s drugih jezika.
 
Ispostavilo se da si u pravu kad si rekao da su Google T. i Subtitle E. identični, samo nisam SADA proveravao, već moje sećanje vuče na raniji GT, koji je bio gori, haha izgleda ga malo poboljšali od trenutka kakvog ga ja pamtim :)
Što se tiče brzine, koliko traje generisanje prevoda na engleski pomoću whisper-a, zavisi od jačine procesora, ako koristiš CPP, šta koristiš, piše u gornjem desnom uglu, možeš da koristiš i Const-me, koji koristi GPU umesto CPU, da bi promenio samo desnim klikom na belu površinu, da izabereš.
Pogledajte prilog 1324690 Pogledajte prilog 1324693
Skoro sve od toga radi na Amazon ili Google Cloudu, tako da…
 
Evo već neko vreme koristim program, i moram reći da je zaista sjajan. Uz njegovu pomoć pravim titlove za serije za koje nema titla na netu, i odlično radi posao, skoro kao ljudski faktor. Kažem skoro jer se desi da negde malo zabrlja s tajmingom ili neku reč preskoči odnosno pogrešno ispiše, ali veliku većinu toga odradi odlično.
 

Back
Top