mencoder - velkost vystupneho suboru

Jaroslav Lukesh lukesh na seznam.cz
Čtvrtek Listopad 6 19:52:39 CET 2003


> Odesílatel: Martin 'Megac' Mokry <megac na vupu.sk>
> Chcem mat zvukovu stopu v kvalite 196 kbps, chcem aby to bolo cca 700MB,
> video je dlhe 5000 sekund, aky bitrate na video mam dat aby to vyslo do
> tych 700 MB ...
.... 
> Vypocitane udaje treba dosadit ako parametre pri enkodovani, napriklad
> ja pouzivam nieco ako
> 
> nice -n 5 mencoder -ovc lavc -oac mp3lame -lavcopts
vcodec=mpeg4:vbitrate=950:vhq -lameopts abr:br=196:aq=0 -o vysledok.avi
dvd://1
> 
> pre enkodovanie z dvdcka ;-)

Coz je treba zrovna u zvuku naprosto nesmysl. Potrebujete tam jeste
parametr "-m f" pro zachovani fazovych posunu, dulezitych pro dekodovani
downmixu prostoroveho zvuku v systemu pseudoquadro (ano panove, Dolby Labs
jsou jen obycejne krysy tezici z neznalosti mas a tak pro ne se to jmenuje
velectene "Dolby Surround", pritom uplne ten samy princip je tu uz cca 50
let jen se jmenuje psaudoquadro kvuli tomu ze je jednodussi nez kvadro a ma
nektera omezeni - je to proste jenom "pseudo").

Navic, jelikoz vetsina DVD nema zvuk v MPEG2, ale ve srackovem formatu AC3,
staci k tomu mnohem nizsi bitrate, zvlaste, pouzivate-li metodu ABR.
Poohlednete se spis po tom, co znamenaji parametry s "r3mix" a pouzijte je,
s tim ze _az_za_ne_ date parametr "-m f". Pak vam bude stacit bitrate treba
140 (ano, ABR umi udelat LIBOVOLNY bitrate, treba 127) - to ttam taky
zadejte. A dost mozna ze i mnohem min. 

Stejne MP3 format je srackovy i tak, takze je to v podstate jedno jestli
tam date s lamackym ABR 128, nebo 192. Predstavte si, ze lidske ucho je
schopno vnimat a rozlisovat vsechny prechodove deje delsi nez cca 1ms.
Hadejte, jak dlouho trva nejkratsi prechodovy dej u mp3? 

Tipnete si TED HNED! 
(odpoved ctete dole az pod hvezdickama). No a pak jak ten zvuk ma vypadat,
ze?

--napoveda--
kazdy frame ma 2 granule. Pri prehravani se kvuli omezeni cvrlikani granule
i frame lichobeznikovite (tj. prubeh amplitudy) rozmazava do obou
sousednich (predchozi, nasledujici - pokud v pripade granule existuje). Vse
co je uvnitr granule je casove STATICKE, tedy se NEMENI. Jednotkovy impuls
trvajisi 1 sample o plne amplitude bude tedy energeticky shodny s vystupnim
signalem z nej vzniklym - ovsem uz tento signal nebude trvat jeden sample,
ale mnohem dele a bude mit take mensi amplitudu. To ovsem "nevadi", nebot
spektrum a energie sedi - jenze nesedi doba trvani prechodoveho deje... 

A to je ten zakopany pes.
Hadejte, co uslyite kdyz si takovy jednotkovy impuls vyrobite? Lupanec. Z
mp3 uslysite taky lupanec, ale takovy jak rikam ja, "srackovy".
<shit>
kdyz uz jsme u tech hoven, predstavte si to jako tuhe rovne hovinko a jako
sracku o stejnem zapachu a hmotnosti. Jenze kdyz s tim hodite (posun jako
posun casu vzorku), efekt bude rozdilny :o)
</shit>
--/napoveda--

Nezapomente mit zapnute --nspsytune (pokud nebudete pouzivat r3mix) zmeny
modelu co tam dodal http://shibatch.sourceforge.net/, ale delsi dobu
nesleduji vyvoj, takze jsou tam mozna uz defaultne. Upozornuji, ze
quality=0 je vyhradne experimentalni a vetsinou velmi problemovy, melo by
se pouzivat jako nejlepsi q=2 (default "q=2" byla - uz je to dost dlouho -
posazena az na na q=5, tedy to co bylo driv HQ, je dnes normal), popr. q=1
- ale ta je taky experimentalni a postupem casu to "probublava" ciselne
dolu jak se postupúne odstranuji prpblemy. 

Co se tyce kvality modelu enkoderu LAME, tak pri 128 ABR zacina byt
srovnatelny s referencnim mp3enc31 - neco ma sice trochu horsi, ale ma
mnohem lepsi dynamiku nez ma FhG a od te 128ABR to uz je fakt dost citit.
FhG se tak hodi jen na bitrate <128CBR.

Toz abyste byli v obraze, nebot je mi fakt lito kdyz se plytva materialem z
neznalosti.

JL.

*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Tohle jsem kdysi davno posilal LAME-rum ;-)

So. MP3 is not useable as archive quality at any bitrtate. Because of frame
overlapping, impulse response is distributed over longer time than one
granule, typically two (I am right?).

Regards J. Lukesh

-------
Frank Klemm says:

MP3:	length of granule [ms]
fs	 	block
[kHz] 	   long     short
- -------------------------------------
 8	   72	    24
11	   52.2	    17.4
12	   48	    16
16	   36	    12
22	   26.1	     8.7
24	   24	     8
32	   18	     6
44	   13	     4.3
48	   12	     4

For critical music granules down to 2 ms are useful, but not available in
MP3. 

::  > Listen to castagnets at 32 kHz/320 kbps and at 48 kHz/192 kbps.
::  > The 48 kHz/192 kbps sounds much better. This is a restriction of MP3.
::  
::  ??? What is the basic reason for that ? 

MDCT window size. It is 192 or 576 in samples. This is a little bit too
long
in time for 44.1 and 48 kHz and much too long for 32 kHz. 

AAC uses 128 or 1024, which is nice for most music.

AAC 48 kHz/128:		2,7 ms
AAC 44 kHz/128:		2,9 ms 

---------
"Ivan Dimkovic" <smoke na aac-tech.com> says:

Short window length is 192 samples (this is the most important reason)
With this block length, MP3 has impulse response of  18.6 ms at 48 kHz
sampling rate. Human perceptual system has more advanced psychoacoustic in
time domain (less than 5 ms in some cases). MPEG commitee had chosen
shorter
window length for next generation of coders (AAC, MPEG-4 General Audio,
...)
--------

Segher Boessenkool <segher na wanadoo.nl>  says:
-----
The optimum window size for strong changes is about 128 samples (44 or
48 kHz),
because all pre-echo will be inaudible. The optimum window size for
stationary signals is infinite.

> The AR function inside a granule should be constant within 3...5 dB.
> This can be for >100 ms for music like some parts of "Adagio for
Strings",
> but also 0.8...1.2 ms for synthetic percussion. 

_______________________________________________
mp3encoder mailing list
mp3encoder na minnie.tuhs.org
http://minnie.tuhs.org/mailman/listinfo/mp3encoder



Další informace o konferenci Linux