kvalita mp3 enkoderu (long)

Jaroslav Lukesh lukesh na seznam.cz
Středa Červen 14 15:45:01 CEST 2000


| neustale ctu: tento enkoder je vyborny, ten zase shit, a naopak.

Ano, problematika je velmi subjektivni.

| Zajima me, jestli nekdo nezna nejakou objektivni metodu, jak zjistit
| kvalitu enkodovani 

poslechove testy, nejaka mereni se take delaji. Spise se vsak merenim
objevuji chyby v prehravacich (zvlaste sonique a winamp). Doporucuji
sledovat konferenci vyvojaru LAME [mp3 encoder], mp3encoder na geek.rcc.se.
Prosim, nezatezujte ji podobnymi dotazy, ktere se tam mnozi v posledni dobe
jako houby po desti. Budte radeji konstruktivni.

Pamatujte si, ze zadne mereni nenahradi poslechovy test. Merite s nejakym
definovanym signalem, ale hudebni signal VUBEC neni definovany tak krasne
jako sinusovka nebo SID/TIM merici signaly. A nejake male zvlneni
kmitoctove charakteristiky neni vubec podstatne (srovnejte si to se
zvlnenim celeho reprodukcniho retezce vcetne mistnosti). Vzdycky je kvalita
o prenosu prechodovych signalu, nikoli sinusovek.

Najdete problemovou pasaz, date k dispozici ostatnim, popisete presne nac
se maji soustredit, zkusite jine prehravace i enkodery a take ruzna
nastaveni a teprve pak je to zrale na diskusi o uprave psychoakustickeho
modelu (to u "otevrenych" enkoderu, jako treba LAME nebo go-go coz je
dtto.). U licensovanych enkoderu zbyva jedine - budto ho pouzivat nadale,
nebo ozelet investici a prejit jinam. Kazdy prechod je ale bolestny -
vzdycky najdete neco, co se vam nelibi a pro vasi konkretni aplikaci je to
VELMI podstatne (jako naschval).

| a jaky frekvencni rozsah je treba brat v uvahu pri 
| jejim posuzovani.
| Ja osobne uz 15kHz neslysim (mozna mam nekvalitni HW, nebo sluch,

spis ten HW, pokud zrovna nejste priznivcem diskotek a hlasite hudby. Ja
nekdy slysim 22k sinus, ale z toho slysim sotva 16k. Zalezi to na tom, jak
je clovek v psychicke kondici, na denni dobe, jestli trpi nejakou nemoci a
pod. A taky na reprobednach a zesilovaci, zdroji signalu... Nedoporucuji
sluchatka, protoze jejich kmitoctovy rozsah je meren v pasmu 17dB (to pro
ty super nejkvalitnejsi, cena nad 5000, oznaceni jako referencni) nebo 27dB
(to pro ty obycejne super CD HiFi kvalita a pod). Coz je podstatne hure,
nez u reprobeden, kde je rozsah meren v pasmu 10dB (pokud vyrobce ve svych
technickych podminkach nespecifikuje jinak, pak ale neni Hi-Fi podle normy
DIN 45500).(muze to vsak byt i obracene, naprikald mam zesilovac, u ktereho
vyrobce udava vykon 2x30W, je-li meren podle HiFi, ma 2x50W; anebo bedny -
udava 45-20k, podle HiFi je to 32-26k, ale to je myslim si zcela opacny
pripad - mimochodem tak to delavala i proklinana tesla)

Jinak jsem vyvinul (je to pod GPL, najdete v archivu mp3encoder listu asi
pul roku zpatky) psychoakustickou metodu jak zvysit subjektivne vnimany
kmitoctovy rozsah pri samplerate 22kHz. Rozsah jde zvysit teoreticky na
22khz sirku pasma (tedy jako u 44kHz vzorkovani), prakticky vsak jen
15-16kHz. Samozrejme, 16kHz sinusovku z toho nedostanete, ale hudebni
signal tyto kmitocty jakoby neztrati (tedy... lidske ucho je neztrati).
Udelal jsem si tak nekolik CDcek s hudbou z pasek a desek. Vse je 22kHz
stereo, 64 a vyjimecne 48-56 nebo 80 kbit. Na jedno CD se mi tak vejde
opravdu MNOHO hodin (zhruba pomer 1CD/1den, pokud je tam mono, tak jeste
vice).

| nebo je to normalni?), nekdo jiny treba ano.
| Pri porovnavani ruznych enkoderu jsem narazel na vetsi rozdily az nekde
od
| 14-15kHz, tudiz mi z toho plyne, ze na kvalite enkoderu nezalezi?!

Zalezi, clovek je schopen slyset vysoko nad "magickou" hranici 20kHz,
leckdy se to blizi ke 100kHz. Faktem ale je, ze takhle neuslysite sinusovy
ton, ale pouze kratke impulsni zvuky (uplne stejne je to v basech s
prahovou citlivosti). Fyziologicka krivka vnimani hlaitosti je zalozena na
konstantnim sinusovem signalu, takze je to v podstate jen matouci udaj.
Clovek je schopen slyset treba "radar" od netopyru, ktery piska vysoko nad
20k (faktem ale zustava, ze tam ma sem-tam i nejake slozky pod 20k).

No a treba trubka ma zhruba polovinu energie nad 20k, proto je poslech zive
trubky nesrovnatelny s poslechem na CD, wavetable syntezou ci
amplifikovanem koncertu. Trubka ma totiz onen "prdivy" charakter zvuku, coz
jsou kratke impulsy vysokych kmitoctu, ktere CD neprenese.

Proto taky DVD-Audio ma vzorkovani az na 192kHz a hloubku 24 bitu (pri 192k
ma myslim mensi hloubku, nejsem si jist)

| Jeste dotaz na VBR. Proc nastavovat minimum bitrate? Preci nechci mit
| ticho enkodovane na treba 128kbps, ale na co nejmensi hodnote.

Protoze je tu jev neco jako pre-echo a to nejakou bitrate potrebuje, nebo
bude pri nabehu tonu zvonit, VBR nepouziva bit reservoir (coz v pripade
LAME prelozeneho se safe_vbr neplati). Proto je to takhle. Nicmene LAME umi
jit az na minimum (32kbit) s tim, ze si to dokaze ohlidat (i bez safe_vbr,
pouze vsak hlida digitalni ticho). Nezkoumal jsem jeste freeformat
bitstream, tam to muze jit (snad?) uplne mimo rozsah ISO normy pro MPEG
(jak dolu, tak i nahoru). Faktem ale zustava, ze ne vsechny prehravace
mohou prehrat urcite pasaze takovehoto souboru.

Muj odhad je, ze z LAME se vyvine nejaky uplne novy ztratovy kompresni
system (protoze se narazi kvalitativni naomezeni MP3, ktere uz standardne
odstranit nelze, viz napr freeformat rozsireni), otazkou vsak bude jeho
rousireni, nebot nespada do zadneho svetoveho ekonomickeho systemu alebrz
je OpenSource a GPL. Dalsi detail je, ze hlavni vyvojar je momentalne
placen nejakou utajovanou firmou za dalsi vyvoj LAME.

| R.Pacejka

Zdravi (a prijemny poslech enkodovane hudby preje)


             Jaroslav Lukesh
--------------------------------------------------



Další informace o konferenci Linux