Śmierć MP3: Krótka historia ulubionego formatu audio na świecie

Niemiecka fundacja, która jest właścicielem patentu na czcigodny „stary” format muzyczny MP3, ogłosiła niedawno, że wygaśnie ich patent. MP3 w latach 90. i na początku XXI wieku otworzyło się na udostępnianie plików audio. Połączenie kompresji danych, rozmiaru pliku i zachowanej jakości dźwięku sprawiło, że format audio zyskał rozgłos po obu stronach argumentu o piractwie.

Nagłówki głoszą „MP3 Is Dead”, ale każdy prawdziwy audiofil wie, że prawdziwa śmierć jest bardzo mało prawdopodobna. Nadszedł jednak czas, aby przyjrzeć się historii znanego na całym świecie formatu audio i tego, co może nadejść w niedalekiej przyszłości.

Jak dokładnie działa MP3?

W zależności od wieku i nadużyć, jakich doświadczyły Twoje uszy, zakres częstotliwości słyszenia mieści się w zakresie od 20 Hz do 20 000 Hz. Co więcej, nasze uszy są najbardziej wrażliwe na częstotliwości dźwięku od 2 kHz do 5 kHz. Nasz słuch jest również ograniczony przez naszą zdolność do filtrowania i przetwarzania sygnałów dźwiękowych po ich nadejściu.

Źródło obrazu: flatvector przez Shutterstock

Maskowanie częstotliwości – klucz do kompresji MP3 – opiera się na niezdolności mózgu do rozróżniania pewnych sygnałów.

Wyobraź sobie, że mamy dwa dźwięki. Mają bardzo zbliżone częstotliwości (np. 200 Hz i 210 Hz), ale są grane z różną głośnością. Słabszy dźwięk jest słyszalny sam z siebie, ale mocniejszy jest rozpoznawalny tylko wtedy, gdy gra się je jednocześnie. Proces pokrywania jednej częstotliwości drugą bliską częstotliwością nazywa się „maskowaniem”. Maskowanie częstotliwości działa skutecznie w górnej i dolnej części widma audio.

Zgrywanie płyty CD

Załóżmy, że zgrywamy płytę CD na Twój komputer. Muzyka na płycie jest próbkowana 44 100 razy na sekundę (44,1 kHz). Próbki mają długość 2 bajtów (1 bajt to 16 bitów). MP3 obsługuje kilka częstotliwości, ale zazwyczaj używa standardu CD 44,1 kHz.

przenieś kontakty z iPhone'a na Androida

Pojedynczy plik MP3 składa się z ramek MP3 zawierających nagłówek i blok danych. Każda ramka zawiera 1152 próbki. Technicznie są to dwie 'granulki' 576 próbek. Próbki są przepuszczane przez filtr, który dalej dzieli dźwięk na określony zestaw 32 zakresów częstotliwości. Algorytm MP3 następnie dzieli te 32 pasma częstotliwości przez współczynnik 18, tworząc 576 jeszcze mniejszych pasm. Każde pasmo zawiera 1/576 zakresu częstotliwości oryginalnej próbki (kiedy rozpoczęliśmy zgrywanie płyty CD na komputer).

Źródło obrazu: Kim Meyrick przez Wikimedia

Na tym etapie działają dwa złożone algorytmy matematyczne: Zmodyfikowana dyskretna transformata kosinusowa (MDCT) i szybkie transformaty Fouriera (FFT). Każdy z nich wykonuje inny proces na rozbitym materiale źródłowym.

FFT analizują każde pasmo częstotliwości pod kątem dźwięków, które można łatwo zamaskować, upewniając się, że maskowanie częstotliwości zachowuje ważne dźwięki w ścieżce.

Próbki są następnie sortowane i przekazywane do MDCT. MDCT zamienia każde pasmo w zestaw wartości widmowych. Wartości widmowe dokładniej odzwierciedlają sposób, w jaki nasz słuch interpretuje dźwięk. Dlatego wiele skompresowanych koderów audio używa wartości widmowych do usuwania danych audio. Gdy informacje spektralne i analiza granulki są kompletne, rozpoczyna się właściwy proces kompresji.

Krótka historia MP3

Pamiętasz swój pierwszy odtwarzacz MP3? Miałem szczęście, że miałem oryginalnego iPoda — dopóki mężczyzna z nożem nie wyrwał go z mojego posiadania. Minidyski i tak były o wiele fajniejsze.

Niezależnie od tego, do czasu, gdy oryginalny iPod gwałtownie eskalował zainteresowanie MP3 (w 2001 r.), format miał już osiem lat. Co więcej, MP3 już robiło furorę w Internecie i innych przenośnych cyfrowych urządzeniach muzycznych.

Skąd pochodzi MP3?

MP3 był m zajadać się P obraz ORAZ eksperci g roup (MPEG), jako część oryginalnego standardu kompresji audio i wideo MPEG-1. MP3 to skrót od MPEG-1 Audio Layer III, zatwierdzony do użytku w 1991 roku i ostatecznie opublikowany w 1993 roku.

Pomysł stojący za MP3 jest całkiem fajny.

Algorytm MP3 wykorzystuje ograniczenia percepcyjne ludzkiego słuchu, zwane maskowaniem słuchu. Maskowanie słuchowe występuje, gdy na percepcję jednego dźwięku wpływa obecność innego. Co więcej, każdy utwór zawiera elementy audio niewyczuwalne dla ogólnego odsłuchu. Manfred R. Schroeder po raz pierwszy zaproponował psychoakustyczny kodek maskujący w 1979 roku. Jednak dopiero po utworzeniu MPEG (jako podkomitetu ISO/IEC) w 1988 roku rozpoczęła się wspólna inicjatywa na rzecz globalnego standardu.

W historii MP3 jest jeszcze jedno ważne nazwisko: Karlheinz Brandenburg. Brandenburg rozpoczął pracę nad cyfrową kompresją muzyki w latach 80., kończąc pracę doktorską w 1989 roku różne tryby kompresji, nad którymi pracował znalazł ograniczenia w obu dostępnych w tamtym czasie technologiach, a także w projektowaniu wczesnych procesów kodowania. Wraz z innymi członkami założycielami MPEG zdał sobie sprawę, że wystarczy tylko nowy system.

Instytut Fraunhofera

W 1990 roku Brandenburgia została adiunktem na Uniwersytecie Erlangen-Norymberga. Kontynuował pracę nad kompresją w Towarzystwie Fraunhofera (ostatecznie dołączył do Fraunhofer 1993).

„Mieliśmy podgrupę audio w ramach grupy filmowej [MPEG]” – wyjaśnił Brandenburg Wywiad NPR . „W końcu wszyscy razem wypracowaliśmy kompromis, który miał różne tryby, tak zwane Warstwa I, Warstwa II, Warstwa III . . . I większość naszych pomysłów trafiła do trybów kompresji w MPEG audio. . . która była najbardziej złożona i dawała najlepszą jakość przy niskich przepływnościach — nazywała się Warstwą III”.

Brandenburg wykorzystał piosenkę „Tom's Diner” Suzanne Vegi do udoskonalenia algorytmu kompresji, słuchając go raz za razem, aby upewnić się, że jego majsterkowanie nie wpłynęło niekorzystnie na nagranie głosu Vegi.

MP3 eksploduje

MP3 leżało w zastoju przez kilka lat po oficjalnym wydaniu, kodek uznano za „zbyt skomplikowany” do powszechnego użytku.

Jednak w 1997 roku wszystko się zmieniło – szybko.

Najpierw „australijski student” kupił profesjonalne oprogramowanie do kodowania l3enc od niemieckiej firmy. Odwrócił oprogramowanie, przekompilował je i przesłał na serwer FTP uniwersytetu w USA za pomocą CZYTAJ plik mówiący: „To jest darmowe dzięki Fraunhoferowi”. Ten mały akt natychmiast zmienił dostęp do kodowania i dekodowania MP3. Nagle włożenie płyty CD do komputera wygenerowało wysokiej jakości dźwięk w niewielkich rozmiarach plików.

Po drugie, Nullsoft wypuścił czcigodny odtwarzacz audio Winamp. Pliki MP3 zgrane z płyty CD można było łatwo odtwarzać na komputerze.

W tym samym czasie Internet rozprzestrzenił się w milionach domów na całym świecie. Miliony dysków twardych wypełniały się plikami MP3 , a format stał się preferowanym formatem udostępniania plików audio dla wczesnych usług udostępniania plików peer-to-peer, takich jak Napster, Gnutella i eDonkey (Gnutella była kolejnym projektem firmy Nullsoft). Muzyczne piractwo było żywe i szerzące się, i było w dużej mierze wspomagane przez popularność MP3.

Odtwarzacze mp3

Kolejnym dobrodziejstwem dla ugruntowanej branży audio były przenośne odtwarzacze MP3. Na początku lat 90. Instytut Fraunhofera próbował bezskutecznie stworzyć odtwarzacz MP3 nadający się do sprzedaży. Na powszechne przyjęcie było po prostu za wcześnie. Potrzebowała wspomnianej wcześniej kombinacji udostępniania plików, rozprzestrzeniania się Internetu i oprogramowania do zgrywania plików, aby nadać rozpęd przenośnym odtwarzaczom MP3.

Południowokoreańska firma Elger Labs wprowadziła na rynek model MPMAN F10 o wartości 250 dolarów, wyposażony w ogromną pamięć 32 MB. To nie była oszałamiająca iskra branży, jaką znamy. To wyróżnienie należy do Diamond Rio PMP300, również wyposażonego w 32 MB.

Sukces Diamond Rio przyciągnął niechcianą uwagę. Amerykańskie Stowarzyszenie Przemysłu Nagraniowego (RIAA) pozwało Diamond Multimedia Systems (producenta) – i przegrało. Jednak RIAA słusznie założyła, że był to początek endemicznego piractwa muzycznego, które trwa do dziś.

Co stało się później, pytasz?

Cóż, mało znane urządzenie o nazwie iPod trafił na rynki, całkowicie legitymizując MP3 jako de facto format audio tamtych czasów, a RIAA rozpoczęła (trwającą) krucjatę przeciwko piratom na całym świecie.

Reszta, jak mówimy, to historia.

Dlaczego wtedy umiera MP3?

Instytut Fraunhofera był właścicielem patentu na MP3. 23 kwietnia 2017 r. ich pozostałe patenty wygasły. Dlatego Fraunhofer nie może już wydawać nowych licencji MP3. Wyjaśniliśmy dokładnie, co dzieje się z tymi „apokaliptycznymi” nagłówkami, a także jak to wpłynie na ciebie.

Chcesz TL; DR? MP3 nie jest martwy i nigdzie się nie wybiera.

Jednym z głównych powodów, dla których Fraunhofer porzucił MP3, był wiek. Nie może już konkurować z nowszymi i bardziej lśniącymi kuzynami kodeków. Ich sugestia? Zamiast tego użyj zaawansowanego kodowania audio (AAC). Przypadkowo Fraunhofer posiada również (w toku) patent na AAC, więc poniżej mamy kilka alternatyw MP3, z których możesz wybierać.

Alternatywy dla MP3

Twoja kolekcja MP3 nie spali się nagle, podobnie jak istniejące kodery i dekodery będą nadal generować pliki MP3. To powiedziawszy, MP3 jest teraz trochę przestarzały. Istnieje kilka darmowe alternatywne formaty audio możesz teraz użyć do przechowywania cyfrowej muzyki.

AAC -- Jak wspomniano powyżej, Advanced Audio Coding jest następcą MP3. Jedynym problemem jest to, że sam format wygląda teraz na trochę przestarzały. Niemniej jednak AAC ogólnie osiąga lepszą wierność dźwięku niż MP3, z podobnymi szybkościami transmisji i rozmiarami plików. AAC to także format stratny.
Ogg Vorbis -- Format Vorbis, powszechnie używany w połączeniu z formatem kontenera Ogg. Jest lepszym, nieco młodszym, otwartym kuzynem MP3. Pomimo, że Ogg oferuje lepszą kompresję, wyższą przepływność i ogólnie lepszą jakość dźwięku, Ogg nigdy nie wystartował w taki sam sposób jak MP3 z powodu braku obsługiwanych urządzeń. Ogg to także format stratny.
FLAC -- Free Lossless Audio Codec to najpopularniejszy format bezstratnego kodeka audio. Czemu? FLAC oferuje dokładną kopię audio materiału źródłowego, o połowę mniejszą od tradycyjnej płyty CD. Dźwięki najbardziej dotknięte przez MP3 (np. gitary, talerze, pogłos itp.) pozostają wyraźne pomimo znacznej kompresji. FLAC to format bezstratny.

MP3 nie umarł

Nie masz się czym martwić. Możesz kontynuować zgrywanie do MP3, a Twoje urządzenia będą nadal odtwarzać Twoją muzykę. Na dłuższą metę warto przynajmniej zbadać nowszy format audio dla swojej kolekcji. Techniki kompresji będą się rozwijać a rozmiary plików dokładnych kopii zmniejszą się.

Dodatkowo warto zastanowić się nad pojemnością pamięci. Kiedy pojawiły się pierwsze przenośne odtwarzacze MP3 z pamięcią 32 MB, było to fajny , ale ewidentnie za mało. Największa pamięć masowa dla iPoda Classic wynosiła 160 GB. To może zostać wpadnięty z niestandardowym uaktualnieniem pamięci do ogromnego 240 GB – ponad 1 000 000 pojedynczych utworów MP3. Chodzi o to, że wraz ze wzrostem rozmiaru pamięci masowej i zmniejszaniem rozmiaru fizycznego możemy zrobić więcej za mniej.

Wreszcie Internet wciąż zmienia sposób, w jaki słuchamy muzyki. Kiedyś piracowałem muzykę, ponieważ nie było mnie stać na płacenie 12-20 dolarów za każdy nowy album, który się ukazał. Teraz mam konto rodzinne Spotify z dostępem do milionów utworów i konto Amazon Prime z milionami innych. Jedyną rzeczą, która mnie ogranicza, jest moje połączenie internetowe, a nawet wtedy obaj mają opcje pobierania offline w formatach wysokiej jakości.

Nie jest tak ważny jak kiedyś, ale MP3 nie jest martwy.

Jaki jest twój preferowany format audio? Czy potrzebujesz ostrej rzeczywistości bezstratnej? Lub ekstremalna kompresja stratnego formatu? Czy Twoje wykorzystanie muzyki zmieniło się od czasu, gdy usługi przesyłania strumieniowego stały się powszechne? Zostaw mi linijkę w komentarzach, a oddzwonię.

Źródło zdjęcia: Ti Santi za pośrednictwem Shutterstock.com

Udział Udział Ćwierkać E-mail Przewodnik dla początkujących dotyczący animacji mowy

Animowanie mowy może być wyzwaniem. Jeśli jesteś gotowy, aby rozpocząć dodawanie dialogu do swojego projektu, podzielimy ten proces za Ciebie.

Czytaj dalej Powiązane tematy

Wyjaśnienie technologii
Zabawa
MP3
Kompresja pliku
Konwerter audio

O autorze Gavin Phillips(945 opublikowanych artykułów)

Gavin jest młodszym redaktorem ds. Windows i technologii Explained, stałym współpracownikiem podcastu Really Useful i regularnym recenzentem produktów. Posiada tytuł licencjata (z wyróżnieniem) współczesnego pisania z praktykami sztuki cyfrowej splądrowanej ze wzgórz Devon, a także ponad dziesięcioletnie doświadczenie zawodowe w pisaniu. Lubi obfite ilości herbaty, gry planszowe i piłkę nożną.

Więcej od Gavina Phillipsa

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować