Ocena:
Książka zapewnia szeroki przegląd przetwarzania mowy i sygnałów audio, przydatny jako zadanie do czytania, choć brakuje w niej szczegółowych technik matematycznych.
Zalety:Rozdziały mogą być przydzielane niezależnie bez dezorientowania studentów; dobry przegląd przetwarzania mowy i powiązanych tematów, w tym często pomijanych obszarów, takich jak psychoakustyka i fizjologia ucha.
Wady:Brak szczegółowych technik matematycznych; postrzegana jako zbyt droga w porównaniu do innych, bardziej kompleksowych źródeł.
(na podstawie 3 opinii czytelników)
Speech Audio Signal Processing
Kiedy książka Speech and Audio Signal Processing została opublikowana w 1999 roku, wyróżniała się na tle konkurencji swoim szerokim zakresem i przystępnym, opartym na intuicji stylem. Książka ta była skierowana do indywidualnych studentów i inżynierów podekscytowanych szerokim zakresem przetwarzania dźwięku i ciekawych zrozumienia dostępnych technik. Od tego czasu, wraz z pojawieniem się iPoda w 2001 roku, dziedzina cyfrowego audio i muzyki eksplodowała, prowadząc do znacznie większego zainteresowania technicznymi aspektami przetwarzania dźwięku.
Drugie wydanie zaktualizuje i poprawi oryginalną książkę, aby wzbogacić ją o nowy materiał opisujący zarówno technologie umożliwiające cyfrową dystrybucję muzyki (przede wszystkim MP3), jak i szereg ekscytujących nowych obszarów badawczych w automatycznym przetwarzaniu treści muzycznych (takich jak automatyczna transkrypcja, podobieństwo muzyki itp. ), Które pojawiły się w ciągu ostatnich pięciu lat, napędzane cyfrową rewolucją muzyczną.
Nowe tematy rozdziałów obejmują
⬤ Psychoakustyczne kodowanie dźwięku, opisujące MP3 i powiązane schematy kodowania dźwięku oparte na psychoakustycznym maskowaniu szumu kwantyzacji.
⬤ Transkrypcja muzyki, w tym automatyczne wyprowadzanie nut, uderzeń i akordów z sygnałów muzycznych.
⬤ Wyszukiwanie informacji o muzyce, koncentrując się przede wszystkim na klasyfikacji gatunkowej opartej na dźwięku, identyfikacji artysty/stylu i szacowaniu podobieństwa.
⬤ Separacja źródeł dźwięku, w tym formowanie wiązki wielu mikrofonów, ślepa separacja źródeł i techniki inspirowane percepcją, zwykle określane jako Computational Auditory SceneAnalysis (CASA).
© Book1 Group - wszelkie prawa zastrzeżone.
Zawartość tej strony nie może być kopiowana ani wykorzystywana w całości lub w części bez pisemnej zgody właściciela.
Ostatnia aktualizacja: 2024.11.13 21:45 (GMT)