Психоакустика – направление науки, данными которого пользуются многие специалисты: создатели компьютерных программ для обработки аудио, архитекторы, маркетологи, психологи и др. Новые исследования в этой области открывают все более неожиданные свойства звука.
Определение психоакустики
Это научное направление исследует особенности восприятия звука человеком с точки зрения не только физиологии, но и психологии.
Аудиоволны как физическое явление хорошо поняты, изучены и характеризуются всего двумя параметрами:
- частотой;
- интенсивностью.
Это и подобные ему явления изучает психоакустика.
Задачи психоакустики
Ученые решают следующие задачи:
- С помощью экспериментов открывают новые особенности звуковосприятия.
- Находят взаимосвязи между наблюдаемыми эффектами и параметрами аудиоволн, которые можно измерить приборами.
- Разрабатывают способы практического применения полученных данных.
Конечная цель – построение полной картины того, как формируется звуковой образ, и создание функциональной модели, позволяющей предсказывать эффекты при известных параметрах аудиоволн.
Возможности человеческого слуха
Систему, воспринимающую слышимые звуковые сигналы, делят на 2 части:
- Периферическую. Включает в себя весь комплекс органов уха и находящиеся в нем рецепторы.
- Центральную. Сюда относят отделы головного мозга, которые обрабатывают поступающую с рецепторов информацию и отвечают за формирование аудиообраза.
Существует неслышимый человеком инфра- и ультразвук. Он тоже оказывает влияние на организм, но посредством других систем.
Изучением этих явлений занимаются иные научные направления.
Строение уха
Слуховой канал принято делить на 3 зоны:
- Ушную раковину и наружный слуховой проход до мембраны.
- Воздушную камеру между барабанной перепонкой и мембранами окон перепончатого лабиринта.
- Перепончатый канал, заполненный пери- и эндолимфой.
Во второй части находятся 3 костных образования:
- молоточек;
- наковальня;
- стремечко.
Вместе они образуют рычажную систему. Молоточек связан с барабанной перепонкой, так что ее колебания передаются мембране овального окна лабиринта, на который воздействует стремечко.
В спиралевидном канале имеются еще мембраны – Рейснерова и базилярная (базальная). Во второй из-за разности давлений в перилимфе возникают волновые колебания, двигающиеся к вершине лабиринта. Амплитуда поперечных смещений распределена неравномерно.
Положение максимальной точки определяется частотой колебаний: чем она выше, тем экстремум ближе к основанию лабиринта.
К базальной мембране по всей ее площади прикреплены рецепторы – волосковые клетки. Они делятся на 2 группы:
- Внутренние. Выстроены последовательно вдоль пленки. Группа насчитывает 3500 клеток.
- Внешние. Образуют 3 ряда. Группа насчитывает 12000 клеток.
Все внутренние рецепторы контактируют со слуховым нервом. Они преобразуют механические колебания в электрохимический импульс и передают его по слуховому нерву в соответствующие отделы головного мозга.
Пределы слышимости
Пороги слышимости по частоте составляют:
- минимальный – 20 Гц;
- максимальный – 20000 (Гц).
В этом человек существенно уступает некоторым животным. Например, собаки способны слышать звук частотой до 30–40 кГц, а некоторые – до 70. В Латинской Америке это их качество используют для защиты от летучих мышей-вампиров. Собака своевременно предупреждает хозяина об их приближении.
В середине диапазона частотное разрешение, т.е. минимальная ощутимая разница, составляет 2 Гц. Но при одновременном звучании человек способен косвенно распознать и более близкие источники. Возникает т.н. биение – явственно различимые пульсирующие изменения громкости, частота которых равна разнице в тональности обоих колебаний. Этот эффект используют для настройки музыкальных инструментов.
Пороги слышимости по силе звука (громкости):
- минимальный – 0 дБ;
- максимальный (для здорового человека) – 120 (дБ).
При силе свыше 120 дБ источник слышен, но у человека возникают болевые ощущения.
При интенсивности более 80 (дБ) допускается лишь кратковременное воздействие аудиоволн, иначе возможно ухудшение слуха.
Минимальный порог слышимости по громкости зависит от частоты звука. Наибольшую чувствительность человеческое ухо проявляет в отношении сигналов тональностью от 2 до 5 кГц.
Разрешение по громкости в середине диапазона составляет 0,5 дБ при силе звука около 100 (дБ). Если звук тихий, этот параметр увеличивается до 1,5–3 децибел.
Примеры звуков, которые человек в состоянии услышать
Тональность некоторых источников приведена в таблице:
Объект | Частота звука, Гц |
Орган с лабиальными трубами при нажатии на крайнюю педаль | 20 |
Комар | 500–1500 |
Птицы | До 10600 |
Скрип дверных петель | До 16000–20000 |
Звук частотой менее 20 Гц, например издаваемый ветряной турбиной, не слышен и воспринимается только как вибрация.
Громкость некоторых источников (дБ):
- ракеты – 165;
- сирены машины скорой помощи – 125;
- трактора – 105;
- транспортного движения в городе – 85;
- человека во время спокойного разговора – 65;
- дождя – 45.
Кривые равной громкости
В 1933 г. Г. Флетчер и У. Мансон установили, при какой громкости звуки разной частоты воспринимаются как имеющие одинаковую силу. Участники эксперимента надевали наушники.
Полученные данные ученые отобразили в виде графиков.
В 1956 г. Д. Робинсон и Р. Датсон провели более точные измерения, используя в качестве источника фронтальные динамики. Из-за разницы в условиях эксперимента их кривые отличаются от графиков Флетчера и Мансона.
На основании полученных Робинсоном и Датсоном результатов в 1986 г. был создан стандарт ISO 226. В 2003 г. его пересмотрели и изменили с учетом данных, предоставленных 12 международными студиями.
Возрастное влияние на слуховое восприятие
С возрастом функциональные возможности слухового канала снижаются. После 20 лет падает верхний частотный порог – примерно на 1 кГц каждые 10 лет. В результате для большинства пожилых людей самый высокий слышимый тон составляет 16 кГц.
Снижается и чувствительность по громкости, особенно у тех, чья профессия связана с воздействием шума высокой интенсивности: операторов станков, работников металлообрабатывающих цехов и т.п.
Маскирующиеся звуки
При одновременном звучании нескольких источников менее интенсивные сигналы могут исчезать из «поля зрения» мозга. Так, во время разговора шум от проезжающих мимо машин мешает услышать собеседника. Ставший неразличимым звук называют маскирующимся.
Классификация звуков
Различают следующие сочетания заглушающей и маскирующейся аудиоволн:
- каждая – чистый тон, отличаются частотами;
- шум и чистый;
- чистый и речь;
- монотонный шум или импульсные звуки и разговор.
По времени прихода маскировка бывает:
- моноуральной (одновременной);
- временной (неодновременной).
Одновременная маскировка
В этом варианте оба источника звучат совместно. Более интенсивный является заглушающим. Чем ближе частоты источников, тем сильнее проявляется эффект маскировки. Также этому способствует снижение тона маскирующего сигнала.
Временная маскировка
После окончания звучания заглушающего источника второй еще некоторое время остается для мозга неслышимым. Этот период зависит от высоты звука и амплитуды и может достигать 100 мс. Явление называют постмаскировкой.
При некоторых условиях наблюдается и предмаскировка, когда заглушающий источник начинает звучать позже неразличимого. Она объясняется инерционностью работы нервной системы.
Утомление после гиперстимуляции
Это явление состоит в существенном снижении чувствительности после прослушивания громкого звука. Продолжительность периода восстановления может достигать 16 часов.
Постстимульное утомление, еще именуемое временным сдвигом порогов чувствительности, наступает после воздействия звука силой более 75 дБ. И чем выше этот параметр, тем существеннее будут изменения.
На их характер влияет и тон раздражителя. Более высокий сильнее сдвигает пределы чувствительности.
Фантомные звуки в психоакустике
При некоторых условиях человек может слышать несуществующий низкий звук. Это объясняется особенностью базилярной мембраны: иногда под влиянием 2 высокочастотных аудиосигналов в ней дополнительно возникают колебания, соответствующие разности параметров источников.
Использование психоакустики в программном обеспечении и создании музыки
Эффект фантомных звуков используют в аудиосистемах для расширения области воспроизводимых низких частот при невозможности транслировать их напрямую.
Маскировка помогает уменьшить объем аудиофайла за счет исключения звуков, заглушаемых другими. Их выявляет специальный алгоритм. Процесс называют компрессией, или перцептивным кодированием (от англ. perceptual – «относящийся к восприятию»). В результате удается уменьшить размер файла в 10–12 раз.
По этому принципу работают все современные кодеки, например:
- MP3 (MPEG Player 3);
- AAC;
- Ogg Vorbis;
- Musicam (используют в некоторых государствах для цифровой теле- и радиотрансляции);
- ATRAC (нашел применение в формате MiniDisc);
- WMA.
Программа состоит из 3 компонентов:
- Банка фильтров. Разбивает входной сигнал на диапазоны.
- Блока квантования. Разбивает диапазон на конечное число уровней.
- Модели восприятия звука человеком. Анализирует входной сигнал и исключает плохо различимые составляющие.
Полезная литература по теме психоакустики
Более подробно данный вопрос освещен в таких книгах и статьях:
- И. Алдошина, «Основы психоакустики».
- Г. Гельмгольц, «Учение о слуховых ощущениях как физиологическая основа для теории музыки».
- К. Штумпф, «Психология музыкальных восприятий».
Полезно ознакомиться и с лекциями Г. Шулера: Physiological Effects и Psychoacoustics Models.