22 мая 2018
«Yanny or Laurel?» Или как мы слышим
Макс Любин
На днях история с бело-золотым или сине-черным платьем получила свое неожиданное продолжение, но только в виде восприятия звука. На reddit и в Instagram выложили звуковой фрагмент, синтезированный школьниками с помощью веб-словаря. Суть фрагмента в том, что разные люди слышат разные слова, слушая один и тот же файл. «Yanny or Laurel? How a Sound Clip Divided America». Этой заметкой в The New York Times со мной поделился Евгений Вильдяев и попросил прокомментировать, что я об этом думаю.
Анализ записи провели до меня, сняв спектрограмму и выяснив, что слово «Laurel» ярко выражено на низких частотах, тогда как версия слова «Yanny» сильнее всего выделяется на более высоких частотах. Представленный в сети оригинальный аудиоклип представляет собой равнозначную смесь низких и высоких частот.
В The New York Times даже создали инструмент, позволяющий убрать высокие или низкие частоты. И, несмотря на это, многим все равно не удается услышать оба слова.
В этой истории меня заинтересовало другое – почему так происходит? Почему одни люди слышат один вариант слова, в то время как другие будут утверждать, что слышат совсем иное.
Для начала давайте попробуем вспомнить, что же такое слух и как он работает.
Из школьного курса нам известно, что слух – это способность биологических организмов воспринимать звуки органами слуха; специальная функция слухового аппарата, возбуждаемая звуковыми колебаниями окружающей среды, например, воздуха или воды. Одно из биологических дистантных ощущений, называемое также акустическим восприятием. Обеспечивается слуховой сенсорной системой. (Википедия).
Акустические (звуковые) сигналы, представляющие собой колебания разных сред с разной частотой и силой, возбуждают слуховые рецепторы, которые находятся в улитке внутреннего уха. Эти рецепторы активируют первые слуховые нейроны, после чего сенсорная информация передается в слуховую область коры большого мозга.
Есть мнение, что, учитывая несовершенство человеческих органов восприятия, и слуха в частности, слышим мы гораздо меньше, чем нам кажется, и что ощутимый процент акустической информации теряется на пути преобразования в электрический сигнал, и в итоге до мозга доходит лишь часть полученной информации. Почему же мы тогда все равно слышим и понимаем то, что мы слышим? Ученые объясняют это тем, что недостающую часть информации наш мозг достраивает на основе имеющегося базиса знаний, или, простыми словами, придумывает. Это, кстати, объясняет, почему люди продолжают понимать речь даже на поздних стадиях развития заболевания слуха. Речь на родном языке – это самые знакомые звуки для большинства людей, и накопленного багажа знаний мозгу хватает для того, чтобы заполнить и домыслить даже ощутимые потери. Подобное характерно не только для слуха.
Вот вам общеизвестный пример подобной особенности восприятия, только для зрения (спасибо Андрею Подкину за наводку):
«А знаете ли вы что…
По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом.»
Но вернемся к звукам.
Принято считать, что человек способен слышать звук в диапазоне от 16 до 20 000 Гц.
Этот диапазон еще называют слышимым диапазоном. Однако все мы разные, и, как это часто встречается, уровень развития (острота) слуха у разных людей может отличаться.
Кто-то слышит весь этот диапазон и даже чуть-чуть больше, а для кого-то и половина из этих частот является пределом, выше которого их слуховая сенсорная система не сможет уловить.
Именно по этой причине зачастую можно столкнуться с тем, что разные обзорщики и тестировщики аудиотехники дают разные оценки одному и тому же продукту, при этом умудряясь спорить друг с другом, доказывая свою точку зрения. Если рассмотреть этот вопрос с точки зрения разницы слуха у них, то все становится понятно. Непонятно только, почему.
Это может быть обусловлено различными факторами, начиная от врожденных особенностей и заканчивая перенесенными травмами, заболеваниями и их осложнениями, которые повлияли на остроту слуха.
Кроме того, исследования показывают, что на ширину слышимого диапазона могут влиять не только случайные факторы, такие как описанные выше болезни и травмы, но и вполне естественные процессы, такие как банальное, но неизбежное старение. Известно, что с возрастом острота слуха падает, а за остроту как раз и отвечает возможность слышать высокие частоты. Нет, конечно, если убрать верхние частоты, выше 15-20кГц, совсем слышать вы не перестанете, но детализация… Ее почти не будет. Кстати, вы знали, что частоту в 20 кГц слышат только дети? Это так, увы.
Но почему мы начинаем хуже слышать с возрастом?
В улитке находятся жидкость и волосковые слуховые клетки. Вибрации приводят в движение жидкость в улитке. Жидкость приводит в движение волосковые клетки, которые уже преобразуют звуковые колебания в жидкости внутри улитки в электрические сигналы, которые затем передаются слуховым нервом в мозг.
С возрастом у многих людей развивается пресбиакузис – это одна из форм сенсоневральной тугоухости, которая появляется по мере старения человека. Наиболее распространенная форма – сенсорный пресбиакузис. Выражается в деструктивных изменениях волосковых и поддерживающих клеток, что наиболее выражено в основании улитки, где расположены клетки, отвечающие за восприятие высокочастотных звуков. Именно по этой причине с возрастом человек чаще всего начинает хуже слышать высокие частоты.
Возвращаясь к нашим «Yanny» и «Laurel», все становится чуть понятнее. Можно сделать вывод, что люди, слышащие «Yanny», обладают более острым слухом, так как «Yanny» записан в высокочастотном диапазоне. А вот люди, слышащие «Laurel», напротив, имеют не такой острый слух, поэтому для них основными становятся низкие частоты, в которых и записан «Laurel».
Заключение
Таким образом, можно предположить, что вся эта шумиха, якобы поделившая человечество на две части, слышащие разные слова, имеет свое довольно простое рациональное объяснение, не имеющее ничего общего с тем, что мы все разные, уникальные и т.д.. И, вместе с тем, это объяснение, которое напрашивается само собой, может стать немного обидным для тех, кто слышит только «Laurel». Возможно, дело в том, что слышащие только «Laurel» обладают не такой высокой остротой слуха, как те, кто слышит и «Yanny».
Зная всё это, начинаешь лучше понимать причины, по которым возможны подобные «феномены», и учишься относиться к ним с изрядной долей скепсиса.
Ещё бы ученые проверили, правда ли Цой в одной из своих песен поёт «мухожук», просто некоторым слышится «ухожу».
Стоша говнозад, Тихона пальцем…
Скрипка лиса…
А ещё Вуглускр, тот что мышь того, ну это самое)).
Ерунда какая то. У меня профессиональная глухота. На аудиограмме с 12 кгц провал с 13 вообще не слышу. К тому же я давно не молодой человек, почти пожилой. Однако я слышу yanni даже в среднем положении движка и даже немного в сторону laurel все равно слышу yanni. Кто как слышит явно не связано с остротой слуха. Что то тут другое. Не знаю что но точно не слух
У меня ещё интереснее, первое время я слышал только Янни, когда вёл бегунок от Янни к Лорел. А когда вёл бегунок в обратном направлении слышал только Лорел ) Имхо, это с восприятием больше связано чем со слухом. Я концентрируюсь на одном сигнале и отсекаю другой.
Аналогично! Если переводить бегунок от краев к центру, то в центре отчетливо слышишь звук такой, какой был у края. Т.е. если вести бегунок из крайнего правого положения к центру, то в центре слышишь «Йенни» , а если слева к центру, то слышишь в центре слышишь «Лорел». Сам мозг настраивается на определённое звучание и постороннее отсекает. Если просто в центре прослушать без предварительной адаптации, то очень сильно зависит от оборудования и частотных настроек на нём. На динамике телефона в центре слышнее «Йенни» (видимо из-за слабых низов), на простых двухполосных колонках слышнее «Лорел».
речь выше 8 килорерц и не бывает, если мне не изменяет память. а то и ниже раза в два и восьмёрка берётся с запасом
Просто слушают все не на той технике. https://uploads.disquscdn.com/images/c479b9f1b4a2f2f34c57cc0616ba7c13292aa1f02141d48cf6b355c716fb090d.jpg
Слышу и то и другое, точнее звуки напоминающие эти слова.
У меня то же самое. Какая то промежуточная модель…
Ползунок посередине, отчетливо слышу «Yanny», но острым слухом я никогода не обладал, «подделать» результаты у себя в голове не мог, так как статья целиком была прочитана после прослушивания, что я делаю не так?)
Значит вы хорошо слышите верний частотный диапазон, и это ни плохо и не хорошо. Мне тут рассказали историю о том, как будучи школьниками, дети на уроке включали довольно громкий высокочастотный звуковой файл, и следили за реакцией учителя. Так вотю они прекрасно слышали звук, и он был для них очень громким и неприятным. а вот учитель не слышала его вообще.
Просто меня в далеком детсве именно по причине «отстуствия слуха» вместо сольфеджио на самбо отдали и, как я пониямаю, «острота» и «наличие» (обычно имеют ввиду музыкальный) слуха — две разные вещи?
Именно. Налииче музыкального слуха может быть никак не связано с диапазоном слышимых частот) Музыкальный слух, это скорее умение услышать мелодию и затем ее воспроизвести.
Ну и слава Богу, а то сейчас где-нибудь в ансамбле Билана выступал…
это музыкальный слух, а не возможность слышать) музыкантом можно стать когда понимаешь какой звук из двух выше/ниже и когда можешь сказать какие из звуков одинаковой частоты. с тренировкой сможешь сразу и ноту называть.
таким образом можно слышать всё, что угодно, но быть нулевым певцом/музыкантом)
Высокочастотный сигнал, при мощностях доступной им аппаратуры, довольно быстро затухает. А расстояние до слушателей, было явно не одинаково.
Что значит детализация? И многло ли в природе высокочастотных 14+кГц звуков? Просто хочется понять, что же я действительно теряю (могу потерять).
А возможно дело в том, что слышим мы не только ухом, но и мозгом. И тут флуктуаций гораздо больше.
Из собственного опыта. Регулярно говорю жене: «Кажется у тебя телефон звонит». Когда стали разбираться, оказалось, что слышит она лучше меня. В момент вслушивания. Но в «дежурном» режиме, из посторонних шумов вычленяет звонок хуже. И чем шумнее, тем хуже.
Это точно, влияние мозга здесь не учтено в принципе. Сейчас в телефоны встраивают ии в камеры, делать картинку лушче — ну так у нас что зрение, что слух проходит предварительную фильтрацию мозгом, который отсеивает лишнее, дорисовывает нехватающее и тд. Например, мы не обращаем внимания на то, что постоянно видим свой нос. Так же и со слухом, мозг отсеивает лишний шум. Посчитал, что на низких частотах шум — и мы слышим yanny, Отсек верхний ряд — слышим laurel. Это гораздо более интересная тема, насколько отличается мир от того, как мы его чувствуем (и насколько отличается мир для разных людей).
Тема вообще огромная, на самом деле. Получилась бы очень длинная статья, которая бы была не только про Янни и Лорела, так как еще пришлось бы захватывать и освещать почти все стороны жизни и восприятия, и тогда она бы сильно вышла бы за тематические рамки ресурса. В данном случае, постарался максимально ужать и упростить.
Макс, да выходите вы, пожалуйста, за рамки — мы же только рады будем.
На самом деле в природе таких звуков много, и как вы верно подметили, не все из них мы слышим, однако, несмотря на это они влияют на итоговое восприятие. Детализация тут в контектсте общей окраски звука. Без этих частот вы будете слышать звук так, как если бы он был от вас за стеной, например, а не рядом.
Спор без данных, это демагогия. Хотелось бы демонстрационную запись или хотя бы конкретику на словах. И желательно без преувеличений а-ля «за стеной». Пока же, это только имха, на основании «меньше хуже».
Вношу детализацию)
Дело было так, решил я записать себе диск с музыкой в машину. Записал. Послушал. Что-то не то, чего-то не хватает…разобрался, оказывается в грабере диск считал в диапазоне 20-20000Гц, тогда как дорожка была в диапазоне 20-44000Гц, записал так — отличный звук, всё на месте…
ухо может и не слышит, но мозгу чего-то не хватало.
Две поправки. Скорее всего не 20-44000Гц, а дискретизация 44.1кГц; и передискретизацию (32кГц самое то) надо проводить не для музыки, а для звуков природы/города. Вот только где их взять? Нужны очень качественные микрофон и ацп.
Думаю, что если ухо не слышит выше 20000Гц, это не значит, что гитара, флейта или голос человека не выдаёт частоты выше?
Когда стали появляться первые кинотеатры с системой Долби, стали появляться фильмы ужасов с имфранизкими звуками, которые воспроизведились через специальные сабфуверы. Человек их не слышал, но в нужный момент на них подвался этот звук и возникало чувство тревоги и страха. Ещё во время второй мировой войны проводились опыты с аккустическим оружием. Это общеизвестный факт, что инфранизким звуком можно свести человека с ума, остановить сердце, хоть ухо его и не слышит..
С другом я повздорил
как-то раз по пьяни:
нам сказали «Лорел» —
он услышал «Янни»…
Ну ему сначала
я ответил: «Миша!
Там не так звучало!
Ты не то услышал!»
Только вместо «Миша»
он услышал: «пидор».
И «гандон» услышал.
И «козел». И «гнида».
И сказал такое,
и такую фразу,
что пришлось рукою
бить его по глазу.
Мне за это Миша
в ухо двинул вскоре.
И теперь я слышу
«Янни» вместо «Лорел».
за такое и партбилет можно на стол положить..
Я вообще слышу что-то типа Yarry. Получается, что на какой-то частоте у меня провал в восприятии, раз подхватывается звук r , а не n?
Что это за слова? Имена?
В машине вчера утром по радио услышал, явно Лорел — даже ведущие сказали что лорел…
громко музыку не слушаю)
Так ещё зависит от того на чём слушать.
Совершенно верно, попробовал. Сначала запустил на внутриканальных B&O из комплекта LG G6, так Янни мне слышно на втором вправо делении от центра. А вот на Marshall major2 — только на самом правом положении ползунка. На встроенном спикере системника почти как на B&O.
что на хороших наушниках, что на встренных динамиках лаптопа слышу оба имени на середине. хотя сначала слышал только яни. пока не прочитал, что лорел слышно на низких частотах. теперь не могу расслышать оба этих имени)))
про то, что ползунок влияет на звук, узнал лишь потом. сначала я думал, что это вроде голосовалки
В центре изначально енни.
Двигаю ползунок медленно влево и ничего не меняется(в смысле само слово,) до конца, двигаю резко на 2 деления влево и слышу лорел.
Пробую еще раз, двигаю медленно и уже на 1.5 лорел, двигаю обратно на одно деление вправо и слышу енни.
Очередная шумиха из ничего играя с звуком можно много эффектов странных добиться. А вот покажите мне человека который будет говорить одно слово, своим нормальным голосом, а люди вокруг будут слышать разные слова и при этом те кто слышат не то что говорит человек не должны страдать каким либо расстройством, какая нить «слуховая aфазия», скорее всего существует.
С платьем ровно та же история…сидеть блин и обсуждать какой видишь цвет платья совершенно игнорируя как минимум монитор через который ты смотришь на картинку которая снята не понятно на что, возможно уже раз 20 сжатый-пережатый скриншот. В живую такие вещи нужно смотреть. К тому же тот факт что люди по разному видят цвет это мягко говоря не секрет, у меня вон в школе был знакомый дальтоник на один глаз.
Изначально файл был без разделений и без этого инструмента, и вот именно слушая оригинальный файл, без всяких смещений частот (маркер посередине), разные люди слышали разные слова. А возможность покрутить настройки придумали позже, когда начали разбираться.
а ничего, что на одном и том же мониторе в одно и то же время разные люди видят разные цвета? в этом и заключается субъективность восприятия мира. а лорел и яни — это пример ситуации, когда с тобой разговаривают два человека и ты слышишь либо одного, либо другого. либо же можешь настраивать слух на демаскирование нужного собеседника. особенно если ещё и по губам можешь читать, то будет ещё проще
Давайте разбираться: Yanny звучит на высоких частотах, а Laurel — на низких. Подводя итог Макс говорит:
«Возможно, дело в том, что слышащие только «Laurel» обладают не такой высокой остротой слуха, как те, кто слышит и «Yanny».»
Но если вы хорошо слышите высокие частоты, то чтобы чётко услышать Yanny, вы должны плохо слышать низкие частоты. Т.е. слышать частотный диапазон со смещением в сторону высоких частот. И это не показатель более острого слуха.
В большинстве случаев страдают именно высокие частоты, в то время как низкие человек слышит почти всегда.
Ну и как тогда можно чётко услышать янни звучащий на самых высоких, «в то время как низкие человек слышит почти всегда»? Куда девается лорел?
Высокие частоты создают детализацию и окраску звука, а учитывая их более высокую громкость с точки зрения слышимости, могут доминировать над низами.
и опять мы вернулись в область психологии)
В статье оригинале, есть метки на шкале частоты. Якобы проблемные «высокие» частоты, на самом деле лежат ниже 8кГц. Ни разу не слышал, чтобы проблемы начинались так низко. Особенно для такой массы людей среднего и ниже возраста.
Скорее всего копать надо в сторону психоакустики.
это ещё зависит от интенсивности низкочастотного и высокочастотного сигнала. плюс есть такая особенность слуха как демаскирование. это вычленение определённого источника из многих. как, например, когда ты находишься в толпе людей. я вот сначала слышал янни и не понимал кто где мог услышать лорел, но когда прочёл про низкие частоты, то стал легко выделять и лорел. за более выразительным для меня янни
Фиксация 🙂
Остался при своем мнении. И вот почему: несколько человек на работе больше слышат янни (более молодых чём я). Но когда я спросил увеличивают ли они басы при прослушивании музыки, они ответили положительно. Тут на лицо сдвиг частотного диапазона.
Никакого сдвига, только сужение диапазона у тех, кто старше.
Молодёжь слышит и ВЧ, поэтому им для СУБЪЕКТИВНОГО РАВЕНСТВА приходится добавлять басы. Возрастные товарищи ВЧ уже не слышат и для них на общем фоне басы звучат достаточно мощно, субъективно, ведь ВЧ уже нет… Средняя точка слышимого диапазона естественным образом сдвинулась в сторону НЧ, а это субъективно воспринимается как прибавка басов.
Есть ещё вариант — средний между вашим и моим.
Вся аппаратура звучит по-разному. Сменив аппарат человек некоторое время слышит разницу в звучании, а потом привыкает к новому. В-принципе это является показателем того как человек перестраивается под другой частотный диапазон. Тут одновременно и вычленение определенной частоты и сдвиг произошедший в следствии этого.
По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом.»…Круто, однако!!!
ахаха хорошо что я не отношусь к отсталой части человечества и слышу янни
Все-таки, как интересно…Стоит ползунок ровно на середине — слышу Йенни, постепенно сдвигая его в сторону Laurel- слышу Йенни на все более низкой частоте до последнего промежутка между отсечками, там уже Лорел. Начинаю обратно постепенно к середине двигать-слышу Лорел на постепенно все более высокой частоте ровно до первой отсечки после середины, там уже Йенни слышу. Но если не смещать ползунок до того как слышу Йенни, а обратно начинать — то будет Лорел на все более низкой частоте…Вот мозг человеческий до чего хитрый орган…
вот только на телефоне я слышу один звук, на компе — другой. То ли дело в наушниках, то ли в ушах)
Анекдот вспомнился:
— Сынок, не ходи на дискотеку, там очень громкая музыка — слух испортишь.
— Спасибо, мама, я уже поел.