4 июня 2017

Беседка №320. «Интернет голоса»

Забудьте об «интернете вещей», это — мыльный пузырь.

Большинство современных продуктов, заявленных как устройства IoT, ничем не отличаются от вертикальных М2М продуктов, которыми мы всегда пользовались, они пользуются преимуществами ребрендинга. Об остальных аспектах IoT мечтают венчурные капиталисты и производители, возомнившие себя способными создать рынок потребителей IoT посредством чрезмерного финансирования и поощрения своего эго в порыве технического словоблудия. По мере того, как IoT медленно возвращается к основанию кривой зрелости технологий (Gartner), реальную возможность для дальнейшего развития интернет-устройств нужно искать в другом аспекте, который только зарождается: IoV, Internet of Voice, буквально «интернет голоса».

Проблемой настоящей парадигмы является то, что IoT по большей части собирает информацию и затеем применяет к ней определённые алгоритмы для извлечения необходимой пользы. Это не так просто. Нужно создать устройства, разобраться в том, как их подключить между собой и надеяться на то, что среди собранной информации найдется что-то способное помочь привлечь потенциальных пользователей. Но на это нужно время, необходимое, по крайней мере, для получения критической массы продуктов на рынке. Игнорируемый многими бизнес-планами парадокс Catch 22 заключается в том, что для понимания пригодности и полезности технологии нужно получить необходимую информацию путём выпуска на рынок десятка тысяч устройств. При отсутствии явных преимуществ подобные продукты совершенно не продаются. От производителей носимой электроники до «умных» городов все начинают понимать несостоятельность бизнес-кейса IoT, в частности по причине необходимости наличия у пользователей определенного уровня технической подкованности для первичной установки и настройки устройств.

IoV использует другой принцип. Вместо того, чтобы ожидать от пользователей каких-либо знаний об «интернете вещей», в новой концепции ставятся вопросы и даются ответы. Никаких кнопок, клавиатур, кода, можно просто спросить. Но в этом скрыта возможность контролировать всё, с чем мы взаимодействуем. Это может положить конец нашим романтическим отношениям со смартфонами и стать, наверно, самой большой угрозой для Apple на сегодняшний день. Во многом «интернет голоса» является новейшим шагом на бесконечном пути человеческих изысканий. Человечество на протяжении практически всей своей истории увлечённо задавало вопросы в попытке получить более-менее адекватный ответ, будь то дельфийский оракул или более современные плоды научной фантастики, описанные в HAL или в фильме «Она». Сегодня мы можем наблюдать, как технология упраздняет подобные запросы в пустоту и пользователей это затягивает.

Удивительно, что голос так значительно отставал от видео, учитывая стремление современного общества к гласности и выражению своих мыслей устно. Качество передачи голоса по телефонной линии зачастую не отличалось хорошим качеством. Bluetooth-гарнитуры выполняли важную функцию по освобождению рук водителя во время езды, но для большинства пользователей и получателей звонков от человека с гарнитурой наилучшим результатом становился факт узнавания голоса. Более продвинутая часть рынка усердно работала над улучшением качества голосовой связи, но в общей массе оно было весьма посредственным, а пользователи мирились с этим. Распознавание голоса через гарнитуру представляло из себя довольно неоднозначное занятие, успех которого зависел от случая.

За последние несколько лет значительно изменилось само восприятие голосового управления, пусть не сразу, но оно обрело ограниченный круг сторонников. Перемены начались с Siri — голосового ассистента от Apple, скопированного и дополненного Google Now и Microsoft Cortana. Пользователи стали разговаривать со своими телефонами. В мае прошлого года Сундар Пичаи рассказал о том, что 20% запросов посредством мобильного поискового приложения Google стали осуществляться голосом. Как бы то ни было, лучшим показателем возможностей голосового управления стал запуск Amazon своего помощника Alexa на базе колонки Echo в конце 2014 года.

Появление Alexa обусловило знакомство пользователей с концепцией разговора с интернетом при необходимости что-то узнать, купить или прослушать музыку. Оно стало сигналом больших перемен, упразднив необходимость взаимодействовать с устройством, больше не нужно доставать телефон или нажимать на кнопки, можно просто озвучить запрос. Важность перемен нельзя недооценивать. Некоторым это покажется жутковатым, но задать вопрос это так естественно, что непросто понять, почему же технологии так долго к этому шли. Но причиной этому является комплексный характер распознавания голоса. Для его реализации необходима помощь многих технологических улучшений: надежного быстрого интернета, недорогих и быстрых облачных сервисов и машинного обучения распознаванию голоса для перевода его из чего-то нового в разряд обыденных операций. Сложим их вместе и вот перед нами — зачатки «интернета голоса».

Как только вы начинаете говорить с интернетом, то всё меняется. Amazon, Google и Microsoft постоянно представляют презентации, показывающие естественную эволюцию методов ввода информации пользователями, от клавиатуры до мыши, смартфонов и голосового ввода. Они называют их «интерфейсами общения», обозначая эволюцию интернета от ручного ввода к голосовому.

Почему это важно? Через пять лет при условии развития распознавания голоса с той же скоростью люди могут оглянуться назад и удивиться, зачем же они пользовались клавиатурой. Но у этой эволюции есть другой аспект: люди могут также поразиться тому, зачем они вообще печатали что-то на смартфоне. Если для получения информации необходимо лишь озвучить вопрос, то так немудрено и насовсем отказаться от смартфонов. Amazon может разрушить рынок смартфонов по аналогии с тем, как Apple разрушила рынок обычных сотовых телефонов.

И вот почему. Siri, Cortana и голосовой поиск Google использовались как замена клавиатуре, избавляя нас от необходимости набирать текст. Alexa делает кое-что другое. Для многих помощник стал другом. Как и в обычном разговоре, вам не надо что-то доставать из кармана и нажимать кнопки, вы просто говорите. В интервью изданию New Scientist Дэвид Гилл, директор по управлению Alexa, рассказал, что был удивлен тем, как часто люди пытаются задействовать голосового ассистента в социальном взаимодействии. «Каждое утро тысячи людей желают Alexa доброго утра, полмиллиона признались в любви, 250 000 человек предложили руку и сердце. Можно и пошутить над этим, но самым популярным взаимодействием является «спасибо», что означает желание людей быть вежливыми с технологией».

Нет никакого сомнения в том, что концепция IoV близка пользователям. Сценарии её применения стали гораздо более разнообразными по сравнению с первого применения для заказа товара с Amazon. И это произошло благодаря подходу компании, предоставившей любому желающему возможность добавлять собственные ключевые слова.

Оригинальный материал, автор — Ник Хан

Конечно, точка зрения для нашего рынка не очень актуальная, проникновение IoT сложно назвать успешным, наш пользователь в общей массе пока не понял смысла подключённого к интернету холодильника. Но всему своё время, может, и до нас докатится. Но вопрос в том, что же это будет, «интернет вещей» или всё-таки «интернет голоса»? Мне ближе второй вариант, по крайней мере, он более универсален в плане сценариев использования. Считаете ли вы новый подход чем-то революционным и способным заменить нам смартфоны?

Читайте также

  • Чешир Х

    Это может быть действительно интересно.
    Но самым большим вопросом станет безопасность-ведь идентифицировать придётся по голосу а записать голос проблем не составляет… так что без устройств не обойтись

  • Пол

    Интернет вещей не слишком далеко ушёл от древних жутко дорогих холодильников с сенсорными экранами и веб-камерами на дверце: так же несуразно и, пока, так же бесполезно.

  • Веня

    «Каждое утро тысячи людей желают Alexa доброго утра, полмиллиона признались в любви, 250 000 человек предложили руку и сердце.

    1 120 000 человек рассказывало похабные анекдоты про Путина
    82 000 человек в повседневных разговорах положительно отзывались оба Аль-Каиде
    17 000 человек предлагали взятки чиновникам
    Именно поэтому на моих телефонах не будит никогда никаких помощников, стучащих большому брату о любых моих делах, разговорах и мыслях.

  • bot!

    с этим проще простого, просто сообщение для идентификации должно быть каждый раз уникальным,
    тоесть устройство будет решать и говорить вам, что оно хочет от вас услышать

  • bot!

    как будто кто-то вас спросит)

  • DimaPerets

    Тут уже станет совсем непонятно кто кому служит 😂

  • Konstantin Lipatikhin

    Действительно, интернет голоса выглядит интересно. Но на пути у него две вещи: окружающий шум (в метро не попользуешься) и приватность.

  • Lecron

    Какой в голове у автора бардак. И это, уже по-моему третья переводная статья за месяц, которая хоронит смартфоны.

    Ввод данных — клавиатура, мышь, сенсор, голос.
    Вывод данных — видео, аудио.
    Устройства ввода-вывода — ПК, смартфон и т.д.

    Ну а теперь вопросы. Как метод ввода-вывода данных может «убить» устройство ввода-вывода? И причем тут глобальная сеть ака интернет?

  • Damir

    Очередная бредовая статья. Голосовое взаимодействие заменит смартфон — это как? Автор только погоду да запросы в гугле в смартфоне смотрит? Я лично со смарта потребляю инфо — читаю новости, статьи, смотрю видео. Как это можно заменить? Глупость полнейшая, рубрика скатывается в уг.

  • sergey ivanov

    Как будто вы кому-то нужны)

  • ReadFact

    Да ну бред. В метро шумно, да и что окружающие будут слышать что ты говоришь? Я наоборот отказался от голоса в сети, вообще пусть придумают мысленное управление

  • Иван

    Бред полный, голосовое общение с техникой лишает пользователя приватности.

  • baton

    Та панацея совсем не панацея.
    А вот эта панацея настоящая панацея.

  • BanyGirlNebritus

    Скоро и говорить народу лень станет… придумают контекстное управление жестами, звуками, частично словами….
    Так и представляется:
    раннее утро, деревянное крыльцо деревенского дома, небритый абориген в растянутой майке, семейных труселях в мелкий цветочек и галошах на босу ногу восседает на порожке. Человече апосля вчерашнего ловит утренний дзен, в руке дымиться папироска, утренняя сонная муха ползает по щеке пытаясь найти место куда еще не нагадили ее товарки….Человече не реагирует, не моргая смотрит в туманную даль… рядом с аборигеном лежит смартфон…
    — Эээээх! тяжко вздыхает абориген, левая рука медленно, как будто нехотя, почесывает, то, что обычно принято почесывать с утра на крылечке….
    — С вашего счета списано ***рублей *** копеек! Пиво заказано как вы любите! Доставка через пол часа! Спасибо что воспользовались услугами платежной системы ****! — радостно отзывается смартфон…
    — Ллллляяя! протяжно произносит абориген и смачно сплевывает в лопухи….
    — Баланс вашего счета **** рублей **** копеек, в пересчете на пиво ***** литров с доставкой! — отзывается смартфон ))))….

  • Shapic

    Какое то сравнение доброго с фиолетовым. Причем автора совершенно не смущает, что Echo, кнопки от амазон и прочее — самые ярые представители IoT как такового.

  • off_fy

    Очередной бред, вопрос конфиденциальности никак не решается IoV, поэтому клава никогда не уйдет пока не изобретут IoM (mind)

  • Андрей Клепинин

    пока читал поймал себя на мысли, что если из статьи убрать знаки препинания и заглавные буквы, оставив только пробелы между словами то получим бессмысленную последовательность букв, сгенерированную зависшим компьютером, который изрыгает буквенный поток и не может остановиться ))

  • Рыж

    Если в час в пик в метро все люди будут надиктовывать смартфонам. Это будет похоже на дурдом.

  • Lecron

    Натолкнули на мысль. Если создадут гарнитуры работащие по принципу ларингофона, а люди научаться «говорить» не издавая звуков (слышал, что такое возможно), то у идеи появится смысл.

  • cisco2950

    Вы имеете право хранить молчание. Все, что вы скажете, может и будет использовано против вас. (С)

  • romanlt

    IoT пока не нашел широкого применения в быту.
    Но на производстве сейчас это рассматривается как следующий революционный шаг АСУТП. На низовом уровне — в цехе.

  • romanlt

    Ларингофон снимает произносимый звук с поверхности кожи гортани. Если звук не издаётся — в ларингофоне тишина.

  • romanlt

    У меня ощущение бреда возникло и со знаками препинания.

  • Сергей Лагуткин

    Это просто литературно необработанный перевод. Текст русский, а построение фраз английское