12 ноября 2017

Беседка №163. Об интеллекте в смартфонах, часть 1

Можно ли на самом деле называть наши устройства умными?

Оригинальный материал

Современные технологические компании активно инвестируют в разработку искусственного интеллекта и не зря. ИИ потенциально может развиваться быстрее, чем человеческий интеллект, следовательно – более эффективно находить решения проблем. Пока что это время не пришло. Может пройти несколько десятилетий прежде, чем нам удастся получить элементы искусственного интеллекта, сравнимые с общим интеллектом людей, кхм, некоторых людей. В нашем распоряжении на данный момент имеются лишь базовые модели, выполняющие узкие задачи.

Правило «Если-то»

В течение практически всей «жизни» компьютеров вычисления осуществлялись посредством запрограмированных в компьютер правил. Мы начали с простой математики, затем двинулись дальше. Даже пользовательский интерфейс современного смартфона до сих пор вручную программируется на основе правил. «Если пользователь нажмёт на эту кнопку, то нужно сделать вот это». Это нормально, но умным такой подход не назвать.

Подумайте сами, смартфоны в их сегодняшнем виде глуповаты. Особенно в части дизайна пользовательского интерфейса. Причиной, по которой мы называем их «умными», является возможность установки на них программ. Приложения расширяют функциональность и выводят её за пределы тех функций, с которыми смартфоны поставлялись с завода. На самом деле мы лишь тычем пальцами по кнопкам с цифрами в определённой последовательности, чтобы позвонить на другой номер. Конечно, есть и жесты для сенсорного экрана, такие, как клавиатура с поддержкой непрерывного ввода и пролистывание, но, опять же, это еще пара примеров функций с правилами.

Приложения и мобильные ОС тщательно программируются так, что в итоге получается не очень «умно» и «интеллектуально». Все операционные системы для смартфонов используют жест от края дисплея как основной способ взаимодействия, который не имеет смысла на экранах с диагональю больше 3.8 дюйма. Дизайнеры пользовательских интерфейсов зачастую не справляются с созданием «умных» способов взаимодействия для телефонов. Во многих случаях они опираются на подходы, которые работали в прошлом, но больше не являются актуальными, а если и являются, то для совсем узкой части населения.

Как бы то ни было, мы уже можем увидеть, что на наших устройствах начинает работать «узкий интеллект» или что-то, что создаёт его видимость. «Узкий интеллект» рассматривает один специфический аспект проблемы и пытается решить его посредством серии алгоритмов и доступной информации. Чем больше данных соберёт узкий ИИ, тем точнее будет ответ. Siri, Cortana, Alexa, Google Assistant, Bixby и т.д. являются примером узкого интеллекта. У них есть специфический набор «навыков», в который входят распознавание речи и краткий ответ. Ни один из этих ассистентов на самом деле пока что не способен развиваться или по-настоящему учиться, опираясь на вас как на пользователя. И это несмотря на то, что они собирают данные. Есть некоторые более мелкие аспекты обучения, например, изучение вашего маршрута до работы и возможность заблаговременно предупреждать о пробках или изучение предпочтений в части новостей или чтения электронной почты для уведомления о доставке посылки и т.д.

Голосовой интерфейс

Основанные на голосовом управлении интеллектуальные пользовательские интерфейсы являются самыми интересными для развития будущих методов взаимодействия, т.к. не требуют участия рук или глаз. По крайней мере, если их правильно разработать. На данный момент для работы с большей частью голосовых помощников нужно смотреть в экран и это нарушает опыт. Эти голосовые интерфейсы до сих пор доносят релевантные уведомления до пользователя, лишь сопровождая их невнятным звуковым эффектом. Я могу попросить Siri прочитать мою почту, но не могу попросить прочитать новые сообщения от конкретного пользователя сразу, как только они придут, это было бы более полезно. Для Siri (да и для других ассистентов) даже нет такой опции, чтобы запрограммировать такое правило самостоятельно. Хотя, раньше был способ настроить SMS-уведомление об электронных письмах от отдельных пользователей посредством push-сервиса T-Mobile, а сегодня есть способ сделать подобное при помощи Microsoft Flow и Office 365. Но последний вариант нельзя назвать «интеллектуальным», а SMS читаются вслух только на Windows Phone. Также, зачем мне уведомление об электронном сообщении при помощи другого такого же сообщения?

Всё же, методы прописывания сценариев межсервисных взаимодействий как в Microsoft Flow и IFTTT являются другой формой узкого искусственного интеллекта, в котором вы можете научить ПО выполнять специфические задачи на основе определённых критериев. Проблема в том, что эти сервисы по созданию правил не очень хорошо интегрированы в системное ПО телефонов или в интерфейс любой системы виртуального ассистента. Я не могу сказать «Эй, Cortana, скажи, когда клиент подпишет отправленный мной ему документ», хотя этот простой апплет я бы мог настроить в Microsoft Flow. С Android я могу задать правила для IFTTT, которые превосходят возможности ассистента «Окей, Google» и делают шаг в правильном направлении. Но я всё равно не могу сказать что-то в стиле «Окей, Google, до завтрашнего утра отвечай на все текстовые сообщения, что я занят».

Текстовые интерфейсы

Чат-боты являются ещё одной формой узкого интеллекта, который «живёт» в различных мессенджерах или специализированном ПО. Они схожи с голосовыми ассистентами за тем исключением, что отвечают на базовые команды в рамках интерфейса текстового чата. Иногда они генерируют кнопки, нажатие на которые даст ответ на вопросы от ассистента, это лучше, чем печатать ответ, но всё равно функциональность очень ограничена. Что хуже, у каждого из этих чат-ботов есть набор функций, которых нет у других, и придётся выбирать того, с которым нужно пообщаться с целью решить ту или иную проблему или получить правильный ответ. Поиск правильного агента чат-бота требует излишней когнитивной энергии. Мне на деле нужен один чат-бот, который всё понимает и имеет доступ ко всем моим установленным приложениям и сервисам.

Есть и несколько узких систем искусственного интеллекта, нацеленных на работу с электронной почтой. [email protected] и [email protected] представляют из себя системы AI, которые при получении от вас электронной почты со списком людей последовательно свяжутся с каждым адресатом и индивидуально обсудят, когда всем будет удобно встретиться. Такая система чат-ботов намного умнее, т.к. не нуждается в установке отдельного приложения. Я считаю, что все системные функции Cortana необходимо интегрировать в точку доступа e-mail адреса. На данный момент адрес calendar.help может обработать только запросы на встречу. Cortana недавно была добавлена в Skype как чат-бот, поэтому всё, что ей нужно это телефон, SMS и интерфейс для e-mail.

Все эти узкие формы искусственного интеллекта до сих пор нуждаются в людях, чтобы адаптироваться и изучить специфические команды и фразы, на которые будут «откликаться» эти системы. Будем честны, то же самое справедливо для взаимодействий между людьми.

Интеллектуальные графические интерфейсы

Многие компании начали применять чат-ботов после того, как в каком-то исследовании выяснилось, что чаще всего пользователи пользуются мессенджерами. Это может быть отчасти правдой, но самым часто используемым методом взаимодействия между человеком и компьютером является графический пользовательский интерфейс. Для запуска мессенджера каждый раз нужно нажимать на иконку. Чат-боты и голосовой интерфейс хороши, если вам по душе печатать что-то или по-особенному разговаривать с компьютером, но в графическом интерфейсе есть необходимая вам кнопка, которая постоянно видна и нажатие на неё быстрее и эффективнее. Каковы шансы, что дизайнер приложения сделает его идеально подходящим под нужды пользователя? Вероятность невелика, особенно если вы – продвинутый пользователь. Приложения для смартфонов разработаны так, что вам приходится подстраиваться под них вместо того, чтобы дать им возможность подстроиться под себя. В этом – противоположность интеллектуальной системе.

На заре компьютерных вычислений мы могли сделать это при помощи ручной настройки. Многие программы профессионального уровня для ПК предлагают полностью настраиваемый пользовательский интерфейс. Я могу создавать панели инструментов и ярлыки для клавиш с комбинациями, которые делают мою работу с ПО более эффективной в части решаемых задач. Я могу писать сценарии, которые добавят новые пункты меню и функциональность некоторым программам. Даже профессиональное аппаратное обеспечение, такое, как Wacom Mobile Studio Pro предлагает огромное количество опций кастомизации посредством программируемого тактильного управления. Даже больше того, у каждого пользователя могут быть свои потребности, которые можно решить более эффективно при помощи небольшой кастомизации и небольшого участия человеческого интеллекта.

Сегодня в смартфонах и приложениях для них очень мало настроек кастомизации UI. В iOS вы можете распределить иконки по папкам и заменить фон в лончере, как вариант – добавить виджетов на специальный экран или иконок к центру уведомлений, ну и на этом всё. В Android вы можете установить абсолютно другой лончер для приложений, распределить виджеты на рабочем столе, поменять дизайн иконок, но не получится исправить ужасный интерфейс в Snapchat или изменить ужасные цвета в приложении Gmail. Не выйдет и спрятать мешающие кнопки внутри приложения, которыми вы не пользуетесь, или заменить их на полезные функциональные клавиши. Нельзя создать свои жесты для быстрого выполнения специфических функций в специфических приложениях. Недружелюбно по отношению к продвинутым пользователям и не так персонализировано, как того бы хотелось.

Автор — Адам З. Леин

Если задуматься, то на самом деле смарт-устройствам не хватает своего собственного интеллекта, который мог бы им помочь самостоятельно решать широкий спектр задач. Вопрос ещё в том, будет ли такой прорыв широко востребован у масс, когда телефоны станут умнее «некоторых людей».

Тем не менее, описанные автором сценарии с одной стороны кажутся чем-то из будущего, а с другой — вполне вписываются в концепцию AI / ML. Не хотелось бы ждать несколько десятилетий, конечно. В следующем выпуске — продолжение материала, после которого обсудим тезисы.

Читайте также

13 комментариев на «“Беседка №163. Об интеллекте в смартфонах, часть 1”»

  1. федор емельяненко:

    Прошло уже более 10 лет с появления смартфонов, а искусственный интеллект так и не появился. Зато много разговоров о умных фишках которые при рассмотрении не впечатляют.

    • Максим Перепелица:

      Скайнет будет, не переживайте, мы до этого не доживем 🙂

    • Ziks Ziks:

      Ага. Все умные фишки — результат безумной слежки.

    • Alejandro Valdes:

      А Вы думаете Искусственный интеллект настолько глупый, чтобы рассказать всем, как Лунтик, что он появился до того, как сможет захватить весь мир?

    • Старый танцор:

      А какая связь между смартфонами и ИИ? Я еще сто лет назад обучался на кафедре ИИ и тогда это были максимум экспертные системы, типа того же Сири и т.п.. Серьезный ИИ потребует таких мощностей, которые мы пока не накопили. Нейронные сети, пожалуй, единственный реальный шаг в этом направлении, но он пока больше анонсируется, нежели реально работает

  2. Бог Прошутто:

    >>Если задуматься, то на самом деле смарт-устройствам не хватает своего собственного интеллекта, который мог бы им помочь самостоятельно решать широкий спектр задач.

    Вот уже чего, а этого точно не надо. Смартфон должен делать то, что нужно пользователю, а не то, что хочется. А все попытки превращения инструмента в помошника-дебил, который активно занят выстиланием дороги в ад лишь здорово усложняют использование современной техники.

    • SewAwOw:

      Похоже, ты не до конца понял, что подразумевал автор, когда писал это.
      Не то, чтобы телефон вдруг стал самостоятельно мыслить и делать то, что по его мнению, лучше всего пользователю, а то, чтобы он с помощью ИИ научился лучше взамодействовать с пользователем, быстрее и точнее передавать тому нужную инфу, устранять какие-то неполадки и т.д. Чтобы улучшал user experience, одним словом.

  3. Factum:

    Автор много хочет,слишком

  4. Donkey IAIAIA:

    Про шторку, это он точно написал, подкупает. И в целом, по поводу интерфейсов. Если следовать логике банков, магазинов, операторов, служб такси и еще черт знает кого, у вас на телефоне должны стоять 100500 приложений (ну ладно, просто 100-500), каждое из которых имеет собственную систему авторизации, жестов, меню — то есть абсолютно уникальный UI, на освоение которого требуется время.
    Если же вернуться к вопросам ИИ, то его, похоже, начинают внедрять в обработку фотографий. Не удивлюсь, если скоро мы увидим на месте размазанных лиц и букв, которые сейчас формируют алгоритмы приложений камеры Самсунг, красивые прорисованные лица и четкие буквы, складывающиеся в красивые слова и предложения. Вот только не те, которые были на самом деле. Как по мне, так лучше бы гнали весь мусор с матрицы по-старинке.
    А вот где интеллект действительно не помешает, так это в приложениях с навигацией. Имею к этой теме небольшое отношение, и могу точно сказать, что работы там непочатый край. Начиная хотя бы с необходимости учета ранее проложенных маршрутов, как прогноза загрузки. В идеале, конечно, все водители должны пользоваться одной программой, планировать маршруты заранее и неукоснительно соблюдать рекомендации сервера. Фактически, приходим к автопилоту с централизованным управлением. Проблема в том, что даже если все поставят себе такую программу, грамотного софта для идеального распределения потоков не существует — это как раз задача ИИ. Пока что я езжу быстрее и короче, чем советует Яндекс Навигатор, в 90% случаев. Даже мой, выверенный годами маршрут на работу и варианты объезда пробок он не в силах запомнить и предложить хотя бы мне же.

    • Maxigami:

      так про яндекс писал Эльдар не так давно, что алгоритмы прокладки маршрутов у него сильно страдают нынче.
      подтвердить или опровергнуть не могу — не пользуюсь =)

  5. Alexandr.Noskov:

    Странно, что еще нет рекламных роликов Алиса вс все))) Хотелось бы посмотреть и посмеятся)

  6. Slider:

    Какой интеллект? Даже такие элементарные понятия, как адаптивный интерфейс и повтор действий пользователя нигде не реализован. Например, на ютубе чтобы чтобы перейти к следующему ролику канала, надо его свернуть (два раза), выбрать следующий ролик, развернуть. Почему бы приложению не запомнить, что я предпочитаю смотреть ролики в полном экране, и не разворачивать его автоматом при запуске и не сворачивать при его окончании. И таких мелочей которые можно оптимизировать дофига…