19 ноября 2017

Беседка №164. Об интеллекте в смартфонах, часть 2

О возможных путях развития по-настоящему «умных» устройств…

Оригинальный материал

В бытность Windows Mobile на рубеже веков во многих смартфонах были предусмотрены программируемые на выполнение определённых действий в конкретных приложениях аппаратные клавиши. Я мог настроить моё устройство так, чтобы контролировать воспроизведение в проигрывателе и GPS-навигацию за рулём без необходимости смотреть на экран. Такой подход более эффективен и безопасен, нежели современная концепция контроля посредством сенсорного экрана. В 2009 году Винни Браун и Probex создали полностью переработанную версию интерфейса для HTC Touch Pro 2. В HTC Touch Diamond я мог даже программировать, какая наэкранная клавиатура отображалась в зависимости от того, был ли стилус в своём пазе (ориентированная на сенсорный ввод клавиатура Т9) или нет (распознаватель письма или FITALY). Настраиваемый интерфейс позволяет, по большому счёту, «обучать» устройство работать так, как я хочу, и изменять его таким образом, чтобы мои задачи выполнялись более эффективно. В этом и заключался весь «интеллект» на тот период.

Конечно, мне было необходимо подключать свой интеллект, чтобы понять, какие изменения в ПО/«железе» стоит осуществить для повышения эффективности. В этом аспекте есть потенциал к улучшению: ПО сможет предугадать потребности пользователя, изучая его и оповещая об изменении, которое сможет упростить работу.

У Microsoft примерно в то же время фактически был свой «умный» пользовательский интерфейс, встроенный в Office. «Персонализированные меню» отслеживали более часто используемые команды и со временем делали их более доступными, скрывая менее актуальные элементы меню. Это существенно упрощало комплексный интерфейс таким образом, который напрямую соответствовал потребностям пользователя. Такой подход также увеличил эффективность, сократив количество движений мыши, необходимое для доступа к популярным функциям. Наверно, иногда полезно показать всю комплексность приложения, именно поэтому активация «интеллекта», ответственного за автоперсонализацию, должна всегда быть опциональной функцией. И именно поэтому нам необходимо, чтобы искусственный интеллект изучал предпочтения пользователя.

Персонализированный пользовательский интерфейс более уместен для устройств со сравнительно небольшим дисплеем, например, для смартфонов, где из-за ограниченной площади экрана просто невозможно одновременно видеть все функции. Кнопки «Жирный шрифт», «Наклонный шрифт», «Подчеркивание» и «Цвет шрифта» в мобильном приложении Microsoft Word сильно мешают совершить необходимое мне действие, а именно выбрать название стиля. Никто и никогда больше не должен использовать эти кнопки в приложении Word, более умным и эффективным инструментом для обработки текста являются настраиваемые привязанные стили. В Outlook Mobile кнопки «Удалить», «Назад», «Вперёд» занимают драгоценное место на экране и предназначены для функций, которыми я не пользуюсь. Что мне на самом деле нужно, так это кнопки «Пометить с уведомлением», «Ответить» и «Ответить всем». Может, другие люди и пользуются кнопками «Назад»/«Вперёд». Не знаю, да и мне всё равно. Интерфейс явно неэффективен для меня.

Многие разработчики мобильных приложений создают пользовательские интерфейсы, основываясь на собственных предпочтениях. Это зачастую означает, что в итоге пользователь получает кнопки, иконки и организационную структуру, которые понимает лишь разработчик. Если повезёт, то попадётся несколько приложений, разработанных с расчётом на среднестатистического пользователя и опирающихся на результаты пользовательских тестов, что гораздо лучше, чем разработка без подобной информации, но и гораздо хуже «умного» дизайна, персонализированного под каждого пользователя или пользовательский сценарий. Разработка под среднестатистического пользователя введёт в заблуждение и станет камнем преткновения для начинающих и опытных пользователей, которым нужно более простое или более эффективное решение.

Я обладаю достаточными знаниями, чтобы настроить десктопную версию приложения Outlook с целью уменьшить использование когнитивной энергии путём автоматического цветового кодирования электронных писем и встреч, задействуются конкретные ключевые слова и важность. Я способен запрограммировать аппаратные клавиши на моём оборудовании Wacom, чтобы уменьшить использование энергии мышц и развить мышечную память для конкретных задач. Я также могу изменить быстрые клавиши, чтобы вводить частые команды несколькими пальцами, а не жестами всей руки. К сожалению, ко многим программам, особенно на мобильных платформах, мои знания попросту неприменимы. Я не настолько образован, чтобы программировать собственное ПО или мобильную ОС.

Все приложения должны обязательно иметь единый системный интерфейс для кастомизации, в который должен входить сбор информации. Чтобы при запуске нового приложения запускался интерфейс по умолчанию для среднестатистического пользователя, в котором на кнопках находятся текстовые ярлыки, оперативно объясняющие их предназначение. После определенного количества запусков приложения и сбора информации графический интерфейс должен выдать примерно следующее: «Я заметил, что вы используете определённые функции чаще, чем остальные, хотите, чтобы я сделал популярные элементы более доступными для вас? Вы всегда сможете восстановить настройки по умолчанию или вручную изменить важные для вас функции, нажав Меню > Настроить». Функция «умной» персонализации также позволит уменьшать конкретные иконки, чтобы при желании поместить на экране больше функций.

Проблема с кастомизированными пользовательскими интерфейсами в прошлом заключалась в том, что техподдержка не знала, как настроен GUI, но это всё можно устранить кнопкой «Переключиться на пользовательский интерфейс по умолчанию».

Конечно, «умный» графический пользовательский интерфейс должен полностью интегрироваться с «умным» голосовым интерфейсом и «умным» интерфейсом чата. Если бы все приложения разрабатывались с прицелом на интеграцию с искусственным интеллектом телефона, то я бы мог использовать голосовой интерфейс для того, чтобы сменить тему оформления всей системы. В настоящее время ни одно приложение на iOS или Android не соответствует системным принципам графического оформления интерфейса. Они все разные, с разными цветами и стилями иконок. Отсюда и берётся разномастная чехарда пользовательского опыта. В Windows на ПК есть тема интерфейса. В мобильной Windows приложения «подбирают» оттенки цвета, цвета фона и так далее, но всё это не так отлажено, как того бы хотелось. Даже сама Microsoft не следует этой структуре.

Общий и супер-AI

С другой стороны, если бы мы смогли создать достаточно быстро развивающийся искусственный интеллект, способный достичь общего уровня интеллектуального развития, возможно, нам бы больше не понадобилось взаимодействовать с компьютерами. Термин «общий уровень интеллектуального развития» описывает уровень развития «мыслительной» модели AI, сравнимый с человеческим интеллектом. Я не совсем уверен, о каком человеке идёт речь, уровни интеллекта довольно сильно отличаются, но в теории AI однажды будет ничуть не хуже человека.

Если прогресс будет идти теми же темпами, хоть так будет не со всеми вычислительными системами, то от этого момента нас отделяют лет 20-30. Поэтому я более чем уверен, что нам всё ещё необходимо какое-то время взаимодействовать с узким искусственным интеллектом и модифицировать его. Отсюда вытекает необходимость в более умном графическом, текстовом и голосовом пользовательском интерфейсе.
Эволюция и естественный интеллект были основным способом развития жизни на Земле. Так появился человеческий интеллект, который мог эволюционировать гораздо быстрее. Мы смогли создать вещи, которые никогда бы не были возможны в обычной схеме случайной эволюции, и сделали это очень быстро благодаря способности делиться знаниями. Но мы иногда что-то забываем, это свойственно людям. Мы не знаем, как строить пирамиды. Мы забыли, как отправлять людей на Луну. Мы забыли, как разрабатывать эффективный интерфейс общения человека и компьютера, который не тратит впустую когнитивную и мышечную энергию.

Супер-AI является следующим шагом, он должен повысить эффективность эволюции при условии, что он сможет более точно сохранить знания, но этого не произойдёт, если мы не заложим правильную основу.

В любом случае, не пора ли смартфонам поумнеть и научиться делать нашу жизнь проще? Или нам так и придётся тыкать в хаотично рассыпанные на экране иконки, как мы делали всё это время?

Автор — Адам З. Леин

Читайте также

22 комментария на «“Беседка №164. Об интеллекте в смартфонах, часть 2”»

  1. anonymousses_v5:

    К последней трети статьи начался натурально чистый киберпанк.

  2. Ziks Ziks:

    «… Мы не знаем, как строить пирамиды. Мы забыли, как отправлять людей на Луну. Мы забыли, как разрабатывать эффективный интерфейс общения человека и компьютера, который не тратит впустую когнитивную и мышечную энергию… » — автор Идиот, кем бы он ни был и сколько б не зарабатывал. Надеюсь это не отсебятина переводчика. После такого пассажа нет смысла обсуждать им написанное. Илья, как вы могли вытащить сюда опус этого Неуча.

    • anonymousses_v5:

      Ну, гиперболизация присутствует, но не так уж автор и далёк от истины. Если задуматься что в каждом времени свой божок — когда то и кое где техносовершнество было доведено до фетишизма, а сейчас бал правят эффективные менеджеры и маркетологи… Так что он прав — «забыли».

      P.S.: классический текст: поищите по «инженерная археология»

      • Donkey IAIAIA:

        Меня тут, грешным делом, посещают подобные мысли о современных фреймворках, типа Реакта-Ангуляра и предназначенными для них IDE, конкретно Visual Studio Code. Если так дело пойдет, мы скоро и забудем, что одно время можно было верстать и программировать в режиме WYSIWYG. А уж прямая и обратная совместимость кода и компиляторов вообще будет считаться вселенским злом.

    • О, я до этого места не дочитал 🙂

  3. Zoltan:

    Читал я некоторые научпопулярные книги по проблеме ИИ, в одной из них была любопытная заметка: о том, что «искусственный интеллект будет создан через 20-30 лет», говорят начиная с 1970-х. Построить коммунизм к 1980 году, т.е. через 20 лет, обещал Хрущев. Поэтому когда встречается прогноз о том, что что-то ьудет через 20 лет, это означает, что речь идёт не о научном прогнозе, а о психологической надежде: «еще долго, но я успею дожить»

    • Alexandr.Noskov:

      Коммунизм никак не мог наступить без появления ИИ-роботов, которые бы вкалывали вместо человека. Об этом еще Сыроежкин пел. Нет роборабов — нет коммунизма))
      https://www.youtube.com/watch?v=dtK6BlUezXI

      • ol0lo:

        роботы уже вкалывают, и получше некоторых. (а коммунизьм так и не наступил, а точнее наоборот — наступил капитализьмус)
        давно бывали на автомобильном производстве?
        а уж компании которые производят промышленных роботов — давно в шоколаде.

        • Alexandr.Noskov:

          Ага-ага, особенно Илон Маск, который сейчас внезапно стал нищим из-за использования полностью робототизированного производства. На следующий год сядет в тюрьму, инфа 100%.

      • Pavel:

        Кинематограф убедительно доказывает, что первым делом эти роботы отберут одежду и мотоцикл, а потом постараются оставить человека без жилья и средств к существованию.

  4. V_Alex:

    Максимально кастомизировать интерфейс (т.е настроить под себя) автору мешает разный «цвет и стиль иконок»???
    По-моему какой-то сюр. Автор — олигофрен? Вывод очевиден.

  5. Doc Mezensev:

    Статья перевод гугла? А где же журналистика?
    Любой ИИ мог такую статью перевести и выложить на сайт…)

    • ol0lo:

      тут такое бывает, когда надо что то опубликовать, а качественного контента нет.
      идем на любой профильный зарубежный ресурс, копипасте — правка, и статья «ни о чем» готова!
      таким образом скоро посты в двача будем перечитывать

  6. Mxm Mnk:

    Невозможность создания ИИ убедительно показал наш ученый Владимир Николаевич Катасонов.

    «… Главным препятствием на пути арифметизации и тотального применения числа в науке была проблема континуума: можно ли арифметизировать континуум, непрерывность, можно ли все измерить. Новое время сначала просто предполагало это само собой разумеющимся (как делали изобретатели дифференциально-интегрального исчисления в XVII веке), потом эта проблема обсуждалась всё более бурно, и, наконец, к концу XIX века трудами Дедекинда, Кантора, Вейерштрасса была построена теория действительных чисел. Иррациональные числа тоже стали называться числами. Известный логик XX века У.Квайн называет иррациональные числа мифом. Действительно, многие крупные математики относились с большим подозрением к концепции иррационального числа. Дело в том, что эта концепция использует понятие актуальной бесконечности, но с понятием актуальной бесконечности связано множество апорий, и поэтому именно здесь как раз и разворачивается вся критика, здесь разворачиваются все серьёзные проблемы, связанные с понятием иррационального числа…
    … Современные информационные технологии игнорируют проблему непрерывности, они традиционно пытаются свести все к дискретности. Но то-то и оно, что вопрос «действительно ли мир дискретен?» остается без ответа. Многое же свидетельствует о том, что непрерывность играет не менее важную роль в строении мира, чем и дискретность. Если дискретность выражает оформленность мира, его определенность, то непрерывность выражает всеобщую связь и зависимость в мире. Дискретность и непрерывность как общие диалектические категории важны так же, как форма и материя, мужское и женское. И обе эти категории играют существенную роль и в нашем восприятии мира, и в самой природе знания.

    И самое главное, все эти проблемы – проблема непрерывности, иррационального числа, сознания и связанные с последней проблема свободы, проблема ничто, проблема творения – связаны с понятием актуальной бесконечности. Как только мы пытаемся подобраться к ним научно, в рамках логики или математики, так сразу мы натыкаемся на это существенное препятствие, актуальную бесконечность. Но актуальная бесконечность неалгоритмизируема. Грубо говоря, вычислительная машина не имеет и не может иметь этой идеи, у нее нет правила, чтобы оперировать с ней. Человек не может разом представить и двух десятков предметов, но он имеет идею актуальной бесконечности как идею (не представление). Вычислительная же машина может быстро оперировать огромными числами, но все они – всегда конечны, какими бы большими они ни были, и у нее никогда нет и не может быть идеи бесконечности…»

  7. Donkey IAIAIA:

    Вроде ж была аналогичная статья на днях. Тогда я написал, что ИИ пригодился бы при построении маршрутов в программах навигации. А сейчас припомнил еще одну проблему. Как ни обучай словарь Гугл-клавиатуры (вручную подтверждая корректность ввода), выбрать подходящее слово из трех предложенных удается максимум в половине случаев. А уж правильно просклонять слово, с учетом ранее введенного контекста — вообще непосильная задача.

    • Andrey Padalka:

      а иногда он еще предлагает или автозаменяет на такие слова которые даже не существуют, вот это бесит уже неимоверно, когда торопишься и приходится еще вычитку делать что этот «даун» решил изменить в сообщении. Хочется отключить все эти «мегаумные» помощники и нормально поработать.

      • ol0lo:

        отключил автоподстановкузамену слов еще во времена Т9.
        очень удобно — набираешь именно те слова, которые набираешь. ))
        а кол-во локальных слов, которые «знает» ваше устройство, зависит от размера (мб) словаря (+ в последнее время что то подтягивает из интернета).

        за «новые» слова на «вашем» устройстве, можете благодарить миллионы необразованной школоты с дефолтовой клавиатурой, в попытках обойти системы фильтрации инвективной лексики, коия присутствует почти во всех крупных онлайн системах общения.

    • Даниил Баздырев:

      SwiftKey более менее умеет подбирать слова. Во всяком случае, работает эта клавиатура в разы лучше гугловской

    • Grigorijs Kovjazins:

      Machine Learning уже используется при построение маршрутов. Просто пока это все базовые модели.

  8. «Я обладаю достаточными знаниями, чтобы настроить десктопную версию приложения Outlook с целью уменьшить использование когнитивной энергии путём автоматического цветового кодирования электронных писем и встреч, задействуются конкретные ключевые слова и важность» — к сожалению, я не обладаю такой глубиной интеллекта, чтоб читать и понимать это не запыхавшись.

  9. Grigorijs Kovjazins:

    Статья интересная, но по некоторым направлениям автор не провел достаточное колличество исследований.
    К примеру — на счет когнитивной нагрузки. Общий тренд замены физических объектов на виртуальные в самом деле существует, однако это общий тренд всей индустрии. Если же говорить об удобстве использования и построении интерфейса, то здесь как раз все не стоит на месте.
    К примеру, недавно недавно начался тренд на создание эффективных интерфейсов, которые облегчали бы целевой аудитории взаимодействие с сервисами/приложениями/интернет магазинами. Они строится не на базе Я так хочу/мне так удобно, а на основе статистических данных полученных от целевой аудитории и ранее проведенных UX исследованиях. Особенно явно это просматривается в создании интернет-магазинов, когда оптимизацию интерфейса поднимается конверсия и коэффициент удержания клиента. В UX под это выделен ни один раздел.

  10. Grigorijs Kovjazins:

    По теме — через несколько лет начнется настоящий бум ML/AI. Только после этого можно будет начинать хотя бы прикидывать когда появится AI способный сравнится с человеком и имеющий собственное сознание. Телефоны как раз стали одним из флагманов внедрения AI в решение бытовых задач. Посмотрим, что из этого выйдет.