5 октября 2020
Arm Cortex-X1: В погоне за Apple
Александр Носков
Весь мир Android сплотился под флагами компании Arm, чтобы сокрушить конкурента! Смогут ли?
Продвинутые любители Android-смартфонов уже долгое время наблюдают неприятную картину – смартфоны производства Apple демонстрируют лучшую производительность не только при запуске кроссплатформенных игрушек, но и при выполнении самых типичных задач. Такие мысли могут возникнуть, если смотреть на рейтинги синтетических тестов, где в лидерах по производительности на одно ядро надолго поселились Bionic-и. Чужой опыт и рассказы о скорости работы интерфейса, скорости сетевых подключений (и прочем), является вторым источником информации, который помогает принимать решение о покупке, но всегда ли адекватен этот источник? Всяк кулик своё болото хвалит. Остаются тесты, где для Android-девайсов не все так гладко, как хотелось бы:
Да, производители чипсетов для Android-смартфонов могут оправдывать отставание универсальностью своих платформ и глубокой оптимизацией продукции Apple, но пользователи все равно недовольны. Компания Arm, которая лицензирует мобильные чипсеты, в том числе и Apple (но не доводит их до состояния производственных лекал), долго смотрела на это свысока, не вмешиваясь в процесс. Однако, кажется, Apple действительно очень скоро придется пересматривать свои бюджеты, выделенные на разработку новых чипсетов, в сторону прогрессивного увеличения, ведь Arm весной 2020 года запустила программу «Тачку чипсет на прокачку», в оригинале называющуюся «Cortex-X Custom».
Cortex-X Custom
Любая компания-разработчик никогда не выложит все карты на стол, не расскажет все подробности о грядущих новинках. Есть такая пословица: «Хочешь рассмешить Бога? Расскажи ему о своих планах», и она очень уместна, когда мы говорим о разработке. Однако в 2018 году на симпозиуме в Тайбэе представитель Arm поделился с журналистами своим видением развития, и, похоже, оно соответствует реальности:
Информацию 2018 года подтверждают буквально позавчера слитые в сеть данные о планах Qualcomm до второго квартала следующего года:
На мутной инсайдерской фотографии видно, что помимо новых чипсетов нижнего и среднего звена конца 2020 года (SDM460 и 662) и начала 2021-го (SDM435G и 735G), в первом квартале 2021-го выйдет новый флагман Qualcomm SDM875G. Нет точных данных, но вероятно, что приставка «G» в названиях чипсетов 2021 будет обозначать поддержку 5G. Примечательно, что средние решения Qualcomm 2021 года, также как и флагманы, будут изготавливаться по техпроцессу 5 нм на фабриках Samsung. Однако вернемся к SDM785G, он интересен тем, что основан на одном (или двух) ядре Arm Cortex-X1, двух ядрах Cortex A-78 и нескольких энергоэффективных серии A-50. Таким образом, SDM785G и его версия Plus станут первыми чипсетами, прошедшими через новую мастерскую Arm. Дело в том, что это действительно своего рода мастерская, потому что ядра Cortex-X1 радикально отличаются от тех, которые идут в массовое производство. Начать стоит с того, что до перехода на техпроцесс 5 нм их изготовление было бы неуместно – они занимают на 15% большую площадь типичного ядра Cortex A-77 (7 нм, одно ядро) и требуют серьезной системы охлаждения. Всему виной раздутый процессорный кэш (3 уровня), новый блок для умного управления увеличившимся кэшем, два дополнительных логических блока для обработки задач с плавающей запятой и так далее.
Если говорить о приросте производительности флагманских процессоров 2021 года, в чей состав войдут X-ядра, то он составит 20% по отношению к Cortex A-78 и не менее 30% к А-77.
Очевидно, что компания Arm всеми силами пытается помочь производителям чипсетов в гонке с Apple, как следствие, новый Cortex-X1 (базовые характеристики) становится очень похож на своего конкурента. Особенно интересно будет посмотреть на реализацию новых больших ядер в составе Exynos, не может же так быть, чтобы сапожник остался без сапог (чипсеты Cortex-X1 будут изготавливаться на фабриках Samsung), верно? Очевидно также и то, что кластер из 4 ядер X1 оставит далеко позади не только продукцию Apple, но и некоторые десктопные решения, если его оснастить системой жидкостного охлаждения и не отключать от розетки.
Графическая часть
Помимо процессорной части, существует и графическая, отвечающая за игровую производительность и аппаратное декодирование видео (например, при просмотре YouTube). Недавно мы с вами разговаривали о минимально комфортных видеочипах середины 2020 года, теперь стоит посмотреть на лучшие. Arm стремится предоставить игровую производительность новых видеочипов, которую можно было бы сравнить с игровыми приставками полуторагодичной давности. Это очень амбициозное заявление было приурочено к началу альфа-теста нового движка CryEngine для мобильных платформ весной этого года. Ближе к зиме начнется ЗБТ (закрытый бета-тест), а в следующем году мир увидят новые игры с отставанием от игровых консолей по качеству картинки всего на 2-2,5 года. В качестве примера будущей красоты была представлена короткометражная сцена, созданная на базе полуфабриката для разработчиков «Neon Noir», которую просчитывал видеочип Arm Mali-G77 MP11 в составе Exynos 990 (Samsung Galaxy S20+):
О видеочипе 2021 года Mali-G78 известно не очень много, только то, что соизволила сообщить сама компания Arm: новый видеочип будет производительнее предшественника на 25% и сможет поддерживать до 24 ядер (то самое «MP» в названии видеочипов, точное количество определяет заказчик, Exynos, MediaTek и др.), хотя и будет основан на старом ядре Valhall. Главной инновацией в Arm Mali-G78 является асинхронный режим работы отдельных ядер видеопроцессора, подобную эволюцию мы с вами наблюдали в стане центральных процессоров несколько лет назад.
Про производительность чипсетов Apple в 2021 году
Вы когда-нибудь пробовали узнать о комплектующих хоть что-то сверх того, что Apple пишет на коробке iPhone? Попробуйте, это интересное и полностью бесперспективное занятие. Примером такого взаимодействия с community может послужить мое обращение в службу поддержки Apple с вопросом о реальной емкости и гарантированном (до выхода из строя или потери значительной емкости) количестве циклов заряда/разряда аккумулятора Apple Watch. Вопрос был задан через web-форму официального интернет-магазина, и спустя всего лишь две недели была получена отписка, увы, не ответ:
Вместо конкретного ответа было рекомендовано заглянуть в инструкцию, чтобы узнать, как посмотреть уровень заряда умных часов. Так что о производительности мобильных чипсетов Apple в 2021 году можно сказать только: «Будет еще лучше, чем раньше, но сейчас еще лучше».
Заключение
Даже по отрывочным данным видно (подсистема кэша процессора, количество логических блоков), что чипсеты Apple значительно отличаются от серийных Arm, выпущенных для Android-смартфонов. Собственная глубокая аппаратная кастомизация помогает прошлогодним чипсетам Apple (А13) практически на равных бороться с более новыми чипсетами лидеров Android-мира. Нельзя говорить о сокрушительном отрыве по производительности, если разница в синтетических тестах между чипсетами составляет всего 6%. Тем более нельзя говорить об отрыве, если создатели бенчмарков не рассказывают, какими именно задачами они нагружают смартфоны и как складывают баллы, например AnTuTu. Более-менее адекватную картину производительности чипсета в реальных задачах показывает прозрачный, как слеза ребенка, бенчмарк Geekbench (из популярных), не устану это повторять. И все-таки на примере готовящегося к производству чипсета Cortex-X1 заметно, что альма-матер всей индустрии компания Arm недовольна выскочкой из Купертино и хочет поднять планку производительности для всех, кто сможет за это заплатить.
Как вы считаете, смогут Qualcomm и Exynos убедительно обогнать по производительности чипсеты Apple A-серии в 2021 году? Или Apple снова всех удивит?
>> Как вы считаете, смогут Qualcomm и Exynos убедительно обогнать по производительности чипсеты Apple A-серии в 2021 году?
Я мало в этом понимаю, но исходя из приведенной таблицы Cortex-X1 по многим параметрам сливает даже Apple A13, а не то что будущим чипсетам из Купертино.
Ага. У А13 даже кэша L3 нет, потому что он ему не нужен. Потому что новые приложения разрабатываются под одну платформу и процу не нужна лишняя память, чтобы хранить данные расчетов приложения.
Где такую траву берете?
Имел ввиду не память, а раздел L3. Оговорился)))
Да нет. Я с учетом этой оговорки. Выбор структуры кэша очень сложная и неоднозначная задача. Влияет скорее тип алгоритмов обрабатываемых приложением, а под сколько оно платформ и на каком языке, влияние следовое. Но даже тип алгоритма влияет слабо. Короче — там все серьезно и не по детски.
Еще как блок предугадывания работает вопрос.
Имел ввиду не память, а раздел L3. Оговорился)))
андроид смартфоны даже старые на 7ом андроиде производительнее новых яблок, статья рекламная.
Неожиданно)
А что, если скажу, что старые айфоны даже на новой айоси быстрее новых андроидов?
«Достаточная» — лапидарно сообщала компания Rolls-Roys о мощности двигателей своих авто ещё до недавнего времени.
Это уровень. Когда нет нужды трясти везде лошадиными силами, ядрами, ампер-часами и гигабайтами.
На старте — нет. Тем более Эксинос. Возможно, через полгодика после выхода 875-го, какая-нибудь специально разогнанная версия…
Это не уровень, а отсутствие конкуренции или такая конкуренция, где параметр больше вводит в заблуждение. Существуй другие производители аппаратов на iOS, трясла бы ампер-часами и гигабайтами только в путь.
Но их нет и вряд ли появятся, в том-то и прикол)
Что не дает повода преподносить контекст как достижение.
Они ничего и не преподносят. Лишь не загружают пользователя лишней информацией — потому что могут себе это позволить.
По прежнему считаю, что «отставание» Квалком сотоварищи не в качестве ядер и их разработчиков, а в целях которые перед ними ставились. В Андроид мире ядерная гонка, поэтому мультипоток выигрывает. Ну нафига мне 2 кластера по 4 ядра, отличающихся только big.LITTLE? Отрыв Яблока в однопотоке соответственно не в глубокой кастомизации, а в том, что они первые поставили такую цель. Лидируют еще со времен А10 и даже раньше. Сделали быстрое ядро и только потом стали добавлять медленных. Естественно быстрое тоже совершенствуя.
Смогут ли Квалки догнать за одну итерацию? Вряд ли. Но в принципе, труднопреодолимых сложностей нет. Если вектор «догнать в однопотоке» не поменяться, года через 2-3 ядра будут плюс-минус равны. Не будущее с ныненшним)), а ядра того времени.
А мне кажется все дело в деньгах. Apple вбухивает тонну денег на создания своего чипа. Как говорится, делают для себя и под себя.
А вот qualcomm играют на массовый рынок. При этом еще и их чипы не дешевые, как мы знаем. А в мире андроидов большинство покупают среднебюджетные, а то и бюджетные аппараты. Вот и ответ.
А я разве сказал иное?)) Вбухивают для создания своего чипа одинаково. Цели — разные. Для Эппл их формирует сама же Эппл, которая посчитала (и правильно сделала!), что однопоток важнее. Для Квалков цели поступают со стороны. Отделы маркетинга производителей внушили «ядра — круто» и сами стали заложниками созданного общественного мнения. Чтобы продать новый смартфон/флагман и продать больше конкурента, нужно еще больше ядер. Сейчас вектор сменился, значит сменится идеология чипа. И никаких пафосных «нешмогла» или «эппл крут!».
Эм, если б qualcomm вбухивали столько же денег, то могли бы себе позволить полностью кастомную архитектуру. А так мы видим отказ от этого. Да еще и сама ARM говорит, что многие не могут позволить себе эту самую кастомную архитектуру как у Apple, вот и выкатывают X1 ядра.
Тут, как раз, не в целях дело, а в вложенных деньгах и прибыли.
Вы забываете, что кроме железа, есть еще и софт. И iOS может тупо более эффективно использовать железную архитектуру, чем линух. См. мой комментарий выше
Кстати big.LITTLE фсё. Теперь у всех ядра работают параллельно и независимо друг от друга. Переключаются не кластеры, а сами ядра.
Кстати, было бы любопытно проследить частоты одинаковых по архитектуре ядер, в линейке SoC производителя. Не исключено, что в флагманских это ядро будет big, а в среднем классе ЛИТТЛ (или наоборот).
Встречаемся после полуночи тут же (AMR).Про новые Qualcomm будет.
Не фсё. И будет жить еще долго. Это слишком низкоуровневая фича. Гораздо ниже параллельности и зависимости. Упрощенно, способ «отлить» транзисторы в кремнии. Один и тот же блок сделанный так, будет работать чуть быстрее, ни и жрать больше, а этак — медленнее и холоднее. Как только увидите в SoC два одинаковых по архитектуре ядра работающих с разной частотой, верный признак биг.ЛИТЛа.
Не очень понятно, что значит «два одинаковых по архитектуре ядра».
Запросто могут быть 4 ядра A53 — кластер little, и 4 A73 — кластер big.
А основная фишка, которую эплы сделали еще в А11 — это возможность гетерогенного использования ядер, т.е. не по отдельности кластерами, а всех сразу параллельно.
И весь вопрос, кстати, не столько в железе, сколько в софте, который его использует. Планировщик линуха может быть менее эффективен, чем планировщик bsd в использовании многоядерных процессоров.
А,простите, зачем такая производительность массовому пользователю? ну кроме яростных игроманов в неполноценные шутеры и любителей тестов.
для инстаграмчика или вкшечки? да там и любой 100 баксовый ксяоми справится.
Шоб видео смотреть 8K 60fps 3D 360° без тормозов)
попробуйте такой актуальный сценарий — СМАРТфон:
1) раздаёт инет для ноута
2) к трубке подключены wireless наушники
3) идет конференция в зуме
4) найти письмо в почтовом клиенте
5) отбить спам-звонок из GSM сети
мой iPhone 7 Plus на iOS 13 адски лагает
1. Аппаратно. 2. Аппаратно. 4. Не тормозило на WM5 на 1-ядерном 300МГц. По логике, не нагрузка даже в сегодняшем софте. 5. Простейший запрос в базу данных.
Остается лагалище Зум. Наверное на Электроне собран?)))
речь о том, чтобы это всё делать сразу
Обработка фото новыми алгоритмами, вычислительная фотография, AR, работа в нагруженных приложения (биржевые к примеру) итд.
Да. К примеру, если айфон обрабатывает фото из ночного режима максимум полторы секунды, то Note10+ на эксиносе — раза в 3 дольше.
а у них софт и алгоритмы обработки одинаковые, чтобы так тупо в лоб сравнивать? это заявление из серии тормозной путь у макларена в 2 раза больше, чем у феррари)
А что там может различаться? Давно отработанная технология склейки одного снимка из нескольких.
Чтобы нивелировать рукожопость разработчиков софта, которые давно разучились в оптимизацию кода и клепают высокоуровневые поделки на базе всяких электронов
Тут такой еще момент.
Помимо больших высокопроизводительных ядер есть еще маленькие экономичные. У ARM уже третий год подряд используются А55, а многие аппараты ниже среднего вообще используют еще более старые А53. Это медленные чипы даже без внеочередного исполнения команд.
Для сравнения, еще в 2018 году в составе яблочного А12 в качестве «экономичных» использовались ядра, по производительности очень близкие к толстым А73 (2016 год) от АРМ. В 2019 году в А13 эти ядра заметно усилили.
Так что дело не только в больших ядрах, но и в том, что экономичные у Эппл потребляют энергии меньше чем от АРМ, но при этом превосходят их производительности раза в 3 минимум.
И вот этой области ARM не собирается ничего улучшать еще минимум год (на роадмапе и вовсе ничего такого нет).