Обзор и тест Snapdragon 810 | Слухи и домыслы

Source: Обзор и тест Snapdragon 810: часть 1,  часть 2

SoC серии Snapdragon от компании Qualcomm пользуются большим успехом, особенно на североамериканском рынке. Почти каждый флагманский смартфон 2014 года, включая LG G3 и Sony Z3, Galaxy S5 и Nexus 6, HTC One и OnePlus One, комплектуется чипом серии Snapdragon 800. Учитывая такое положение дел, новый Qualcomm Snapdragon 810 должен заинтересовать практически всех OEM-производителей смартфонов.

Если верить слухам, Qualcomm Snapdragon 810 действительно нагревается, только не так, как ожидала Qualcomm. Первый слух появился в начале декабря от неназванного корейского источника в этой индустрии. По его словам, Qualcomm Snapdragon 810 перегревается, если напряжение поднимается до определенного значения, плюс имеет проблемы с производительностью контроллера памяти и ошибки в драйвере GPU. Как правило, подобные анонимные слухи быстро теряются в общей шумихе, однако на этот раз ими заинтересовалась LG, которая использует Qualcomm Snapdragon 810 в недавно анонсированном G Flex 2, особое беспокойство вызывала проблема перегрева. Ву Рам-чан, президент отдела планирования мобильных продуктов LG, заявил следующее: «Я прекрасно знаю о различных волнениях на рынке, связанных со Qualcomm Snapdragon 810, но производительность чипа вполне удовлетворительная». Также он добавил: «Я не понимаю, откуда взялась информация о проблеме перегрева».

LG, возможно, по результатам своих тестов не сочла ситуацию опасной, но Samsung, видимо, получила такие значения температуры во время тестирования SoC , что решила отказаться от Qualcomm Snapdragon 810 в предстоящем Galaxy S6. Это решение подтвердилось в финансовом отчете Qualcomm за первый квартал 2015 года, в котором «ожидание, что наш процессор Qualcomm Snapdragon 810 не будет использоваться в предстоящем цикле проектирования флагманского устройства крупного клиента» частично виновато в снижении прогноза по доходам производства полупроводников во второй половине этого года. Wall Street Journal даже сообщил, что Qualcomm создает обновленную версию Qualcomm Snapdragon 810 для Samsung, которая должна быть готова в марте.

Даже если слухи, связанные с Samsung, подтвердятся, это не обязательно означает, что с Qualcomm Snapdragon 810 есть проблемы. Традиционно Samsung использует SoC Snapdragon для североамериканских версий своих мобильных телефонов, а для международных применяются собственные системы на кристалле Exynos. Exynos 7420, который должен появиться во многих, если не во всех, смартфонах Galaxy S6, использует восьмиядерную конфигурацию big.LITTLE, сочетающую процессоры ARM Cortex-A57 и A53. Ожидается, что эти чипы будут изготавливаться с использованием техпроцесса 22 нм. Аналогичные характеристики имеет Qualcomm Snapdragon 810. Тем не менее, президент полупроводникового отделения Samsung Ким Ки Нама заявил, что Samsung уже производит чипы по новому процессу 14 нм FinFET для неустановленных клиентов. Если Samsung сможет перенести Exynos 7420 на новый техпроцесс, она добьется гораздо более высокой тактовой частоты, чем в аналогичном Qualcomm Snapdragon 810. Чтобы сохранить одинаковый уровень производительности между двумя разными версиями Samsung S6 (если компания захочет использовать два SoC), то нужно будет либо понижать скорость 7420, либо разгонять Qualcomm Snapdragon 810 сверх того, что позволяет техпроцесс 20 нм, а это приводит к перегреву.

Таким образом, слухи о перегреве могут быть просто раздутыми. А что насчет проблемы со скоростью работы памяти? Недавно мы провели несколько тестов на устройстве, использующем SoC Qualcomm Snapdragon 810, и наблюдали довольно низкие показатели скорости работы памяти. Копая глубже, мы узнали, что тестируем предсерийный образец устройства, который, по данным Qualcomm, использует шину памяти на половине ее скорости. На самом деле, это довольно распространенная проблема при работе с новым типом памяти, в случае с Qualcomm Snapdragon 810 – это LPDDR4.

Обзор и тест Snapdragon 810

Можно с уверенностью сказать, что новейший чип Snapdragon столкнулся с некоторыми техническими проблемами. Но справилась ли с ними Qualcomm, или Qualcomm Snapdragon 810 все еще имеет недостатки? В недавно опубликованном пресс-релизе Qualcomm указывалось, что на рынок поступят более 60 моделей премиум-класса на основе Qualcomm Snapdragon 810. Официально было объявлено две: LG G Flex 2 и Xiaomi Mi Note Pro. Другие производители также выразили уверенность в новом SoC, в том числе Microsoft, Oppo, Sony и Motorola Mobility. Президент Motorola Mobility, Рик Остерлох (Rick Osterloh), заявил: «Процессор Qualcomm Snapdragon 810 позволит нам раздвинуть границы еще шире». Если бы Qualcomm Snapdragon 810 имел серьезные проблемы с производительностью, вряд ли бы он получил такой лестный отзыв.

Однако данные говорят лучше слов. После изучения архитектуры Qualcomm Snapdragon 810 и его функционала, мы подвергли его серии тестов и сравнили показатели с показателями других флагманских планшетных SoC . Эти данные смогут опровергнуть или подтвердить гуляющие слухи.

Обзор и тест Snapdragon 810 | Архитектура

Архитектура

Обзор и тест Snapdragon 810

Основное нововведение Qualcomm Snapdragon 810 – это переход на 64-разрядную архитектуру. Тем не менее, Qualcomm Snapdragon 810 также содержит обновленный графический процессор, полностью новый интерфейс памяти и новый модем Gobi. Последний компонент Qualcomm Snapdragon 810 является его крупнейшим технологическим скачком. Этот модем поддерживает LTE Category 9 со скоростью передачи данных до 450 Мбит/с с агрегацией несущих частот. Модем в SoC Qualcomm Snapdragon 810 призван добавить чипу привлекательности и сэкономить на стоимости производства.

Технические характеристики семейства Qualcomm Snapdragon 8xx
Snapdragon 810 Snapdragon 805 Snapdragon 801 Snapdragon 800
Техпроцесс 20nm 28nm HPm 28nm HPm 28nm HPm
CPU 4x ARM Cortex-A57 @ 2.0GHz + 4x ARM Cortex-A53 @ 1.5GHz (big.LITTLE) 4x Qualcomm Krait 450 @ 2.65GHz 4x Qualcomm Krait 400 до 2.45GHz 4x Qualcomm Krait 400 до 2.26GHz
Архитектура ARMv8-A (32/64-bit) ARMv7-A (32-bit) ARMv7-A (32-bit) ARMv7-A (32-bit)
GPU Qualcomm Adreno 430 @ 600MHz Qualcomm Adreno 420 @ 600MHz Qualcomm Adreno 330 @ до 578MHz Qualcomm Adreno 330 @ 450MHz
Память LPDDR4-1600 2x 32-bit (25.6GBps) LPDDR3-800 2x 64-bit (25.6GBps) LPDDR3-800/933 2x 32-bit (12.8/14.9GBps) LPDDR3-800 2x 32-bit (12.8GBps)
DSP Hexagon V56 @ 800MHz Hexagon V50 @ 800MHz Hexagon V50 @ 800MHz Hexagon V50 @ 680MHz
Встроенный модем MDM9x??, LTE Cat 9, до 450 Mbps MDM9x25, LTE Cat 4, до 150 Mbps MDM9x25, LTE Cat 4, до 150 Mbps

CPU

В Qualcomm Snapdragon 810 Qualcomm отказалась от собственной процессорной архитектуры Krait и последовала примеру других производителей SoC, таких как Marvell, MediaTek и Nvidia и использовала 64-разрядные ядра ARM. В частности, Qualcomm Snapdragon 810 работает с четырьмя ядрами Cortex-A57 и четырьмя ядрами Cortex-A53 в гетерогенной конфигурации big.LITTLE, в которой планировщику ОС доступны все восемь ядер. Два кластера CPU соединены когерентным кэшем CCI-400 Cache Coherent Interconnect. Характеристики обоих типов ядер хорошо известны, так что мы просто рассмотрим основные моменты.

Cortex-A57 является преемником Cortex-A15. A57 привносит лишь незначительные изменения в архитектуру А15. Он по-прежнему использует спекулятивный вычислительный суперскалярный 15+ ступенчатый конвейер, где первые 12 стадий (выборки/декодирования) являются последовательными, а последние 3-12 стадий (выдача/исполнение) — внеочередными. IPC также не изменился по сравнению с A15: декодирование до трех, выдача до восьми и перераспределение до трех (восемь каналов разной длины) команд за такт. Это половина от того, что могут Apple A7 (предположительно A8) и Nvidia Denver. Буфер переупорядочивания команд, влияющий на уровень параллелизма выполнения команд, который может достичь ядро, как и A15 вмещает до 128 микроопераций. Это меньше, чем 192 команды в A7 Apple (предположительно, и в A8) и в архитектуре Intel Haswell для настольных ЦП (хотя у Denver нет аппаратного буфера переупорядочивания, его алгоритмы перекодирования выполняют переупорядочивание и поиск до 1000 и более команд с целью улучшения параллелизма). Кэш L1 для инструкций увеличился до 48 Кбайт (буфер быстрого преобразования адреса (TLB) на 48 записей) по сравнению с 32 Кбайт в A15, но кэш для данных остался прежним — 32 Kбайт (TLB на 32 записи). Кэш L1 опирается на общий кэш L2.

Обзор и тест Snapdragon 810
Cortex-A57 (источник: ARM)

В конфигурации big.LITTLE есть еще один тип ядер — Cortex-A53, которое базируется на архитектуре Cortex-A7. A57 – это сложное ядро с внеочередным исполнением команд, ориентированное на высокую производительность. В свою очередь A53 является простым ядром с последовательным исполнением команд, оптимизированным для экономии энергии. Оно имеет короткий 8-ступенчатый конвейер (опциональный модуль Advanced SIMD в Qualcomm Snapdragon 810 использует в общей сложности 10 ступеней и требуется для выполнения операций с плавающей запятой) с симметричной двойной выдачей для большинства команд. ARM утверждает, что на одном и том же техпроцессе ядро A53 обеспечивает такую же производительность, как и Cortex-A9.

Обзор и тест Snapdragon 810

Cortex-A53 (источник: ARM)

A57 и A53 имеют много общих низкоуровневых особенностей с процессорами, которым они пришли на смену, но добавляют поддержку новой 64-битной архитектуры AArch64 и набора команд A64. Наиболее очевидным преимуществом перехода на 64-бит является возможность использовать более 4 Гбайт физической памяти, что очень важно для мобильных устройств, в которых центральный и графический процессоры делят между собой оперативную память. 32-битный A15 уже использует транслятор адресов Large Physical Address Extensions (LPAE), который переводит 32-битные виртуальные адресные пространства в 40-битное физическое адресное пространство с размером страницы 4 Кбайт. Таким образом, сразу несколько приложений могут видеть до 4 Гбайт оперативной памяти одновременно, подобно тому, как программы для Windows работают на 32-разрядной платформе x86. ARMv8-A сглаживает ограничение адресации памяти, поддерживая работу 48-битного виртуального и физического адресного пространств. Полноценное 64-битное адресное пространство пока просто не нужно (x86-64 также использует 48-битное пользовательское адресное пространство), а ограничение адресного пространства упрощает аппаратную компоновку и снижает энергопотребление. В дополнение к традиционным, 4 Кбайт новая архитектура также поддерживает страницы размером 64 Kбайт, что снижает количество уровней в таблице переадресации страниц при использовании 42-битного адреса с четырех до двух.

До 2016 года мы вряд ли увидим смартфоны и планшеты, оснащенные больше чем 4 Гбайт ОЗУ, но переход на 64-бит предлагает другие улучшения производительности. Ширина регистров составляет 64-бит и их теперь больше. Регистры общего назначения увеличились с 14 до 32, а регистры SIMD/с плавающей запятой увеличились с 16 до 32 бит. Дополнительные регистры дают компиляторам больше пространства для выполнения циклов и, согласно ARM, включают «улучшенные возможности планирования задач для более сложных алгоритмов, которые становятся общими для различных программных кодов».

Вместо адаптации существующей 32-разрядной таблицы декодирования, ARM дает свои собственные 64-битные инструкции. Наличие двух простых таблиц вместо одной большой, громоздкой таблицы упрощает аппаратную реализацию, кроме того, облегченное предсказание ветвлений и другие методы ускоряют JIT-компиляторы (JavaScript), что весьма полезно для более быстрого просмотра веб-страниц.

ARM применяет такой же подход к разработке своей 64-битной архитектуре системы команд (ISA). Вместо расширения A32 ISA, как сделала AMD с x86, в ARM создали новую усовершенствованную A64 ISA, которая еще больше упрощает аппаратную реализацию и снижает энергопотребление. Например, загрузка/сохранение нескольких команд, усложняющая подсистему памяти, была удалена вместе с некоторыми условными командами, преимущества от которых не оправдывали затраченную мощность.

A64 также дает улучшенной архитектуре SIMD новые возможности, позволяющие удовлетворить требования стандарта IEEE754-2008, в том числе возможность обработки чисел двойной точности с плавающей запятой для векторов и новые инструкции округления чисел. Регистры SIMD теперь также имеют ширину 128-бит против 64-бит в AArch32.

Обзор и тест Snapdragon 810

Учитывая приведенную выше информацию, сможет ли Qualcomm Snapdragon 810 обеспечить более высокую производительность CPU по сравнению с предыдущими SoC Snapdragon 80x? В большинстве случаев, особенно если выполняется 64-битный код, ответ будет — да. По сути Krait 400/450 является упрощенной версией A15, оптимизированной для низкого энергопотребления и/или высоких тактовых частот. IPC практически аналогичен A15/A57. Целочисленный конвейер Krait также стал короче. У него более короткий буфер переупорядочения команд, хранящий только 40 микроопераций, а также менее емкий кэш первого уровня. Отсутствие одного порта исполнения и меньший буфер, безусловно, навредят общей пропускной способности, хотя более короткий конвейер Krait и более высокая тактовая частота помогут быстрее восстановиться после ошибочного предсказания ветвления.

А что насчет энергопотребления? При прочих равных условиях, сложность А57 означает более высокую потребляемую мощность. Однако стремление как можно быстрее перевести систему в сон, переложить задачи на энергоэффективные ядра A53 и меньший техпроцесс 20 нм должны помочь снизить энергопотребление по сравнению с Krait.

GPU

Хотя нам кое-что известно о ЦП внутри Qualcomm Snapdragon 810, о его графическом процессоре Adreno 430 информации практически нет. Qualcomm не сообщает никаких подробностей об архитектуре, а лишь расплывчато заявляет о повышенной на 30% производительности и пониженном на 20% энергопотреблении по сравнению с предыдущим поколением Adreno 420. Но, учитывая, что в 420-ом GPU была значительно переработана архитектура, то можно справедливо предположить, что 430-й является немного модернизированной версией 420-го.

В прошлом году в Adreno 420 добавились поддержка OpenGL ES 3.1 (плюс Android Extension Pack), OpenCL 1.2 и DirectX 11 с функциональным уровнем 11_2, наряду с поддержкой геометрических шейдеров, динамической аппаратной тесселяции и технологии Adaptive Scalable Texture Compression (ASTC). Все эти особенности есть и в 430.

В нашем обзоре Snapdragon 805 мы отмечали, что значительное увеличение пропускной способности памяти наряду с увеличенными в Adreno 420 кэшами текстур и L2 позволило эффективно обеспечивать данными дополнительные текстурные и шейдерные блоки. Такой вывод подтверждался результатами наших тестов. Учитывая достаточную пропускную способность памяти и освободившееся место на кристалле благодаря переходу на меньший производственный процесс 20 нм, в Adreno 430, скорее всего, добавились дополнительные шейдерные ресурсы.

Тестируя Note 4 и Nexus 6, работающие под управлением Snapdragon 805, мы замечали существенный тепловой троттлинг во время игр. Во многих случаях тепловой троттлинг нивелировал все преимущества 420-го по сравнению со старым Adreno 330. Переход на меньший техпроцесс поможет 430-й версии компенсировать хотя бы некоторые потери мощности, связанные с (возможным) увеличением числа транзисторов. Вполне вероятно, что Qualcomm сделала и другие изменения с целью снижения энергопотребления, но есть подозрения, что в 430-ом чипе проблема с тепловым троттлингом сохранится, особенно для полностью пластиковых телефонов.

Память

Snapdragon 805 обращается к памяти LPDDR3-800 через двухканальную 64-битную (в совокупности 128 бит) шину с полосой пропускания 25,6 Гбайт/с, что значительно больше, чем 14,9 Гбайт/с в Snapdragon 801 и Apple A8. Итоговая пропускная способность памяти Qualcomm Snapdragon 810 не изменилась, но подсистема перешла на 32-битный двухканальный (в совокупности 64 бит) интерфейс LPDDR4-1600.

LPDDR4 имеет полностью переработанную архитектуру, которая использует два 16-битных канала (в LPDDR3 один 16-битный канал), сокращающих расстояние передачи сигнала между массивом памяти и контактными площадками модулей, тем самым уменьшая энергопотребление и обеспечивая высокие частоты передачи сигнала. Новая память также использует интерфейс LVSTL (low-voltage swing-terminated logic) с пониженным на 50% по сравнению с LPDDR3 напряжением. Эти усовершенствования обеспечивают более высокую скорость передачи данных (которую Snapdragon 805 уже достиг с помощью более широкой 128-битной шины) и пониженное на 35-40% потребление энергии.

Прочие модули и интерфейсы

Qualcomm Snapdragon 810 использует два 14-битных ISP (Image Signal Processor), поддерживающие матрицы до 55 мегапикселей с общей пропускной способностью 1,2 гигапикселей в секунду. Впрочем, в этом плане он не отличается от Snapdragon 805. Qualcomm Snapdragon 810 получил новый DSP Hexagon V56, который поддерживает Dolby Atmos и воспроизведение музыки до 24 бит/192 кГц (требуется поддержка отдельного аудиокодека или передача через USB на внешний ЦАП).

Компания Qualcomm охотно продвигает 4K-видео, поэтому неудивительно, что кристаллы Snapdragon показывают стремление к полной поддержке этого формата. Snapdragon 800/Snapdragon 801 могут кодировать/декодировать Ultra HD видео в формате H.264 на аппаратном уровне, но кодирование в H.265 (HEVC) выполняется полностью программно. В Snapdragon 805 появилось аппаратное декодирование 4K-видео в H.265, а Qualcomm Snapdragon 810 завершает переход к Ultra HD, получив аппаратное кодирование 4K в H.265. Аппаратный кодировщик в Qualcomm Snapdragon 810 поддерживает 4K-видео на частоте 30 кадров в секунду и разрешение 1080p на частоте 120 кадров в секунду. Также он может выводить 4K на скорости 60 FPS на основной дисплей и 4K на скорости 30 FPS на внешний дисплей через HDMI 1.4a или 1080p на частоте 60 FPS без проводов через Miracast.

Обзор и тест Snapdragon 810

Первоначально Qualcomm Snapdragon 810 должен был оснащаться модемом Qualcomm Gobi 9×35 Cat 6, поддерживающим скорость до 300 Мбит/с. Но поскольку Samsung в этом году якобы готовит собственный модем уровня Cat 10, Qualcomm посчитала нужным модернизации модем в Qualcomm Snapdragon 810 до уровня Cat 9. Это уникальное решение, пока не имеющее официального названия, но известно, что это ни MDM9x35, ни недавно анонсированный Cat 10 MDM9x45. Важно, что его пиковая пропускная способность достигает 450 Мбит/с благодаря агрегации 3-х несущих частот по 20 МГц.

В общем, Qualcomm Snapdragon 810 по сравнению с версией Snapdragon 805 предлагает ряд заметных усовершенствований, включая восьмиядерный 64-битный процессор, LTE модем Category 9 и поддержку оперативной памяти LPDDR4. Кроме того, он отличается повышенной производительностью GPU и некоторыми обновлениями подсистемы обработки аудио/видео. Немного разобравшись с техническими характеристиками новинки, пришло время проверить заявленный прирост производительности в наших тестах, результаты которых мы представим во второй части.

Обзор и тест Snapdragon 810 | Тестовый пакет, методика и характеристики тестовой системы

Тестовый пакет

Наше тестирование SoC Snapdragon 810 включает анализ производительности CPU, GPU и веб-тесты.

Тесты
Тесты CPU AndEBench Pro v2.0.2124, AnTuTu v5.6, Basemark OS II Full (Anti-Detection) v2.0, Geekbench 3 Pro v3.3.1, MobileXPRT 2013
Тесты HTML5 и JavaScript Browsermark 2.1, Google Octane 2.0, JSBench, Peacekeeper 2.0, WebXPRT 2013
Тесты GPU 3DMark (Anti-Detection) v1.2, Basemark X 1.1 Full (Anti-Detection) v1.1, GFXBench 3.0 Corporate v3.0.0

Методика тестирования

Все устройства тестируются при полностью обновленном штатном программном обеспечении. Ниже представлен список настроек, которые мы стандартизируем перед тестированием.

Настройка оборудования
Bluetooth выкл.
Яркость дисплея 200 нит
Состовая связь SIM-карта извлечена
подсветка дисплея по умолчанию (не адаптивная)
Сервисы обнаружения выкл.
Питание батарея
Режим сна отключен (или самый длительный из доступных интервалов)
Уровень громкости без звука
Wi-Fi вкл.

Ко всему прочему, для тестирования скорости работы с браузером под управлением ОС Android мы используем единую версию Opera на базе движка Chromium, чтобы исключить влияние различных версий на результаты тестируемых устройств. Ввиду ограничений платформы, лучшим решением для iOS является браузер Safari, а Windows RT работает только с Internet Explorer.

Характеристики тестовой системы

В этот раз мы фокусируемся не на устройствах, а на SoC, особенно в планшетах. Чтобы проанализировать развитие продуктов Qualcomm, мы сравним Snapdragon 810 с его предшественниками — Snapdragon 805, представленным в Nexus 6, и Snapdragon 801 в Sony Z3. В использовании смартфонов и планшетов в одном тестировании нет ничего страшного, поскольку мы не сравниваем дисплеи, время автономной работы и производительность GPU при визуальном рендеринге изображения на экран. Мы выбрали Nexus 6, поскольку он менее склонен к тепловому троттлингу, чем Galaxy Note 4, и имеет более полный и актуальный набор тестовых данных, чем другие устройства. Для тестирования Snapdragon 8011 мы взяли Z3, поскольку он показал лучшую производительность без активации системы регулирования частоты при чрезмерном нагреве. Хотя у Galaxy S5 чуть более высокая производительность в многопоточных тестах CPU, Z3 выходит вперед по графике, памяти и NAND.

Также для сравнения мы включили еще четыре планшета, использующие другие современные архитектуры: Apple iPad Air 2 с трехъядерным A8X, Dell Venue 8 7000 с Intel Atom Z3580 (который застрял на Android 4.4 и ограничивается 32-битным режимом), HTC Nexus 9 с чипом Nvidia Tegra K1 на ядрах Denver и Nvidia Shield Tablet с SoC Tegra K1 на базе ядер ARM.

Кроме того, мы добавили результаты нового SoC Tegra X1 от Nvidia с графическим процессором Maxwell. Но имейте в виду, эти цифры получены на демонстрационных платах Tegra X1, работающих под управлением Android Lollipop. Хотя мы не смогли провести наши собственные тесты и проверить тактовые частоты, мы видели, как проводились бенчмарки. Сам SoC имел небольшой радиатор (без вентилятора), который, по словам Nvidia, представлял стандартное для корпуса планшетов рассевание тепла.

Данные для Snapdragon 810 получены на MDP-планшете (сокр. от Mobile Development Platform, — мобильная платформа для разработки), который нам прислала компания Qualcomm из своей тестовой лаборатории. Понятно, что этот планшет не будет продаваться на рынке (он заметно массивнее, чем будущие рыночные модели, что может положительно сказаться на рассеивании тепла). Устройство работало от сети переменного тока, так что его результаты следует рассматривать как предварительные. Тем не менее, мы установили и запустили наши собственные бенчмарки. Для сравнения, MDP-планшет со Snapdragon 805, как правило, набирал меньше баллов, чем последующие рыночные продукты.

К сожалению, придется дождаться серийных устройств, прежде чем можно будет проанализировать время автономной работы у Snapdragon 810, так как нам не хватило времени, чтобы собрать данные по скорости разрядки батареи.

Таблица ниже содержит всю необходимую техническую информацию об участниках сегодняшнего сравнения.

Qualcomm Snapdragon 810 MDP Tablet Motorola Nexus 6 Sony Z3 Apple iPad Air 2
SoC Qualcomm Snapdragon 810 (MSM8994) Qualcomm Snapdragon 805 (APQ8084) Qualcomm Snapdragon 801 (MSM8974AC) Apple A8X
CPU 4x ARM Cortex-A57 @ 2,0 ГГц + 4x ARM Cortex-A53 @ 1,5 ГГц (big.LITTLE) Qualcomm Krait 450 (4 ядра) @ 2,65 ГГц Qualcomm Krait 400 (4 ядра) @ 2,45 ГГц Apple Cyclone+ (3 ядра) @ 1,5 ГГц
GPU Adreno 430 @ 600 МГц Qualcomm Adreno 420 @ 600 МГц Qualcomm Adreno 330 @ 578 МГц Apple/PowerVR GX6450 x2 (8 кластеров)
Память 4 Гбайт LPDDR4 (25.6 Гбайт/с) 3 Гбайт LPDDR3 (25,6 Гбайт/с) 3 Гбайт LPDDR3 (14,9 Гбайт/с) 2 Гбайт LPDDR3 (25,6 Гбайт/с)
Дисплей 10,1 дюймов @ 3840?2160 (436 PPI) 5,96 дюймов AMOLED @ 2560×1440 (493 PPI) 5,2 дюймов IPS @ 1920×1080 (423 PPI) 9,7 дюймов IPS @ 2048×1536 (264 PPI)
Накопитель 64 Гбайт 32 Гбайт, 64 Гбайт 16 Гбайт, microSD (до 128 Гбайт) 16 Гбайт, 64 Гбайт, 128 Гбайт
ОС Android 5.0.2 Android 5.0 Android 4.4.4 iOS 8.1.2

 

Dell Venue 8 7000 HTC Nexus 9 Nvidia Shield Tablet
SoC Intel Z3580 Nvidia Tegra K1 Nvidia Tegra K1
CPU Intel Atom (4 ядра) @ 2,33 ГГц Nvidia Denver (2 ядра) @ 2,30 ГГц ARM Cortex-A15 r3p3 (4+1 ядра) @ 2,2 ГГц
GPU PowerVR G6430 Kepler (192 ядра) @ 950 МГц Kepler (192 ядра) @ 950 МГц
Память 2 Гбайт LPDDR3 (12,8 Гбайт/с) 2 Гбайт LPDDR3 (14,9 Гбайт/с) 2 Гбайт DDR3L (14,9 Гбайт/с)
Дисплей 8,4 дюймов OLED @ 2560×1600 (359 PPI) 8,9 дюймов IPS @ 2048×1536 (288 PPI) 8 дюймов IPS @ 1920×1200 (283 PPI)
Накопитель 16 Гбайт, microSD (до 512 Гбайт) 16 Гбайт, 32 Гбайт 16 Гбайт ( Wi-Fi) / 32 Гбайт ( LTE), microSD (до 128 Гбайт)
ОС Android 4.4.4 Android 5.0.1 Android 5.0.1

Учитывая, сколько различных CPU и GPU представлено в данном сравнении, мы определенно должны увидеть любопытные результаты. Обгонит ли Snapdragon 810 процессоры Cyclone от Apple или это сделают процессоры Denver от Nvidia? Насколько приблизится Adreno 430 к GPU от Nvidia на архитектуре Kepler?

CPU, память и Web-тесты

AnTuTu X

AnTuTu – бенчмарк для систем на Android, предназначенный для комплексной оценки производительности мобильных устройств. Он включает тесты подсистемы графики (охватывающие производительность 2D-графики, пользовательского интерфейса и простой 3D-графики), CPU (операции с фиксированной и плавающей запятой, тесты многопоточности), памяти (чтение и запись), операции ввода/вывода (чтение и запись).

Обзор и тест Snapdragon 810

Результаты AnTuTu X сортируются на основе общего балла, который показан слева от каждой полоски. Общий балл – это не просто совокупная величина, основанная на показателях отдельных тестов. Напротив, он высчитывается отдельно и имеет определенное значение. Вот почему длина полоски не соответствует общему баллу.

Тест AnTuTu GPU визуализируется на экране, и показатель Snapdragon 810 тут ниже из-за 4K-дисплея MDP-планшета. Несмотря на это, он набирает высокий общий балл благодаря впечатляющим результатам в многопоточных тестах, опережая все SoC. Он набрал на целых 66% больше баллов, чем Snapdragon 805, и на 56% больше, чем Tegra K1 с ядрами Cortex-A15, имеющий очень похожую архитектуру.

Тем не менее, в одноядерных тестах наблюдается противоположная ситуация. В них результаты сильно зависят от тактовой частоты, которая ставит Snapdragon 810 в невыгодное положение. Snapdragon 810 набрал на 31% меньше баллов, чем Snapdragon 805, пиковая частота ядра которого на 33% выше, и на 14% меньше, чем Tegra K1 (ARM), у которого частота выше на 9%. Только процессоры Nvidia Denver показали более высокие значения целочисленных операций на одном ядре (производительность с плавающей запятой равна Snapdragon 810).

Странно видеть такое несоответствие между результатами одноядерных и многоядерных тестов. Snapdragon 810 и Snapdragon 805 имеют одинаковую пиковую пропускную способность памяти, так что она тут роли не играет. Qualcomm в Snapdragon 810 использует новую внутричиповую шину CCI-400, которой нет у других систем на кристалле, представленных на графике, и может дать Snapdragon 810 преимущество в многоядерных тестах.

AndEBench Pro

AndEBench Pro создана силами организации The Embedded Microprocessor Benchmark Consortium (EEMBC) и использует тщательно разработанные низкоуровневые алгоритмы для тестирования производительности CPU, GPU, памяти и подсистемы хранения данных. Бенчмарк включает в себя задачи анализа XML, сжатия данных, рендеринга GUI, обработки фотографий и криптографии.

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Хотя AndEBench визуализирует работу графического теста на экране, Snapdragon 810 удается превзойти Snapdragon 805, несмотря на то, что ему приходится обрабатывать значительно больше пикселей. Мощный GPU Nvidia выводит две платформы Tegra вперед других SoC.

Наибольшие опасения вызывает производительность памяти SoC Snapdragon 810. Судя по тесту Memory Bandwidth (пропускная способность памяти), Snapdragon 810 работает примерно наравне с Snapdragon 805, это вполне ожидаемый результат. Но мы видим очень низкий показатель в тесте Memory Latency (задержки памяти) — всего половина от показателя Snapdragon 805. Возможно, это просто отклонение, но поскольку времени на тестирование было очень мало, мы смогли провести этот тест только один раз. Давайте посмотрим, каково будет влияние задержки в других тестах.

Basemark OS II Full (Anti-Detection)

Basemark OS II – это инструмент типа «все в одном», разработанный для тестирования общей производительности мобильных устройств. Он проверяет продукты по четырем критериям: System (система), Memory (память), Graphics (графика) и Web. Модуль System отражает скорость памяти и центрального процессора. В частности, он измеряет скорости целочисленных вычислений и вычислений с плавающей запятой, а также скорость обработки 32-битных изображений с разрешением 2048×2048 точек на одном или нескольких ядрах. Анализ скорости передачи данных на и с внутреннего NAND-накопителя (модуль Memory) выполняется посредством чтения и записи файлов фиксированного размера, набора файлов размером от 65 Кбайт до 16 Мбайт, а также различных файлов в случае высокой степени дефрагментации памяти. Для расчета показателя Graphics используется смесь графики 2D/3D в одной сцене, применение шейдерных эффектов и отображение 100 частиц в одну команду прорисовки для тестирования обработки вершинных операций на GPU. Бенчмарки визуализируются при разрешении 1920×1080 точек с выключенным экраном 100 раз, затем изображение выводится на экран. И, наконец, подтест Web нагружает CPU, выполняя трехмерные трансформации и изменения размеров объектов с помощью CSS. Также он включает тест с физическими частицами HTML5 Canvas.

Обзор и тест Snapdragon 810

В модуле System, тестирующем CPU и память, Snapdragon 810 и Snapdragon 805 борются за второе место. Snapdragon 810 также смог обогнать Snapdragon 805 на 17% в тесте Graphics, но отстал в Web-тесте, показав наименьший результат (на 18% ниже, чем Snapdragon 805, и примерно в два раза медленнее, чем A8X).

Geekbench 3 Pro

Geekbench от Primate Labs является чем-то вроде отраслевого стандарта благодаря своей обширной базе данных и широкой совместимости с различными платформами (Windows/OS X/Linux/iOS/Android). Этот бенчмарк дает два набора оценок: для однопоточных и многопоточных приложений. В каждом случае он проводит серию тестов, разбитых на три категории: целочисленные вычисления (Integer), вычисления с плавающей запятой (Floating Point) и производительность памяти ( Memory). Независимые результаты используются для вычисления общего балла в той или иной категории, который, в свою очередь, используется в общей оценке Geekbench.

Обзор и тест Snapdragon 810

В отличие от одноядерного теста AnTuTu, где Snapdragon 810 отставал от Snapdragon 805, прежде всего, из-за тактовой частоты, здесь показатель Snapdragon 810 на 24% выше, чем у Snapdragon 805. Тем не менее, он заметно отстает от архитектур с большим числом выполняемых инструкций на такт (A8X и Denver).

Обзор и тест Snapdragon 810

Преимущества процессоров A8X (3 ядра) и Tegra K1 (Denver 2 ядра) в многоядерном тесте заметно сокращается, поскольку у них меньше ядер. Как и в многоядерном тесте AnTuTu самым быстрым здесь является Snapdragon 810, показавший лучший балл в тесте Integer и второй результат в Floating Point. По сравнению со своим предшественником, Snapdragon 810 набрал на 78% баллов больше в тесте Integer и на 37% больше в тесте Floating Point. Чтобы лучше понять, в чем заключается преимущество Snapdragon 810, давайте посмотрим на разбивку результатов целочисленного теста (Integer) в таблице ниже.

Результаты теста Geekbench 3 Pro Integer

Тест Snapdragon 810 Tegra K1 (ARM) Snapdragon 805 Разница в процентах между 810 и 805
AES (одноядерный) 638 90 93 586%
AES (многоядерный) 3567 299 372 859%
Twofish (одноядерный) 1602 1358 1717 -7%
Twofish (многоядерный) 7588 4925 6749 12%
SHA1 (одноядерный) 4155 2081 1841 126%
SHA1 (многоядерный) 29235 8283 7238 304%
SHA2 (одноядерный) 1923 2321 2206 -13%
SHA2 (многоядерный) 9437 9127 7860 20%
BZip2 Compress (одноядерный) 1261 1117 1070 18%
BZip2 Compress (многоядерный) 5088 4042 3821 33%
JPEG Compress (одноядерный) 1269 1290 1381 -8%
JPEG Compress (многоядерный) 6255 5337 5684 10%
JPEG Decompress (одноядерный) 1451 1607 1162 25%
JPEG Decompress (многоядерный) 7148 5970 3841 86%
Sobel (одноядерный) 1404 1623 974 44%
Sobel (многоядерный) 6487 5961 3739 74%
Lua (одноядерный) 1475 1436 970 52%
Lua (многоядерный) 6521 5682 3671 78%
Dijkstra (одноядерный) 941 1401 1191 -21%
Dijkstra (многоядерный) 3984 3886 4211 -5%

Snapdragon 805 немного обгоняет Snapdragon 810 в некоторых одноядерных тестах благодаря преимуществу по тактовой частоте. Тем не менее, Snapdragon 810 почти во всех тестах показывает впечатляющий прирост скорости, особенно в многоядерных. Заметно выделяются тесты шифрования AES и SHA1, в которых отмечается огромный прирост производительности благодаря дополнительным командам криптографии SIMD в AArch64.

Кроме того, в таблице выше приведены результаты для ARM-версии Tegra K1, использующей ядра Cortex-A15. Новый 64-битный A57 явно превосходит своего 32-битного собрата. Tegra K1 даже имеет чуть более высокую тактовую частоту, хотя Snapdragon 810 имеет преимущество в более высокой пропускной способности памяти и другой межпроцессорной шины.

Geekbench 3 Pro Memory Bandwidth
STREAM Copy (одно ядро | много ядер) STREAM Scale (одно ядро | много ядер) STREAM Add (одно ядро | много ядер) STREAM Triad (одно ядро | много ядер)
Snapdragon 801 1830 | 2143 1099 | 1570 887 | 1320 1093 | 1514
Snapdragon 805 1617 | 2344 1360 | 2066 1180 | 1685 1376 | 1824
Snapdragon 810 1626 | 1947 1570 | 1916 1253 | 1509 1272 | 1554

Приведенная выше таблица показывает результаты теста памяти STREAM. Когда мы тестировали предсерийный планшет под управлением Snapdragon 810, в этом тесте наблюдался значительный дефицит производительности, так как шина памяти работала на половине своей скорости. Сравнивая показатели Snapdragon 805 и Snapdragon 810 сейчас, которые должны быть близки, поскольку чипы имеют одинаковую теоретическую пиковую пропускную способность, становится ясно, что шина памяти Snapdragon 810 работает на полной скорости. Также в этом тесте нет проблем с производительностью памяти, поскольку в некоторых случаях Snapdragon 810 немного обгоняет Snapdragon 805. Показатели многоядерного теста SoC Snapdragon 810 на 8-20% ниже, чем у Snapdragon 805. Но судя по превосходной общей многоядерной производительности, они не оказывают негативного воздействия.

Browsermark 2.1

Rightware Browsermark 2.1 – это синтетический браузерный тест, анализирующий различные характеристики, время загрузки, CSS, DOM, HTML5 Canvas, JavaScript и WebGL.

Обзор и тест Snapdragon 810

Snapdragon 810 показал неплохие результаты в Browsermark, обогнав Snapdragon 805 на 44%. Он вышел на один уровень с Tegra K1 на ядрах А15. В этом есть смысл, поскольку веб-тесты обычно не ограничены пропускной способностью памяти, и используемая нами старая версия Opera не 64-битная, в результате все преимущества AArch64 в Snapdragon 810 сводятся на нет.

Google Octane 2.0

Google Octane – это бенчмарк на базе JavaScript, который запускает множество сложных тестов, в том числе криптографию, трассировку лучей, синтаксический анализ, задержку компилятора и механизма сборки мусора, обработку строк и массивов, а также различные математические вычисления.

Обзор и тест Snapdragon 810

Результаты Octane схожи с Browsermark, здесь Snapdragon 810 превосходит Snapdragon 805 на 58% и финиширует прямо перед Tegra K1 (ARM).

Теперь мы имеем достаточное представление о производительности CPU и оперативной памяти, и можем перейти к тестированию GPU Adreno 430.

Тесты ядра GPU

3DMark (Anti-Detection)

Последняя версия пакета 3DMark предлагает три основных тестовых сюжета: Ice Storm, Cloud Gate и Fire Strike. На текущий момент Ice Storm уровня DirectX 9 является кроссплатформенным с поддержкой Windows, Windows RT, Android и iOS.

Ice Storm имитирует работу игр на OpenGL ES 2.0, используя шейдеры и физику встроенного движка Futuremark. Хотя тест был представлен только в мае прошлого года, с его экранным компонентом мобильные чипсеты справляются легко. Nvidia Tegra 4 и Qualcomm Snapdragon 800 без проблем проходят данный тест на разрешении Extreme ( 1080p). Однако Ice Storm Unlimited визуализирует сцену без участия экрана в разрешении 720p и показывает разницу в производительности между различными GPU.

Обзор и тест Snapdragon 810

В соответствии с заявленным Qualcomm приростом скорости в 30% Adreno 430 в Snapdragon 810 набрал на 36% больше баллов, чем Snapdragon 805. Тем не менее, в тесте Physics наблюдается значительная регрессия. Как мы уже отмечали в нашем обзоре iPhone 6, Futuremark провела исследование производительности Cyclone в тесте Physics и выявила проблемы «взаимодействия непоследовательных структур данных с памятью». Другими словами, контроллер памяти Apple оптимизирован для последовательных, а не случайных запросов доступа. Вполне возможно, что контроллер памяти в Snapdragon 810 также предпочитает последовательные данные. Упор Qualcomm на запись и воспроизведение 4K-видео, а также обработку изображений с высоким разрешением, безусловно, требует контроллер памяти, оптимизированный для последовательного доступа к данным.

На показатель теста Physics также может повлиять высокая задержка памяти при работе со случайным доступом с зависимостями. Но даже если бы это было правдой, это бы не объясняло падение производительности на 48%. Скорее всего, здесь имеет место сочетание факторов.

Basemark X 1.1

Rightware Basemark X на базе Unity 4.0 – это еще один кросс-платформенный графический тест для Android, iOS и Windows Phone 8. Он использует современные функции движка Unity через OpenGL ES 2.0. Такие функции — как сложные многоугольники, шейдеры с нормальными картами, сложные алгоритмы LoD и объемное попиксельное освещение (включая направленный и рассеянный свет), наряду с полным набором постобработки, системы частиц и физических эффектов, прекрасно демонстрируют, как должна работать и выглядеть современная игра. Современным SoC пока не удается достичь потолка значений в Basemark X.

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Похоже, Snapdragon 810 не очень любит Basemark X. Он примерно на 20% отстает от Snapdragon 805 в модулях Dunes и Hangar, как на средних, так и на высоких настройках. Учитывая, насколько Adreno 430 быстрее в 3DMark и в других графических тестах, мы предполагаем, что проблема в драйвере, а не в аппаратной части. Возможно проблема также в тепловом троттлинге, хотя мы не заметили чрезмерного повышения температуры во время выполнения тестов.

GFXBench 3.0 Corporate

Kishonti GFXBench 3.0 (ранее известный как GLBenchmark) является кросс-платформенным тестом GPU с поддержкой API OpenGL ES 2.0 и OpenGL ES 3.0. Он предлагает общие игровые сценарии, а также тесты, разработанные для конкретных подсистем.

Общие тесты включают и тест на работу в OpenGL ES 3.0 (Manhattan), и тест OpenGL ES 2.0 ( T-Rex), который достался нам от GFXBench v2.7.

Отдельные задачи включают следующие компоненты: Fill (заполнение), которое измеряет скорость прорисовки с помощью визуализации четырех слоев сжатых текстур; Alpha Blending – данный тест визуализирует слои полупрозрачных четверток с помощью несжатых текстур высокого разрешения; ALU для измерения производительности обработки шейдеров: Driver Overhead, измеряющий скорость работы CPU с графическим драйвером; и API, подразумевающий множество запросов на прорисовку и изменение состояния.

Подробный разбор этого бенчмарка можно найти в англоязычном обзоре «GFXBench 3.0: A Fresh Look At Mobile Benchmarking».

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Заявленное Qualcomm 30%-ное повышение производительности подтвердилось. Adreno 430 на 35% быстрее, чем Adreno 420 в тесте Manhattan, и на 27% быстрее в тесте T-Rex. Однако этот результат не дотягивает до Nvidia Tegra X1 на базе архитектуры Kepler, который уходит в полный отрыв. Очень любопытно, сколько энергии потребляет X1.

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Обзор и тест Snapdragon 810

Snapdragon 810 на 9% медленнее, чем Snapdragon 805 в тесте Alpha Blending, из-за ограниченной пропускной способности памяти, что соответствует результатам многоядерного теста STREAM. Учитывая 68%-ное преимущество Adreno 430 перед Adreno 420 в тесте ALU, можно сделать вывод, что он действительно содержит дополнительные шейдерные ресурсы. В SoC Snapdragon 810 также увеличилась скорость заполнения, в результате он выходит на второе место после Tegra X1. Еще Qualcomm заметно увеличила скорость в тесте driver overhead.

Если не обращать внимания на возможные проблемы с драйверами в Basemark X, то Adreno 430 обеспечивает обещанное 30%-е увеличение производительности. Если GPU сможет поддерживать этот уровень производительности без троттлинга, то 430-й можно будет назвать значительным прогрессом по сравнению с «ограниченным температурой» Adreno 420.

Обзор и тест Snapdragon 810 | Заключение

Из-за слухов о проблемах в архитектуре, Snapdragon 810 вызвал волну всевозможных обсуждений на профессиональных форумах и в прессе. К счастью, наши тесты доказали, что они в большей степени не подтвердились.

Говоря о предполагаемой проблеме с контроллером памяти, данные наших тестов показывают, что Snapdragon 810 в целом работает на уровне с Snapdragon 805. Многоядерный тест памяти STREAM продемонстрировал небольшое снижение производительности памяти, но в других бенчмарках этого не наблюдалось. Snapdragon 810 очень хорошо справился с многоядерным тестом System. По данным бенчмарка 3DMark Physics можно предположить, что контроллер памяти в SoC Snapdragon 810 более оптимизирован для последовательных, а не случайных операций, подобно SoC Cyclone Apple. Но нас беспокоят задержки памяти. Этот момент заслуживает отдельного тестирования, когда на рынок поступят серийные модели. Хотя, учитывая уже полученные результаты, даже если и есть повышенная задержка, она не так велика, как это муссировалось в слухах.

Обзор и тест Snapdragon 810

Игры: Snapdragon 810 демонстрирует более низкую температуру поверхности устройства, чем Snapdragon 800

В ходе тестирования Qualcomm обсуждала важность температуры поверхности устройства и ее влияние на впечатления от продукта. На графике выше показаны результаты тестов температуры поверхности, который Qualcomm провела с двумя устройствами в игре Asphalt 8. Они показывают, что планшет с SoC Snapdragon 810 холоднее, чем устройства под управлением Snapdragon 800. Если частота кадров была ограничена значением 30 кадров в секунду, то результаты кажутся правдоподобными. Благодаря гораздо более мощному GPU, Snapdragon 810 может понизить частоту и уменьшить напряжение, но при этом обеспечивать скорость в 30 кадров в секунду, в то время как старший SoC 800, скорее всего, должен работать на полной скорости, чтобы поддерживать 30 FPS. Но если OEM-производители не станут внедрять программные функции ограничения производительности (такие как функция Shield Power Control), а опираться только на температурные пределы чипа, эти графики не будут иметь практического смысла.

Мы не можем сделать окончательный вывод касательно вопроса перегрева, пока тщательно не протестируем серийную модель в тестах с интенсивными и длительными нагрузками. Тем не менее, после прогона тестов один за другим (без времени на охлаждение, как мы обычно делаем) мы не наблюдали ухудшения производительности или заметного увеличения температуры поверхности. Хотя MDP-планшет Qualcomm немного толще, чем будущие серийные планшеты, полученные нами данные обнадеживают.

Производительность 64-битного A57 от ARM значительно повысилась по сравнению с предыдущей архитектурой Krait, которая, безусловно, выработала свой ресурс. Особенно впечатляет многоядерная производительность Snapdragon 810, поскольку его эффективная архитектура AArch64 и новые инструкции шифрования обеспечивают значительное ускорение некоторых задач. Однако A57 по-прежнему ограничен IPC и отстает от архитектур Apple A8X и Nvidia Denver в однопоточных задачах.

Производительность GPU также повысилась, и Adreno 430 смог продемонстрировать обещанный Qualcomm 30%-ный прирост скорости. Регресс в Basemark X, наряду с несколькими сбоями в игровых тестах, наводят на мысль о необходимости оптимизации программного обеспечения, но с аппаратной точки зрения с GPU все в порядке.

Опираясь на наш первоначальный анализ, слухи о серьезных проблемах Snapdragon 810, кажется, сильно преувеличены. Нам еще нужно более тщательно изучить производительность контроллера памяти и проверить энергопотребление/температуру, прежде чем мы сможем присудить новому SoC нашу награду, но кажется, что Snapdragon 810 уже готов к тому, чтобы стать сердцем для нового поколения флагманских смартфонов и планшетов. В зависимости от потребляемой мощности, X1 может составить ему конкуренцию в сегменте планшетов, а если Samsung сможет перенести свой Exynos на техпроцесс 14 нм FinFET, Qualcomm, наконец, получит серьезного конкурента в нише смартфонов. Да, этот год должен быть весьма интересным.

 

 

Комментарии запрещены.