Сравнительное тестирование Intel Pentium 4 2,4 ГГц, AMD Athlon XP 2100+ и их предшественников (original) (raw)
Совсем недавно мы проводили сравнение «топовых» на тот момент настольных процессоров, перешагнувших 2-гигагерцовый рубеж. К сегодняшнему дню в линейках у обеих компаний появилось по новой модели, а значит, есть повод провести очередное сравнение или исправить недочеты старого. Исследование новых моделей всегда интересно, если те различаются архитектурно, но сегодня не тот случай. Старые ядра, следующая ступень коэффициентов умножения — вот и «новые процессоры». Заслуживает внимания «обратный» факт: Athlon XP 2100+ — это последняя модель на ядре Palomino, даже не значившаяся ранее в плане выпуска и прикрывающая место до выхода нового ядра Thoroughbred.
У процессоров Intel тоже грядут изменения. Совсем скоро состоится переход на шину 533 МГц, так что имеющийся у нас экземпляр тоже в некотором роде «прощальный».
Что ж, постараемся извлечь максимальную пользу из этого тестирования. Во-первых, можно сравнить новую модель с предшествующей, и по разнице показателей в тестах оценивать масштабируемость. Во-вторых, можно ввести в строй свежие версии используемых тестов и добавить новые — благо, такие статьи обычно для промежуточного сравнения не используют. Наконец, в-третьих, всегда остаются актуальными совершенно бесполезные и совершенно беспроигрышные попытки выявить абсолютного лидера по скорости.
Для решения первой задачи добавим в пару к Intel Pentium 4 2,4 ГГц 2,2-гигагерцовую модель, а к AMD Athlon XP 2100+ — Athlon XP 2000+, и протестируем каждую пару на одном и том же своем чипсете. Опираясь на опыт уже упомянутого большого сравнения, для решения третьей задачи выберем для процессора Intel три наиболее интересные платформы, а для процессора AMD ограничимся одной — самой быстрой практически везде VIA KT333 + DDR333. Что же до обновления тестового набора — пожалуйте в главу с результатами.
Условия тестирования
Тестовый стенд:
- Процессоры:
- Intel Pentium 4 2,2 ГГц, Socket 478
- Intel Pentium 4 2,4 ГГц, Socket 478
- AMD Athlon XP 2000+ (1667 МГц), Socket 462
- AMD Athlon XP 2100+ (1733 МГц), Socket 462
- Материнские платы:
- EPoX 4BDA2+ (BIOS от 05/02/2002) на базе i845D
- ASUS P4T-E (версия BIOS 1005E) на базе i850
- Abit SD7-533 (версия BIOS 7R) на базе SiS 645
- Soltek 75DRV5 (версия BIOS T1.1) на базе VIA KT333
- 256 МБ PC2700 DDR SDRAM DIMM Samsung, CL 2 (использовалась как DDR266 на i845D)
- 2x256 МБ PC800 RDRAM RIMM Samsung
- ASUS 8200 T5 Deluxe GeForce3 Ti500
- IBM IC35L040AVER07-0, 7200 об/мин, 40 ГБ
- CD-ROM ASUS 50x
Программное обеспечение:
- Windows 2000 Professional SP2
- DirectX 8.1
- Intel chipset software installation utility 3.20.1008
- Intel Application Accelerator 2.0
- SiS AGP Driver 1.09
- VIA 4-in-1 driver 4.38
- NVIDIA Detonator v22.50 (VSync=Off)
- CPU RightMark RC0.99
- RazorLame 1.1.4 + Lame codec 3.89
- RazorLame 1.1.4 + Lame codec 3.91
- VirtualDub 1.4.7 + DivX codec 4.12
- VirtualDub 1.4.7 + DivX codec 5.0 Pro
- WinAce 2.11
- WinZip 8.1
- eTestingLabs Business Winstone 2001
- eTestingLabs Content Creation Winstone 2002
- BAPCo & MadOnion SYSmark 2001 Office Productivity
- BAPCo & MadOnion SYSmark 2001 Internet Content Creation
- BAPCo & MadOnion SYSmark 2002 Office Productivity
- BAPCo & MadOnion SYSmark 2002 Internet Content Creation
- 3DStudio MAX 4.26
- SPECviewperf 6.1.2
- MadOnion 3DMark 2001 SE
- idSoftware Quake III Arena v1.30
- Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
- Expendable Demo
- DroneZmarK
Плата | EPoX 4BDA2+ | ASUS P4T-E | Abit SD7-533 | Soltek 75DRV5 |
---|---|---|---|---|
Чипсет | i845D (RG82845 + FW82801BA) | i850 (KC82850 + FW82801BA) | SiS 645 (SiS 645 + SiS 961) | VIA KT333 (KT333 + VT8233A) |
Поддержка процессоров | Socket 478, Intel Pentium 4 | Socket 462, AMD Duron, AMD Athlon, AMD Athlon XP | ||
Память | 2 DDR | 4 RDRAM | 3 DDR | 3 DDR |
Слоты расширения | AGP/ 6 PCI/ CNR | AGP/ 5 PCI/ CNR | AGP/ 5 PCI | AGP/ 5 PCI/ CNR |
Порты ввода/ вывода | 1 FDD, 2 COM, 1 LPT, 2 PS/2 | |||
USB | 2 USB 1.1 + 1 разъем на 2 USB 1.1 | 2 USB 1.1 + 1 разъем на 2 USB 1.1 | 2 USB 1.1 + 2 разъема по 2 USB 1.1 | 2 USB 1.1 + 1 разъем на 2 USB 1.1 |
Интегрированный IDE-контроллер | ATA100 | ATA100 | ATA100 | ATA133 |
Внешний IDE-контроллер | HighPoint HPT372 | - | - | - |
Звук | AC'97 codec, Avance Logic ALC201A | AC'97 codec, Avance Logic ALC201A | PCI Audio, C-Media CMI8738/PCI-6ch-MX | AC'97 codec, VIA VT1611A |
Встроенный сетевой контроллер | - | - | - | - |
I/O-контроллер | Winbond W83627HF-AW | Winbond W83627GF-AW | Winbond W83697HF | ITE IT8705F |
BIOS | 2 Мбит Award Modular BIOS v.6.00PG | 2 Мбит Award Medallion BIOS v.6.00 | 2 Мбит Award Modular BIOS v.6.00PG | 2 Мбит Award Modular BIOS v. 6.00PG |
Форм-фактор, размеры | ATX, 30,5x24,5 см | ATX, 30,5x24,5 см | ATX, 30,5x23 см | ATX, 30,5x22,5 см |
Результаты тестов
Мы уже не раз пытались сформулировать критерии оптимального процессорного теста. Конечно, идеал недостижим, но сегодня мы делаем свой первый шаг в его направлении — запускаем проект CPU RightMark (CPU.RightMark.org). За подробностями и новостями проекта отсылаем вас на его сайт, здесь же приведем краткие разъяснения, которые должны помочь вам понять суть тестового эксперимента и его инструментарий.
Итак, CPU RightMark — это тест процессора и подсистемы памяти, осуществляющий численное моделирование физических процессов и решение задач из области трехмерной графики. Говоря очень кратко, один блок программы численно решает систему дифференциальных уравнений, соответствующую моделированию в реальном времени поведения системы многих тел, другой же блок визуализирует найденные решения также в режиме реального времени. Каждый блок реализован в нескольких вариантах, оптимизированных под различные системы процессорных команд. Важно отметить, что тест не является чисто синтетическим, а написан с использованием приемов и средств программирования, типичных для задач своей области (трехмерных графических приложений).
Блок решения системы дифференциальных уравнений написан с использованием набора команд сопроцессора x87, а также имеет вариант, оптимизированный для набора SSE2 (c векторизацией цикла: две итерации цикла заменяются одной, но все операции производятся с двухэлементными векторами). Скорость работы этого блока свидетельствует о производительности связки процессор+память при выполнении математических расчетов с использованием действительных чисел двойной точности (характерно для современных научных задач: геометрических, статистических, задач моделирования).
Результаты данного подтеста показывают, что скорость работы с инструкциями x87 FPU у Athlon XP выше, однако за счет поддержки набора SSE2 (естественно, отсутствующей у Athlon XP) Pentium 4 оказывается гораздо быстрее. Подчеркнем, что в данном блоке не используются SSE-команды, поэтому результаты прогона теста в режимах с задействованием SSE опущены (они просто совпадают с соответствующими MMX/FPU и MMX/SSE2). Отметим почти идеальную масштабируемость теста по частоте CPU — здесь влияние памяти почти сведено к нулю за счет эффективного кэширования и характера работы блока с интенсивными вычислениями при сравнительно малом объеме обмена данными.
Блок визуализации в свою очередь состоит из двух частей: блока предварительной обработки сцены и блока трассировки лучей и отрисовки. Первый написан на С++ и откомпилирован с использованием набора команд сопроцессора x87. Второй написан на ассемблере и имеет несколько вариантов, оптимизированных под различные наборы инструкций: FPU+GeneralMMX, FPU+EnhancedMMX и SSE+EnhancedMMX (подобное разделение на блоки является типичным для имеющихся реализаций задач визуализации в реальном времени). Суммарная скорость работы блока визуализации свидетельствует о производительности связки процессор+память при выполнении геометрических расчетов с использованием действительных чисел одинарной точности (типично для трехмерных графических программ, оптимизированных под SSE и Enhanced MMX).
Опять же, скорость работы с инструкциями x87 FPU у Athlon XP оказывается значительно выше, однако использование при вычислениях SSE вновь выводит вперед Pentium 4, несмотря на поддержку этого набора процессорами Athlon XP. При этом по производительности на мегагерц оба процессора идут практически вровень, по суммарной же — Pentium 4 получает отрыв, соответствующий его более высокой частоте. Подчеркнем, что в данном блоке не используются SSE2-команды, поэтому результаты прогона теста в режимах с задействованием SSE2 опущены (они просто совпадают с соответствующими MMX/FPU и SSE/FPU). Отметим отличную производительность связки Pentium 4 + SiS 645, вызванную, очевидно, наибольшей скоростью доступа к памяти при малой латентности. Вообще, процесс рендеринга сопровождается довольно активной пересылкой данных, что делает вклад чипсета и типа используемой памяти в суммарную производительность системы значительным.
Суммарная производительность системы рассчитывается по формуле: Overall = 1/(1/MathSolving + 1/Rendering), так что очень значительный выигрыш Pentium 4 при использовании SSE2 в блоке расчета физической модели почти не дает прироста производительности без задействования SSE в блоке визуализатора. Зато при выполнении вычислений с помощью SSE добавка от включения SSE2 составляет вполне внушительную величину. (Отметим, что данная характеристика справедлива для конкретных выбранных условий тестирования, возможности же настройки теста позволяют задать практически любое соотношение времени просчета физической модели и визуализации (путем смены экранного разрешения или точности расчетов).) Так как Athlon XP не поддерживает набор SSE2, его производительность достаточно очевидно зависит от скорости отрисовки сцен, где он уступает Pentium 4 при использовании набора SSE, хотя и остается абсолютным чемпионом по «чистой» скорости выполнения операций при помощи только MMX и FPU. Отметим, что из протестированных чипсетов под Pentium 4 i845D смотрится чуть получше i850 (вероятно, из-за большей латентности у последнего), а чемпионом является SiS 645 по причине, указанной выше.
Довольно давно уже доступна новая версия популярного кодировщика Lame, но у нас все не было случая ее применить. В рамках подготовки данной статьи было проведено тестирование и старой, использовавшейся нами до сих пор версии 3.89, и последней официально доступной версии 3.91. Результаты совпали полностью (в пределах погрешности), что вполне согласуется с отсутствием упоминания о скоростной оптимизации кода в списке нововведений программы. (Кстати, кодировщик уже больше полугода корректно поддерживает работу со всеми доступными расширенными мультимедийными наборами команд и регистров.) Тест, как видите, превосходно масштабируется по частоте процессора, так как и здесь осуществляется эффективное предварительное кэширование данных, но остается ряд вопросов по довольно низкой производительности Pentium 4 на i850 и SiS 645. Самым разумным нам кажется предположение, что такое влияние на производительность оказывает BIOS плат: продукт от Abit мы еще не видели в деле, а вот плата от ASUS на i850 нам хорошо знакома, причем при использовании предыдущей версии прошивки (еще раз отсылаем вас к прошлому сравнительному тестированию) подобного спада не наблюдалось. Athlon XP в этом тесте по-прежнему лидер, причем для победы вполне хватает и версии 2000+.
Новая версия 5.0 кодека DivX вышла совсем недавно, но учитывая огромную популярность этого продукта, нетрудно предсказать его активное использование уже в ближайшее время, без ожидания выпуска новых релизов с исправлениями ошибок. Что ж, мы следуем в русле народных пожеланий и переходим к применению версии DivX 5.0 Pro. Мы также провели аналогичное тестирование c версией DivX 4.12, и результаты сравнения кодеков таковы: операция кодирования ускоряется весьма ощутимо — более чем на минуту, причем вне зависимости от процессора, чипсета и типа памяти. Также отметим, что DivX 5.0 Pro формирует чуть больший выходной видеофайл. К сравнению же собственно процессоров в этом тесте нам добавить нечего — все уже было сказано в прошлой статье, а вот на неплохую масштабируемость кодирования стоит обратить внимание.
В архивировании WinAce, как и при кодировании MPEG4, влияние подсистемы памяти (вследствие большого объема пересылаемых данных) примерно в два раза скрадывает эффект от увеличения частоты процессора. Athlon XP в этом тесте все еще лучше своего визави.
В архивировании WinZip отметим разве что некоторое отставание Pentium 4 на SiS 645 и полное равенство в остальных случаях.
Результаты Winstones выглядят на редкость логично и понятно, но памятуя о частых необъяснимых провалах и всплесках в этих тестах в прошлом, мы, пожалуй, воздержимся от комментариев.
Напомню, что до сих пор нам приходилось говорить решительное «не верим!» результатам Athlon XP в тесте SYSmark, так как в силу криворукости отдельных программистов версия WME 7.0, входящая в состав приложений группы Internet Content Creation этого теста, не умела определять поддержку набора инструкций SSE у Athlon XP. К счастью, мы наконец начинаем тестирование в обновленной версии бенчмарка — SYSmark 2002, в которой эта проблема решена.
Вкратце об отличиях в составе приложений тестов:
SYSmark 2001 | SYSmark 2002 |
---|---|
Office Productivity | |
Dragon NaturallySpeaking Preferred 5 | |
McAfee VirusScan 5.13 | |
Microsoft Access 2000 | Microsoft Access 2002 |
Microsoft Excel 2000 | Microsoft Excel 2002 |
Microsoft Outlook 2000 | Microsoft Outlook 2002 |
Microsoft PowerPoint 2000 | Microsoft PowerPoint 2002 |
Microsoft Word 2000 | Microsoft Word 2002 |
Netscape Communicator 6.0 | |
WinZip 8.0 | |
Internet Content Creation | |
Adobe Photoshop 6.0 | Adobe Photoshop 6.0.1 |
Adobe Premiere 6.0 | |
Macromedia Dreamweaver 4 | |
Macromedia Flash 5 | |
Microsoft Windows Media Encoder 7.0 | Microsoft Windows Media Encoder 7.1 |
Как видите, никаких замен нет, только обновления версий. Алгоритм подсчета итоговых баллов официально известных изменений не претерпел, хотя мы бы предположили пересчет некоторых коэффициентов пропорциональности.
Интересно сравнение результатов старого и нового пакетов в офисном подтесте: во-первых, был, вероятно, введен некий корректирующий коэффициент, что привело к уменьшению показателей обеих сторон. Во-вторых, очевидно, в силу переделанного пакета Microsoft Office, Pentium 4 начал выигрывать в этом подтесте, хотя в SYSmark 2001 обе процессорные платформы шли вровень.
В создающем контент подтесте ситуация еще интереснее: за счет нормального распознавания SSE у Athlon XP в MS WME 7.1 процессор AMD прибавил, но зато в состав подтеста нового пакета входит переписанная для поддержки SSE2 версия Adobe Photoshop 6.0.1, так что Pentium 4 получает даже больший прирост.
В итоге, от сомнительного лидерства в SYSmark Pentium 4 переходит к лидерству очевидному. Обратите также внимание на то, как здорово растет производительность Pentium-систем в этом тесте с ростом частоты процессора, и на почти отсутствующий аналогичный эффект для Athlon-системы.
Рендеринг в 3DStudio MAX отлично масштабируется и обычно не демонстрирует признаков зависимости от скорости работы с памятью, так что нам остается только гадать, что же такое наворотили в последней прошивке BIOS для ASUS P4T-E инженеры компании. На диаграмме хорошо видно, что рендеринг на Athlon XP ускоряется пропорционально увеличению частоты процессора, но как раз за счет гораздо более высокой частоты Pentium 4 2,4 ГГц уходит в этом тесте в отрыв, хотя скорость еще 2,2-гигагерцовой модели была примерно равна Athlon XP 2000+.
В SPECviewperf, в общем, ничего интересного: результаты почти везде равные, с легким перевесом Pentium 4, и лишь в DX-06 заметно впереди Athlon XP. Обратите внимание на то, что скорость тестов практически не зависит от скорости процессоров.
При переходе на новый процессор Intel игровой бенчмарк делает небольшой рывок, но это не помогает ему дотянуть даже до результатов Athlon XP 2000+.
Добавление к тестовым играм Return to Castle Wolfenstein, основанной на движке Quake III, ситуацию, естественно, никак не изменило. Более того, относительные показатели в этих двух играх похожи практически один в один. Приплюсуем сюда же DroneZ, отличающуюся движком, но не характером результатов, и остается только древняя Expendable — негусто для Athlon XP… Отметим, что все игры примерно одинаково неплохо масштабируются по частоте процессора, что тоже играет на руку Intel.
Выводы
Прощание ядру Palomino не слишком удалось: нельзя сказать, что Athlon XP так уж сильно отстает от своего соперника, да и далеко не везде это отставание вообще имеет место, но тенденции налицо. С реальной ли частотой, с PR-рейтингом ли — AMD отстает от Intel по волшебным цифрам в названии процессоров, а прирост производительности на увеличение частоты (какой бы «дутой» ее ни считали у Pentium 4) в большинстве наших тестов дает преимущество в абсолютных показателях именно линейке Pentium 4. Многие приложения «узнали», наконец, про поддержку SSE в Athlon XP, что дало некоторый всплеск, но это тупик, а вот оптимизация под SSE2 еще далеко не завершена, и чем дальше — тем больше приложений будет переходить из «лагеря AMD» в «лагерь Intel».
Впрочем, пост свой Palomino оставляет все же в приличном состоянии. Отставание последней модели от имеющихся конкурентов отнюдь не катастрофическое, цена привлекательная, а мы с большим интересом будет наблюдать за попытками AMD вернуть лидерство с новым ядром.