Флоп | это... Что такое Флоп? (original) (raw)
Производительность суперкомпьютеров | ||
---|---|---|
Название | год | FLOPS |
флопс | 1941 | 100 |
килофлопс | 1949 | 103 |
мегафлопс | 1964 | 106 |
гигафлопс | 1987 | 109 |
терафлопс | 1997 | 1012 |
петафлопс | 2008 | 1015 |
эксафлопс | − | 1018 |
зеттафлопс | − | 1021 |
йоттафлопс | − | 1024 |
ксерафлопс | − | 1027 |
FLOPS (или flops или flop/s)(акроним от англ. Floating point Operations Per Second, произносится как флопс) — величина, используемая для измерения производительности компьютеров, показывающая, сколько операций с плавающей запятой в секунду выполняет данная вычислительная система.
Поскольку современные компьютеры обладают высоким уровнем производительности, более распространены производные величины от FLOPS, образуемые путём использования стандартных приставок системы СИ.
Содержание
- 1 Флопс как мера производительности
- 2 Обзор производительности реальных систем
- 3 Примечания
- 4 См. также
- 5 Ссылки
Флопс как мера производительности
Как и большинство других показателей производительности, данная величина определяется путём запуска на испытуемом компьютере тестовой программы, которая решает задачу с известным количеством операций и подсчитывает время, за которое она была решена. Наиболее популярным тестом производительности на сегодняшний день является программа LINPACK, используемая, в том числе, при составлении рейтинга суперкомпьютеров TOP500.
Одним из важнейших достоинств показателя флопс является то, что он до некоторых пределов может быть истолкован как абсолютная величина и вычислен теоретически, в то время как большинство других популярных мер являются относительными и позволяют оценить испытуемую систему лишь в сравнении с рядом других. Эта особенность даёт возможность использовать для оценки результаты работы различных алгоритмов, а также оценить производительность вычислительных систем, которые ещё не существуют или находятся в разработке.
Границы применимости
Несмотря на кажущуюся однозначность, в реальности флопс является достаточно плохой мерой производительности, поскольку неоднозначным является уже само его определение. Под «операцией с плавающей запятой» может скрываться масса разных понятий, не говоря уже о том, что существенную роль в данных вычислениях играет разрядность операндов, которая также нигде не оговаривается. Кроме того, величина флопс подвержена влиянию очень многих факторов, напрямую не связанных с производительностью вычислительного модуля, таких как: пропускная способность каналов связи с окружением процессора, производительность основной памяти и синхронность работы кэш-памяти разных уровней.
Всё это, в конечном итоге, приводит к тому, что результаты, полученные на одном и том же компьютере при помощи разных программ, могут существенным образом отличаться, более того, с каждым новым испытанием разные результаты можно получить при использовании одного алгоритма. Отчасти эта проблема решается соглашением об использовании однообразных тестовых программ (той же LINPACK) с осреднением результатов, но со временем возможности компьютеров «перерастают» рамки принятого теста и он начинает давать искусственно заниженные результаты, поскольку не задействует новейшие возможности вычислительных устройств. А к некоторым системам общепринятые тесты вообще не могут быть применены, в результате чего вопрос об их производительности остаётся открытым.
Так, например, 24 июня 2006 года общественности был представлен суперкомпьютер Йокогама), с рекордной теоретической производительностью в 1 Пфлопс. Однако данный компьютер не является компьютером общего назначения и приспособлен для решения узкого спектра конкретных задач, в то время как стандартный тест LINPACK на нём выполнить невозможно в силу особенностей его архитектуры.
Также, высокую производительность на специфичных задачах показывают графические процессоры современных видеокарт и игровые приставки. К примеру, заявленная производительность игровой приставки Xbox 360 составляет 1 Тфлопс, а приставки PlayStation 3 и вовсе 2 Тфлопс, что ставит их в один ряд с суперкомпьютерами начального уровня. Столь высокие показатели обеспечиваются тем, что операции с трёхмерной графикой, которые они в основном выполняют, очень хорошо поддаются распараллеливанию, что с успехом используется в графических процессорах. Однако эти процессоры не в состоянии выполнять большинство задач общего назначения, и их производительность не поддаётся оценке теста LINPACK и сравнению с другими системами.
Причины широкого распространения
Несмотря на большое число существенных недостатков, показатель флопс продолжает с успехом использоваться для оценки производительности, базируясь на результатах теста LINPACK. Причины такой популярности обусловлены, во-первых, тем, что флопс, как говорилось выше, является абсолютной величиной. А, во-вторых, очень многие задачи инженерной и научной практики, в конечном итоге, сводятся к решению систем линейных алгебраических уравнений, а тест LINPACK как раз и базируется на измерении скорости решения таких систем. Кроме того, подавляющее большинство компьютеров (включая суперкомпьютеры), построены по классической архитектуре с использованием стандартных процессоров, что позволяет использовать общепринятые тесты с большой достоверностью. Как показано на процессорах Intel Core 2 Quad Q9450 2.66ГГц @3.5ГГц и Intel Core 2 Duo E8400 3000 МГц (2008) программа LINPACK не использует решения алгебраических выражений, так как любая операция не может идти быстрее, чем 1 такт процессора. Так для процессоров Intel Core 2 Quad один такт требует один-два герца. Так как для задач с плавающей запятой: деление/умножение, сложение/вычитание — требуется намного больше одного такта, то видно, что выдать 48 Гигафлопс и 18,5 гигафлопса соответственно данные процессоры не могли. Часто вместо операции деления с плавающей запятой используется загрузка данных в режиме ДМА из оперативной памяти в стек процессора. Так работает программа LINPACK в некоторых тестах, но, строго говоря, результат не является значением флопс.
Примечание: замечание о невозможности выполнения более одной операции за такт абсолютно некорректно, так как все современные процессоры в каждом своем ядре содержат несколько исполнительных блоков каждого типа (в том числе и для операций с плавающей точкой) работающих параллельно и могут выполнять более одной инструкции за такт. Данная особенность архитектуры называется суперскалярность и впервые появилась еще в самом первом процессоре
Обзор производительности реальных систем
Из-за высокого разброса результатов теста LINPACK, приведены примерные величины, полученные путём осреднения показателей на основе информации из разных источников. Производительность игровых приставок и распределённых систем (имеющих узкую специализацию и не поддерживающих тест LINPACK) приведена в справочных целях в соответствии с числами, заявленными их разработчиками. Более точные результаты с указанием параметров конкретных систем можно получить, например, на сайте The Performance Database Server.
Суперкомпьютеры
- Компьютер ЭНИАК, построенный в 1946 году, при массе 27 т и энергопотреблении 150 кВт, обеспечивал производительность в 300 флопс
- IBM 709 (1957) — 5 кфлопс
- БЭСМ-6 (1968) — 1 Мфлопс (операций деления)
- Cray-1 (1974) — 160 Мфлопс
- БЭСМ-6 на базе Эльбрус-1К2 (1980-х) — 6 Мфлопс (операций деления)
- Cray Y-MP (1988) — 2,3 Гфлопс
- ASCI Red (1993) — 1 Тфлопс
- Blue Gene/L (2006) — 478,2 Тфлопс
- Jaguar (суперкомпьютер) (2008) — 1,059 Пфлопс
- IBM Roadrunner (2008) — 1,105 Пфлопс [1]
- IBM Sequoia (2012) — 20 Пфлопс [2]
Персональные компьютеры
- PC/XT (1983) — 6,9 кфлопс
- ПК на основе процессора 80386 (1985) с тактовой частотой 40 МГц — 0,6 Мфлопс
- Intel
- Intel Pentium II 300 МГц (1997) — 50 Мфлопс
- Intel Pentium III 1 ГГц (1999) — 320 Мфлопс
- AMD Athlon 64 2,211 ГГц (2003) — 840 Мфлопс[3]
- Intel Core 2 Duo 2,4 ГГц (2006) — 1,3 Гфлопс
Процессоры
- Intel Core 2 Duo E8400 3.0ГГц (2008) — 18.6 Гфлопс При использовании стандартной версии LINPACK 10
- Intel Core 2 Duo E8400 3.0ГГц @4.0ГГц (2008) — 25 Гфлопс (LINPACK Benchmark 10.0 64-бит) в Windows Vista x64 Ultimate SP1
- Intel Core 2 Quad Q9450 2.66ГГц @3.5ГГц — 48 ГФлопс (LINPACK Benchmark 10.0 64-бит) в Windows 2003sp2 x64
Карманные компьютеры
- КПК на основе процессора Samsung S3C2440 400 МГц (архитектура
- Intel XScale PXA270 520 МГц — 1,6 Мфлопс Intel XScale PXA270 624 МГц — 2 Мфлопс
Распределённые системы
Данные приведены по состоянию на 23 июня 2008 года
- Folding@home — более 4 Пфлопс[4]
- [5]
- SETI@home — более 560 Тфлопс[6]
- Einstein@Home — более 157 Тфлопс.[7]
Игровые приставки
- Dreamcast — 1,4 Мфлопс
- Xbox — 6,3 Гфлопс
- PlayStation 2 — 6,2 Гфлопс
- Sony PlayStation Portable — 2,6 Мфлопс
- Gamecube — 10,5 Мфлопс
- Microsoft Xbox 360 — 1 Тфлопс
- Sony PlayStation 3 — 2 Тфлопс [8]
Человек и калькулятор
Калькулятор неслучайно попал в одну категорию вместе с человеком, поскольку, хотя он и является электронным устройством, содержащим процессор, память и устройства ввода/вывода, режим его работы кардинально отличается от режима работы компьютера. Калькулятор выполняет одну операцию за другой с той скоростью, с какой их запрашивает человек-оператор. Время, проходящее между операциями, определяется возможностями человека и существенно превышает время, которое затрачивается непосредственно на вычисления. Можно сказать, что в среднем производительность обычного карманного калькулятора составляет 10 флопс.
Человек, пользуясь лишь ручкой и бумагой, выполняет операции с плавающей запятой очень медленно и, часто, с большой ошибкой. Говоря о производительности нашего вычислительного аппарата, придётся использовать такие единицы как миллифлопс и даже микрофлопс. Тем не менее, мозг человека в реальном времени может выполнять столь сложные операции как синтез и распознавание речи и образов, координацию в пространстве и множество других, недоступных пока даже самым мощным суперкомпьютерам.
Примечания
- ↑ IBM создала самый мощный суперкомпьютер в мире(рус.), Lenta.ru, 9 июня 2008 года
- ↑ IBM создаст мощнейший суперкомпьютер(рус.)
- ↑ При использовании нестандартной версии LINPACK BENCHMARK 2007 года, реализующей все преимущества 64-битного процессора, это число поднимается до 1 Гфлопс
- ↑ Folding@Home
- ↑ BOINC
- ↑ SETI at home
- ↑ Einstein@Home — Server Status
- ↑ SONY COMPUTER ENTERTAINMENT INC. TO LAUNCH ITS NEXT GENERATION COMPUTER ENTERTAINMENT SYSTEM, PLAYSTATION®3 IN SPRING 2006(англ.)
См. также
Ссылки
- TOP500 Рейтинг суперкомпьютеров TOP500 (англ.)
- The Performance Database Server Большая база данных производительности вычислительных систем (англ.)
- Roy Longbottom’s PC Benchmark Collection Подборка тестовых программ для ПК (включая LINPACK) и результатов испытаний (англ.)
- Linpack CPU Benchmark for Pocket PC Версия LINPACK для КПК (англ.)
- История суперкомпьютеров (англ. яз; pdf)
Wikimedia Foundation.2010.