[Python-Dev] Patch to speed up non-tracing case in PyEval_EvalFrameEx (2% on pybench) (original) (raw)

Mon Dec 1 02:54:02 CET 2008

Rounds: 10
Warp:   10
Timer:  time.time

Machine Details:
   Platform ID:    Darwin-9.5.0-i386-32bit
   Processor:      i386

Python:
   Implementation: CPython
   Executable:
Rounds: 10
Warp:   10
Timer:  time.time

Machine Details:
   Platform ID:    Darwin-9.5.0-i386-32bit
   Processor:      i386

Python:
   Implementation: CPython
   Executable:
      BuiltinFunctionCalls:   127ms   130ms   -2.4%   129ms   132ms   -2.1%
       BuiltinMethodLookup:    90ms    93ms   -3.2%    91ms    94ms   -3.1%
             CompareFloats:    88ms    91ms   -3.3%    89ms    93ms   -4.3%
     CompareFloatsIntegers:    97ms    99ms   -2.1%    97ms   100ms   -2.4%
           CompareIntegers:    79ms    82ms   -4.2%    79ms    85ms   -6.1%
    CompareInternedStrings:    90ms    92ms   -2.4%    94ms    94ms   -0.9%
              CompareLongs:    86ms    83ms   +3.6%    87ms    84ms   +3.5%
            CompareStrings:    80ms    82ms   -3.1%    81ms    83ms   -2.3%
            CompareUnicode:   103ms   105ms   -2.3%   106ms   108ms   -1.5%
ComplexPythonFunctionCalls:   139ms   137ms   +1.3%   140ms   139ms   +0.1%
             ConcatStrings:   142ms   151ms   -6.0%   156ms   154ms   +1.1%
             ConcatUnicode:    87ms    92ms   -5.4%    89ms    94ms   -5.7%
           CreateInstances:   142ms   144ms   -1.4%   144ms   145ms   -1.1%
        CreateNewInstances:   107ms   109ms   -2.3%   108ms   111ms   -2.1%
   CreateStringsWithConcat:   114ms   137ms  -17.1%   117ms   139ms  -16.0%
   CreateUnicodeWithConcat:    92ms   101ms   -9.2%    95ms   102ms   -7.2%
              DictCreation:    77ms    81ms   -4.4%    80ms    85ms   -5.9%
         DictWithFloatKeys:    91ms   107ms  -14.5%    93ms   109ms  -14.6%
       DictWithIntegerKeys:    95ms    94ms   +1.4%   108ms    96ms  +12.3%
        DictWithStringKeys:    83ms    88ms   -5.8%    84ms    88ms   -4.7%
                  ForLoops:    72ms    72ms   -0.1%    79ms    74ms   +5.8%
                IfThenElse:    83ms    80ms   +3.9%    85ms    80ms   +5.3%
               ListSlicing:   117ms   118ms   -0.7%   118ms   121ms   -1.8%
            NestedForLoops:   116ms   119ms   -2.4%   121ms   121ms   +0.0%
      NormalClassAttribute:   106ms   115ms   -7.7%   108ms   117ms   -7.7%
   NormalInstanceAttribute:    96ms    98ms   -2.3%    97ms   100ms   -3.1%
       PythonFunctionCalls:    92ms    95ms   -3.7%    94ms    99ms   -5.2%
         PythonMethodCalls:   147ms   147ms   +0.1%   152ms   149ms   +2.1%
                 Recursion:   135ms   136ms   -0.3%   140ms   144ms   -2.9%
              SecondImport:   101ms    99ms   +2.1%   103ms   101ms   +2.2%
       SecondPackageImport:   107ms   103ms   +3.5%   108ms   104ms   +3.3%
     SecondSubmoduleImport:   134ms   134ms   +0.3%   136ms   136ms   -0.0%
   SimpleComplexArithmetic:   105ms   111ms   -5.0%   110ms   112ms   -1.4%
    SimpleDictManipulation:    95ms   106ms  -10.6%    96ms   109ms  -12.0%
     SimpleFloatArithmetic:    90ms    99ms   -9.3%    93ms   102ms   -8.2%
  SimpleIntFloatArithmetic:    78ms    76ms   +2.3%    79ms    77ms   +2.0%
   SimpleIntegerArithmetic:    78ms    77ms   +1.8%    79ms    77ms   +2.0%
    SimpleListManipulation:    80ms    78ms   +2.4%    80ms    79ms   +1.9%
      SimpleLongArithmetic:   110ms   113ms   -2.0%   111ms   113ms   -2.1%
                SmallLists:   128ms   117ms   +9.5%   130ms   124ms   +4.9%
               SmallTuples:   115ms   114ms   +1.7%   117ms   114ms   +2.2%
     SpecialClassAttribute:   101ms   112ms  -10.3%   104ms   114ms   -8.9%
  SpecialInstanceAttribute:   173ms   177ms   -1.9%   176ms   179ms   -1.6%
            StringMappings:   165ms   167ms   -1.2%   168ms   169ms   -0.5%
          StringPredicates:   126ms   134ms   -5.7%   127ms   134ms   -5.6%
             StringSlicing:   125ms   123ms   +1.9%   131ms   130ms   +0.7%
                 TryExcept:    79ms    80ms   -0.6%    80ms    80ms   -0.8%
                TryFinally:   110ms   107ms   +3.0%   111ms   112ms   -1.1%
            TryRaiseExcept:    99ms   101ms   -1.6%   100ms   102ms   -1.7%
              TupleSlicing:   127ms   127ms   +0.6%   137ms   137ms   +0.0%
           UnicodeMappings:   144ms   144ms   -0.3%   145ms   145ms   -0.4%
         UnicodePredicates:   116ms   114ms   +1.3%   117ms   115ms   +1.1%
         UnicodeProperties:   106ms   102ms   +3.6%   107ms   104ms   +3.1%
            UnicodeSlicing:    95ms   111ms  -14.0%    99ms   112ms  -11.8%
               WithFinally:   157ms   152ms   +3.3%   159ms   154ms   +3.3%
           WithRaiseExcept:   123ms   125ms   -1.1%   125ms   126ms   -1.2%
     /* line-by-line tracing support */
  if (tstate->c_tracefunc != NULL && !tstate->tracing) {
  if (_Py_TracingPossible &&
      tstate->c_tracefunc != NULL && !tstate->tracing) {
# basic block 17
# ../Python/ceval.c:885
movl	-336(%ebp), %esi
movl	28(%esi), %eax
testl	%eax, %eax
je	L567
# basic block 17
# ../Python/ceval.c:889
movl	__Py_TracingPossible-"L00000000033$pb"(%ebx), %eax
testl	%eax, %eax
jne	L2321

[Python-Dev] Patch to speed up non-tracing case in PyEval_EvalFrameEx (2% on pybench) (original) (raw)

PYBENCH 2.0

Benchmark: pybench.out

Comparing with: ../build_orig/pybench.out

Test minimum run-time average run-time this other diff this other diff

%esi = tstate

%eax = tstate->c_tracefunc

if tstate->c_tracefunc == 0

goto past-if ()

more if conditions here

%eax = _Py_TracingPossible

if _Py_TracingPossible != 0

goto rest-of-if (nearby)

opcode = NEXTOP(); continues here