[Python-Dev] Re: heaps (original) (raw)

Mon, 05 May 2003 22:35:28 -0400

 person > q[0]
def __init__(self, k, minusinf):
    self.k = k
    self.buflim = 3*k
    self.buf = []
    self.cutoff = minusinf

def put(self, obj):
    if obj <= self.cutoff:
        return

    buf = self.buf
    buf.append(obj)
    if len(buf) <= self.buflim:
        return

    # Reduce len(buf) by at least one, by retaining
    # at least k, and at most len(buf)-1, of the
    # largest objects in buf.
    from random import choice
    sofar = []
    k = self.k
    while len(sofar) < k:
        pivot = choice(buf)
        buf, eq, gt = split(buf, pivot)
        sofar.extend(gt)
        if len(sofar) < k:
            sofar.extend(eq[:k - len(sofar)])

    self.buf = sofar
    self.cutoff = pivot

def get(self):
    from random import choice
    buf = self.buf
    k = self.k
    if len(buf) <= k:
        return buf

    # Retain only the k largest.
    sofar = []
    needed = k
    while needed:
        pivot = choice(buf)
        lt, eq, gt = split(buf, pivot)
        if len(gt) <= needed:
            sofar.extend(gt)
            needed -= len(gt)
            if needed:
                takefromeq = min(len(eq), needed)
                sofar.extend(eq[:takefromeq])
                needed -= takefromeq
            # If we still need more, they have to
            # come out of things < pivot.
            buf = lt
        else:
            # gt alone is too large.
            buf = gt

    assert len(sofar) == k
    self.buf = sofar
    return sofar

[Python-Dev] Re: heaps (original) (raw)

KBest(k, minusinf) remembers the largest k objects

from a sequence of objects passed one at a time to

put(). minusinf must be smaller than any object

passed to put(). After feeding in all the objects,

call get() to retrieve a list of the k largest (or

as many as were passed to put(), if put() was called

fewer than k times).