[Python-checkins] r45401 - in python/trunk/Lib: codecs.py encodings/idna.py test/test_codecs.py (original) (raw)

Fri Apr 14 20:25:40 CEST 2006

   IncrementalEncoder.__init__(self, errors)
   self.buffer = "" # unencoded input that is kept between calls to encode()
   # Overwrite this method in subclasses: It must encode input
   # and return an (output, length consumed) tuple
   raise NotImplementedError
   # encode input (taking the buffer into account)
   data = self.buffer + input
   (result, consumed) = self._buffer_encode(data, self.errors, final)
   # keep unencoded input until the next call
   self.buffer = data[consumed:]
   return result
   IncrementalEncoder.reset(self)
   self.buffer = ""
   return Codec().decode(input, self.errors)[0]
   if errors != 'strict':
       # IDNA is quite clear that implementations must be strict
       raise UnicodeError("unsupported error handling "+errors)
   if not input:
       return ("", 0)
   labels = dots.split(input)
   trailing_dot = u''
   if labels:
       if not labels[-1]:
           trailing_dot = '.'
           del labels[-1]
       elif not final:
           # Keep potentially unfinished label until the next call
           del labels[-1]
           if labels:
               trailing_dot = '.'
   result = []
   size = 0
   for label in labels:
       result.append(ToASCII(label))
       if size:
           size += 1
       size += len(label)
   # Join with U+002E
   result = ".".join(result) + trailing_dot
   size += len(trailing_dot)
   return (result, size)
   if errors != 'strict':
       raise UnicodeError("Unsupported error handling "+errors)
   if not input:
       return (u"", 0)
   # IDNA allows decoding to operate on Unicode strings, too.
   if isinstance(input, unicode):
       labels = dots.split(input)
   else:
       # Must be ASCII string
       input = str(input)
       unicode(input, "ascii")
       labels = input.split(".")
   trailing_dot = u''
   if labels:
       if not labels[-1]:
           trailing_dot = u'.'
           del labels[-1]
       elif not final:
           # Keep potentially unfinished label until the next call
           del labels[-1]
           if labels:
               trailing_dot = u'.'
   result = []
   size = 0
   for label in labels:
       result.append(ToUnicode(label))
       if size:
           size += 1
       size += len(label)
   result = u".".join(result) + trailing_dot
   size += len(trailing_dot)
   return (result, size)
   self.assertEquals(unicode("python.org.", "idna"), u"python.org.")
   self.assertEquals(unicode("xn--pythn-mua.org", "idna"), u"pyth\xf6n.org")
   self.assertEquals(unicode("xn--pythn-mua.org.", "idna"), u"pyth\xf6n.org.")
   self.assertEquals(u"python.org".encode("idna"), "python.org")
   self.assertEquals("python.org.".encode("idna"), "python.org.")
   self.assertEquals(u"pyth\xf6n.org".encode("idna"), "xn--pythn-mua.org")
   self.assertEquals(u"pyth\xf6n.org.".encode("idna"), "xn--pythn-mua.org.")
   self.assertEquals(
       "".join(codecs.iterdecode("python.org", "idna")),
       u"python.org"
   )
   self.assertEquals(
       "".join(codecs.iterdecode("python.org.", "idna")),
       u"python.org."
   )
   self.assertEquals(
       "".join(codecs.iterdecode("xn--pythn-mua.org.", "idna")),
       u"pyth\xf6n.org."
   )
   self.assertEquals(
       "".join(codecs.iterdecode("xn--pythn-mua.org.", "idna")),
       u"pyth\xf6n.org."
   )
   decoder = codecs.getincrementaldecoder("idna")()
   self.assertEquals(decoder.decode("xn--xam", ), u"")
   self.assertEquals(decoder.decode("ple-9ta.o", ), u"\xe4xample.")
   self.assertEquals(decoder.decode(u"rg"), u"")
   self.assertEquals(decoder.decode(u"", True), u"org")
   decoder.reset()
   self.assertEquals(decoder.decode("xn--xam", ), u"")
   self.assertEquals(decoder.decode("ple-9ta.o", ), u"\xe4xample.")
   self.assertEquals(decoder.decode("rg."), u"org.")
   self.assertEquals(decoder.decode("", True), u"")
   self.assertEquals(
       "".join(codecs.iterencode(u"python.org", "idna")),
       "python.org"
   )
   self.assertEquals(
       "".join(codecs.iterencode(u"python.org.", "idna")),
       "python.org."
   )
   self.assertEquals(
       "".join(codecs.iterencode(u"pyth\xf6n.org.", "idna")),
       "xn--pythn-mua.org."
   )
   self.assertEquals(
       "".join(codecs.iterencode(u"pyth\xf6n.org.", "idna")),
       "xn--pythn-mua.org."
   )
   encoder = codecs.getincrementalencoder("idna")()
   self.assertEquals(encoder.encode(u"\xe4x"), "")
   self.assertEquals(encoder.encode(u"ample.org"), "xn--xample-9ta.")
   self.assertEquals(encoder.encode(u"", True), "org")
   encoder.reset()
   self.assertEquals(encoder.encode(u"\xe4x"), "")
   self.assertEquals(encoder.encode(u"ample.org."), "xn--xample-9ta.org.")
   self.assertEquals(encoder.encode(u"", True), "")
def test_decode(self):
   CodecTest,
   IDNACodecTest,
   CodecsModuleTest,
   StreamReaderTest,
   Str2StrTest,

[Python-checkins] r45401 - in python/trunk/Lib: codecs.py encodings/idna.py test/test_codecs.py (original) (raw)

Modified: python/trunk/Lib/codecs.py

Modified: python/trunk/Lib/encodings/idna.py

Modified: python/trunk/Lib/test/test_codecs.py