Estoy buscando una forma de "recorrer" un iterador de Python. Es decir, me gustaría envolver un iterador dado iter y page_size con otro iterador que devolvería los elementos de iter como una serie de "páginas". Cada página sería en sí misma un iterador con hasta page_size iteraciones.¿Cómo escribir un buscapersonas para los iteradores de Python?
miré a través de itertools y lo más cercano que vi es itertools.islice. De alguna manera, lo que me gustaría es lo opuesto a itertools.chain - en lugar de encadenar una serie de iteradores en un iterador, me gustaría dividir un iterador en una serie de iteradores más pequeños. Esperaba encontrar una función de búsqueda en itertools pero no pude encontrar una.
Se me ocurrió la siguiente clase de buscapersonas y demostración.
class pager(object):
"""
takes the iterable iter and page_size to create an iterator that "pages through" iter. That is, pager returns a series of page iterators,
each returning up to page_size items from iter.
"""
def __init__(self,iter, page_size):
self.iter = iter
self.page_size = page_size
def __iter__(self):
return self
def next(self):
# if self.iter has not been exhausted, return the next slice
# I'm using a technique from
# https://stackoverflow.com/questions/1264319/need-to-add-an-element-at-the-start-of-an-iterator-in-python
# to check for iterator completion by cloning self.iter into 3 copies:
# 1) self.iter gets advanced to the next page
# 2) peek is used to check on whether self.iter is done
# 3) iter_for_return is to create an independent page of the iterator to be used by caller of pager
self.iter, peek, iter_for_return = itertools.tee(self.iter, 3)
try:
next_v = next(peek)
except StopIteration: # catch the exception and then raise it
raise StopIteration
else:
# consume the page from the iterator so that the next page is up in the next iteration
# is there a better way to do this?
#
for i in itertools.islice(self.iter,self.page_size): pass
return itertools.islice(iter_for_return,self.page_size)
iterator_size = 10
page_size = 3
my_pager = pager(xrange(iterator_size),page_size)
# skip a page, then print out rest, and then show the first page
page1 = my_pager.next()
for page in my_pager:
for i in page:
print i
print "----"
print "skipped first page: " , list(page1)
estoy buscando algo de retroalimentación y tienen las siguientes preguntas:
- ¿Hay un localizador que ya están en itertools que sirve un buscapersonas que estoy pasando por alto?
- La clonación de self.iter 3 veces me parece kludgy. Un clon es comprobar si self.iter tiene más elementos. Decidí ir con a technique Alex Martelli suggested (sabiendo que él escribió de un wrapping technique). El segundo clon fue para permitir que la página devuelta sea independiente del iterador interno (self.iter). ¿Hay alguna manera de evitar hacer 3 clones?
- ¿Hay una manera mejor de lidiar con la excepción StopIteration al lado de atraparla y luego volver a subirla? Estoy tentado de no atraparlo y dejarlo burbujear.
¡Gracias! -Raymond
relacionadas: http://stackoverflow.com/questions/312443/how-do-you-split-a-list-into-evenly-sized-chunks-in-python http://stackoverflow.com/questions/434287/what-is-the-most-pythonic-way-to-iterate-over-a-list-in-chunks http://stackoverflow.com/questions/1335392/iteration-over-list-slices http : //stackoverflow.com/questions/760753/iterate-over-a-python-sequence-in-multiples-of-n – jfs