2010-03-08 30 views
66

Dada una lista de números de cómo encontrar diferencias entre cada (i) -th y (i+1) -th de sus elementos? ¿Debería uno usar mejor lambda o tal vez listas de comprensión?Python - Diferencias entre elementos de una lista

Ejemplo: Dada una lista t=[1,3,6,...] que es encontrar una lista v=[2,3,...] porque 3-1=2, 6-3=3, etc.

Respuesta

97
>>> t 
[1, 3, 6] 
>>> [j-i for i, j in zip(t[:-1], t[1:])] # or use itertools.izip in py2k 
[2, 3] 
+7

En caso de necesitar diferencias absolutas, '[abs (ji) para i, j en zip (t, t [1:])]' – Anil

3

Ok. Creo que he encontrado la solución adecuada:

v = [x[1]-x[0] for x in zip(t[1:],t[:-1])] 
+0

ya su buena , pero creo que debería haber sido v = [x [0] -x [1] para x en zip (t [1:], t [: - 1])] para la lista ordenada! –

67

Las otras respuestas son correctas pero si estás haciendo un trabajo numérico, es posible que desee considerar numpy. Usando numpy, la respuesta es:

v = numpy.diff(t) 
23

Si no desea utilizar numpy ni zip, se puede utilizar el sencillo (simple en mi opinión) solución:

>>> t = [1, 3, 6] 
>>> v = [t[i+1]-t[i] for i in range(len(t)-1)] 
>>> v 
[2, 3] 
6

Usted puede utilizar itertools.tee y zip para construir de manera eficiente el resultado:

from itertools import tee 
# python2 only: 
#from itertools import izip as zip 

def differences(seq): 
    iterable, copied = tee(seq) 
    next(copied) 
    for x, y in zip(iterable, copied): 
     yield y - x 

O usando itertools.islice lugar:

from itertools import islice 

def differences(seq): 
    nexts = islice(seq, 1, len(seq)) 
    for x, y in zip(seq, nexts): 
     yield y - x 

También puede evitar el uso del módulo de itertools:

def differences(seq): 
    iterable = iter(seq) 
    prev = next(iterable) 
    for element in iterable: 
     yield element - prev 
     prev = element 

Todos estos trabajos solución en el espacio constante si no es necesario para almacenar todos los resultados. La primera y la última solución también funciona con iterables infinitos, mientras que la segunda requiere una secuencia finita como entrada.


Éstos son algunos micro-puntos de referencia de las soluciones:

In [12]: L = range(10**6) 

In [13]: from collections import deque 
In [15]: %timeit deque(differences_tee(L), maxlen=0) 
10 loops, best of 3: 122 ms per loop 

In [16]: %timeit deque(differences_islice(L), maxlen=0) 
10 loops, best of 3: 127 ms per loop 

In [17]: %timeit deque(differences_no_it(L), maxlen=0) 
10 loops, best of 3: 89.9 ms per loop 

y las otras soluciones propuestas:

In [18]: %timeit [x[1] - x[0] for x in zip(L[1:], L)] 
10 loops, best of 3: 163 ms per loop 

In [19]: %timeit [L[i+1]-L[i] for i in range(len(L)-1)] 
1 loops, best of 3: 395 ms per loop 

In [20]: import numpy as np 

In [21]: %timeit np.diff(L) 
1 loops, best of 3: 479 ms per loop 

In [35]: %%timeit 
    ...: res = [] 
    ...: for i in range(len(L) - 1): 
    ...:  res.append(L[i+1] - L[i]) 
    ...: 
1 loops, best of 3: 234 ms per loop 

en cuenta que:

  • zip(L[1:], L) es equivalente a zip(L[1:], L[:-1]) desde zip ya termina en la entrada más corta, sin embargo, evita una copia completa de L.
  • Acceso a los elementos individuales por el índice es muy lento porque cada acceso índice es una llamada a un método en Python
  • numpy.diff es lenta porque tiene que convertir primero el list a un ndarray.Obviamente, si usted empezar con un ndarray será mucho más rápido:

    In [22]: arr = np.array(L) 
    
    In [23]: %timeit np.diff(arr) 
    100 loops, best of 3: 3.02 ms per loop 
    
-1

Mi manera

>>>v = [1,2,3,4,5] 
>>>[v[i] - v[i-1] for i, value in enumerate(v[1:], 1)] 
[1, 1, 1, 1] 
+0

Usar 'enumerate' es un desperdicio porque no estás usando' value'. Ver https://stackoverflow.com/a/16714453/832230 –

2

Un enfoque funcional:

>>> import operator 
>>> a = [1,3,5,7,11,13,17,21] 
>>> map(operator.sub, a[1:], a[:-1]) 
[2, 2, 2, 4, 2, 4, 4] 

Usando generador:

>>> import operator, itertools 
>>> g1,g2 = itertools.tee((x*x for x in xrange(5)),2) 
>>> list(itertools.imap(operator.sub, itertools.islice(g1,1,None), g2)) 
[1, 3, 5, 7] 

Uso de índices:

>>> [a[i+1]-a[i] for i in xrange(len(a)-1)] 
[2, 2, 2, 4, 2, 4, 4] 
Cuestiones relacionadas