Generar todas las combinaciones posibles de una lista int bajo un límite

Necesito hacer esto en Python. Hay una lista dada l, puede contener más de 5000 elementos enteros. Hay un límite en la suma de los números, 20000 o puede ser alto. La salida debe ser todas las posibles sumas de 2 números escogidos de la lista, igual,Generar todas las combinaciones posibles de una lista int bajo un límite

l=[1,2,3,4,5,6,7,8,9] 
output 
1+1,1+2,1+3,1+4,1+5,1+6........... 
2+2,2+3,2+4....... 
......... 
....... 

2,3,4,5,6... like that

estoy usando el código, hacer esto por ahora, pero es lenta

l=listgen() 
p=[] 
for i in range(0,len(l)): 
    for j in range(i,len(l)): 
     k=l[i]+l[j] 
     if k not in p: 
      p.append(k) 
p.sort 
print(p)

listgen() es la función que genera la lista de entrada.

Fuente

2012-08-03 Madushan

Use http://docs.python.org/library/itertools.html?highlight=itertools#itertools.combinations –

¿Qué quiere decir con límite? ¿Un límite en la suma o en la longitud de la lista de entrada? –

Límite en la suma. No mencioné que – Madushan

Algunos anticuada optimización podría obtener un código más rápido que es más fácil de asimilar que las listas por comprensión con múltiples bucles:

def sums(lst, limit): # prevent global lookups by using a function 
    res = set()   # set membership testing is much faster than lists 
    res_add = res.add # cache add method 
    for i, first in enumerate(lst): # get index and item at the same time 
     for second in lst[i:]:  # one copy operation saves n index ops. 
      res_add(first + second) # prevent creation/lookup of extra local temporary 
    return sorted([x for x in res if x < limit]) 

print sums(listgen(), 20000)

como un bono adicional, esta versión optimizará la perfección con psyco, Cython , etc.

Actualización: Al comparar esto con las otras sugerencias (en sustitución de listgen con rango (5000), me sale:.

mine:  1.30 secs 
WolframH: 2.65 secs 
lazyr:  1.54 secs (estimate based on OPs timings -- I don't have Python 2.7 handy)

Fuente

2012-08-03 09:33:03 thebjorn

¡Voy a intentar esto! – Madushan

@Madushan Intenté ejecutar tu código también, pero tardó demasiado y tuve que matar el proceso :-( – thebjorn

Con psyco mío bajé a 0.7 segundos :-) – thebjorn

EDIT: Thebjorn dice que tiene la solución más eficiente, y mis propias pruebas concuerdan, aunque he mejorado un poco mi rendimiento. Su código también es menos dependiente de la versión de Python y parece estar muy bien pensado y explicado con respecto a la optimización. Debes aceptar su respuesta (y darle votos a favor).

Use itertools.combinations_with_replacement (agregado en python 2.7), y haga p a .

def sums(lst, limit): 
    from itertools import combinations_with_replacement 
    p = set(x + y for x, y in combinations_with_replacement(listgen(), 2)) 
    return sorted([x for x in p if x < limit])

Su código es lento debido a esta línea:

Si usted acaba de hacer un par de pequeños cambios en su código para que p es una set, sería hacer una gran diferencia:

L = listgen() 
p = set() 
for i in range(0, len(L)): 
    for j in range(i, len(L)): 
     p.add(L[i] + L[j]) 
print(sorted(p))

Por cierto, esta línea en su ejemplo

p.sort

no tiene ningún efecto. Debe llamar a un método para ejecutarlo, así:

p.sort()

Fuente

2012-08-03 09:13:21

¿Cómo puedo usar el límite? No quiero números más que eso. – Madushan

'l' es un nombre de variable incorrecto ya que se puede confundir con' 1'. – jamylak

+1 Esto debería hacerlo Creo que – jamylak

Editar: Incluido el límite (que no estaba en el código del OP).

a = set(x + y for x in l for y in l) 
print(sorted(x for x in a if x < limit))

Eso también reduce la complejidad del algoritmo (el suyo es potencialmente O (n^4) debido a la prueba de la pertenencia a una lista).

Fuente

2012-08-03 09:15:27 WolframH

Creo que esto tomará más tiempo que el mío. – Madushan

@Madushan: ¿Qué te hace pensar eso? En mi prueba, fue unas 50 veces más rápido que el tuyo. – WolframH

puede ser el conjunto() pero también estás haciendo lo que estoy haciendo ¿no? (Yendo a través de toda la lista) * eliminadores de lista. – Madushan

Si la lista puede contener elementos repetidos, puede ser una buena idea deshacerse de ellos primero, p. convirtiendo la lista en un conjunto.

Fuente

2012-08-03 09:17:41

No hay elementos repetidos en la entrada. Optimicé el otro código para asegurarme de ello. – Madushan

Si la lista de entrada está ordenada, puede salir del bucle interno cuando alcanza el límite. Además, haga p un conjunto.

lst=listgen() 
lst.sort() 
p=set() 
for i in range(0,len(lst)): 
    for j in range(i,len(lst)): 
     k=lst[i]+lst[j] 
     if k > limit: 
      break 
     p.add(k) 
p = sorted(p) 
print(p)

Fuente

2012-08-03 09:29:53

La lista de entradas está ordenada. He realizado la modificación que me indicó. De todos modos, es demasiado lenta. – Madushan

Usted podría utilizar "NumPy" para este Esto le da sin duda el rendimiento requerido:

import numpy as np 

data = np.arange(5000) 
limit = 20000 
result = np.zeros(0,dtype='i4') 
for i in data: 
    result = np.concatenate((result,data[i]+data[i:])) 
    if len(result) >= limit: break 
result = result[:limit]

EDIT: me acabo de dar cuenta que el límite está en el suma y no en la cantidad de elementos. Entonces el código debería leer:

EDIT2: Se encontraron otros errores lógicos. Mi sugerencia es corregido:

for idx, x in np.ndenumerate(data): 
    result = np.concatenate((result,x+data[idx[0]:])) 
    if x + data[-1] >= limit: break 
result = result[result <= limit]

Fuente

2012-08-03 09:40:27

No he usado NumPy para nada aún. Puede ser el momento de comenzar. Gracias – Madushan

La última línea parece ser un error de sintaxis (lo siento, no sé numpy lo suficientemente bien como para averiguar si eso es correcto o si has interpretado el límite incorrectamente, ¿ves las otras respuestas ...?) – thebjorn

@thebjorn: por supuesto, tienes razón, confundí los corchetes. Corregido esto ahora. ¡Gracias! –

Generar todas las combinaciones posibles de una lista int bajo un límite

Respuesta

Cuestiones relacionadas