que tienen una trama de datos que se ha duplicado filas. Me gustaría obtener un DataFrame con un índice único y sin duplicados. Está bien descartar los valores duplicados. es posible? ¿Sería un hecho por groupby
?pandas: trama de datos única
Respuesta
In [29]: df.drop_duplicates()
Out[29]:
b c
1 2 3
3 4 0
7 5 9
dimos cuenta de una manera de hacerlo es mediante la lectura de los ejemplos de documentación split-apply-combine.
df = pandas.DataFrame({'b':[2,2,4,5], 'c': [3,3,0,9]}, index=[1,1,3,7])
df_unique = df.groupby(level=0).first()
df
b c
1 2 3
1 2 3
3 4 0
7 5 9
df_unique
b c
1 2 3
3 4 0
7 5 9
Esto se basa en el índice de la fila se duplican para las filas, donde (c b) se duplican los campos de datos, haciendo efectiva la parte índice de la fila como vector que desea ser únicos (no duplicados) – hobs
Si tiene entradas de índice duplicadas, esta es la respuesta que desea. – rogueleaderr
me estaba 'ValueError: Índice contiene entradas duplicadas, no puede reshape' al hacer' unstack' en un MultIndex pero esta solución funciona para que sólo yo tenía que hacer 'df_unique = df.groupby (nivel = [0,1]). first() ' – dashesy
- 1. pandas trama de datos jerárquica
- 2. indexar una trama de datos pandas
- 3. XML para pandas trama de datos
- 4. gota columnas no numéricos de una trama de datos pandas
- 5. pandas: combinar dos columnas de una trama de datos
- 6. Redefiniendo el índice en una trama de datos pandas objeto
- 7. datos Normalizar en pandas
- 8. concat trama de datos pandas a lo largo de los índices de series temporales
- 9. utilizar una lista de valores para seleccionar filas de una trama de datos pandas
- 10. la conversión de un objeto pandas GroupBy de trama de datos
- 11. devolver varios valores de pandas aplicarse sobre una trama de datos
- 12. Adición de la columna (s) calculado a una trama de datos en pandas
- 13. pandas trama de datos: aplicar la función a todas las columnas
- 14. aplanar una trama de datos
- 15. cómo combinar dos tramas de datos en pandas pitón
- 16. Agregar dos marcos de datos de pandas
- 17. Scikit y Pandas: Ajuste de datos grandes
- 18. manejo de datos faltantes en Pandas
- 19. trama de datos producto cartesiano en I
- 20. acelerar trama de datos a juego
- 21. una trama de datos en I
- 22. Cómo pedir mi trama de datos lexicographicaly
- 23. R iterar sobre columnas trama de datos
- 24. anexar dos tramas de datos con los pandas
- 25. dividir una trama de datos en tramas de datos superpuestos
- 26. Convirtiendo datos a desaparecidos en pandas
- 27. la selección a través de múltiples columnas con pandas pitón?
- 28. Pandas DataFrame Aplicar
- 29. pandas: cómo ordenar el resultado de DataFrame.groupby.mean()?
- 30. fusionar dos trama de datos basada en la coincidencia de dos columnas intercambiables en cada trama de datos
Vale la pena observar que esto toma la primera o la última ocurrencia. Entonces, primero debe ordenar por otra cantidad (si tiene suerte) o hacer alguna lógica complicada de grupo por lógica. – ely
Esto está mal. drop_duplicates actúa únicamente sobre los valores (al menos en mi versión). Necesita reiniciar_index si desea incluir el índice y los valores o simplemente trabajar con el índice si desea tener un índice único. ¿Tal vez hay otra forma además de groupby para hacer cumplir un índice único? – mathtick
Use 'df.drop_duplicates (inplace = True)' si no desea asignar una nueva variable. –