• Bytes y Café
  • Posts
  • 🧠 Daily Byte — "Datos limpios, gráficas nítidas." 📊🌟

🧠 Daily Byte — "Datos limpios, gráficas nítidas." 📊🌟

Elimina duplicados y crea gráficas con estilo.

¡Feliz jueves, amantes del dato!

El byte de hoy trae dos técnicas esenciales en Python: una para limpiar datos duplicados y otra para crear gráficas claras y llamativas.

🔍 Limpieza de Datos: Elimina Duplicados como un Experto

Ya sea que trabajes con calificaciones de estudiantes o ventas del mes, los duplicados pueden distorsionar tus análisis. Aquí te muestro cómo limpiarlos fácilmente:

import pandas as pd

df_students = pd.read_csv('/datasets/student_scores.csv')
df_students = df_students.drop_duplicates()

remaining_duplicates = df_students.duplicated().sum()
print(f"✅ Número de filas duplicadas después de limpiar: {remaining_duplicates}")

Nada complicado — solo datos limpios y confiables.

🎨 Visualización: Haz que tu Gráfica Brille

¿Quieres darle vida a tus gráficas? Usa colores llamativos y marcadores visibles. Aquí un ejemplo con marcador de estrella ('*'):

import pandas as pd
from matplotlib import pyplot as plt

df = pd.DataFrame({
    'a': [2, 3, 4, 5],
    'b': [4, 9, 16, 25],
    'c': [1, 3, 6, 10]
})

df.plot(
    x='c',
    y='a',
    style='*',
    color='hotpink',
    title='A vs C',
    xlabel='C',
    ylabel='A',
    figsize=[5, 5],
    xlim=[0, 12],
    ylim=[1, 6]
)

plt.grid(True)
plt.tight_layout()
plt.show()

📌 Consejo pro: Etiqueta todo. El estilo importa — incluso en los datos.

Eso es todo por hoy en tu Daily Byte — breve, útil y listo para ejecutar.

¡Hasta mañana!
— Chris @ Daily Byte

Reply

or to participate.