Aplicación desarrollada con Python, Pandas y Streamlit para limpiar datasets eliminando valores nulos y duplicados.
import streamlit as st
import pandas as pd
st.set_page_config(
page_title="CSV Data Cleaner",
layout="wide"
)
st.title("CSV Data Cleaner")
st.write("Aplicación para limpiar datasets eliminando valores nulos y duplicados.")
st.divider()
archivo = st.file_uploader("Sube tu archivo CSV", type=["csv"])
if archivo is not None:
df_original = pd.read_csv(archivo)
df_sin_nulos = df_original.dropna()
df_final = df_sin_nulos.drop_duplicates()
st.subheader("Información del dataset")
col1, col2, col3 = st.columns(3)
with col1:
st.metric("Filas originales", df_original.shape[0])
with col2:
st.metric("Después de quitar nulos", df_sin_nulos.shape[0])
with col3:
st.metric("Dataset final", df_final.shape[0])
st.divider()
tab1, tab2, tab3 = st.tabs([
"Dataset Original",
"Sin Valores Nulos",
"Dataset Limpio"
])
with tab1:
st.dataframe(df_original)
with tab2:
st.dataframe(df_sin_nulos)
with tab3:
st.dataframe(df_final)
st.divider()
csv = df_final.to_csv(index=False).encode("utf-8")
st.download_button(
label="Descargar CSV limpio",
data=csv,
file_name="dataset_limpio.csv",
mime="text/csv"
)
else:
st.info("Sube un archivo CSV para comenzar.")
> launching streamlit app... > processing csv data...