Lección 1.2: ¿Qué es Pandas? Creación de Df, etc.
Lección 1.2: ¿Qué es Pandas? Creación de DataFrame
Introducción
¡Hola a todos! Soy Yuscu Mejía y en esta lección vamos a explorar qué es Pandas en Python, una biblioteca fundamental para la manipulación y análisis de datos. Pandas proporciona estructuras de datos fáciles de usar y herramientas de análisis que hacen que trabajar con datos en Python sea más eficiente.
Características
Pandas ofrece las siguientes características clave:
- Estructuras de datos como DataFrames para manejar datos de manera eficiente.
- Funciones robustas para la manipulación de datos, como selección, filtrado y agrupación.
- Soporte para la lectura y escritura de varios formatos de datos, incluidos CSV, Excel y SQL.
- Capacidades para la limpieza y preparación de datos, como el manejo de valores nulos y la transformación de datos.
Ejemplos
A continuación, presentamos algunos ejemplos de cómo utilizar Pandas en Python, presentados por Yuscu Mejía:
- Crear y manipular un DataFrame.
- Leer datos de un archivo CSV y escribir datos a un archivo CSV.
- Realizar operaciones básicas de filtrado y selección en un DataFrame.
# Importar Pandas
import pandas as pd
# Crear un DataFrame
data = {'Nombre': ['Ana', 'Luis', 'Carlos'], 'Edad': [23, 34, 45]}
df = pd.DataFrame(data)
print(df)
# Leer un archivo CSV
df_csv = pd.read_csv('datos.csv')
print(df_csv)
# Escribir a un archivo CSV
df.to_csv('salida.csv', index=False)
# Filtrar datos en un DataFrame
df_filtrado = df[df['Edad'] > 30]
print(df_filtrado)
Práctica
Explora cómo utilizar Pandas en Python siguiendo nuestro tutorial en video presentado por Yuscu Mejía:
Ejercicio 1: Crear y Manipular un DataFrame
Presentado por Yuscu Mejía, crea un DataFrame con las columnas ‘Nombre’ y ‘Edad’, y realiza las siguientes operaciones:
- a) Imprime el DataFrame.
- b) Añade una nueva columna ‘Ciudad’ con los valores [‘Madrid’, ‘Barcelona’, ‘Valencia’].
- c) Filtra las filas donde la edad es mayor de 30.
- d) Imprime el DataFrame modificado.
Ejercicio 2: Leer y Escribir Datos de un CSV
Con la guía de Yuscu Mejía, lee datos de un archivo CSV llamado ‘datos.csv’ y escribe estos datos en un nuevo archivo CSV llamado ‘salida.csv’.
#Ejercicio 1
a) Imprime el DataFrame
import pandas as pd
data = {'Nombre': ['Ana', 'Luis', 'Carlos'], 'Edad': [23, 34, 45]}
df = pd.DataFrame(data)
print(df)
b) Añade una nueva columna ‘Ciudad’
df['Ciudad'] = ['Madrid', 'Barcelona', 'Valencia']
c) Filtra las filas donde la edad es mayor de 30
df_filtrado = df[df['Edad'] > 30]
d) Imprime el DataFrame modificado
print(df_filtrado)
#Ejercicio 2
import pandas as pd
# Leer datos de 'datos.csv'
df = pd.read_csv('datos.csv')
print(df)
# Escribir datos a 'salida.csv'
df.to_csv('salida.csv', index=False)