Lección 1.3: ¿Qué es Serie, Relación con DF, etc.?
Lección 1.3: ¿Qué es una Serie? Relación con DataFrame
Introducción
¡Hola a todos! Soy Yuscu Mejía y en esta lección vamos a explorar qué es una Serie en Pandas y cómo se relaciona con un DataFrame. Pandas es una biblioteca poderosa para la manipulación y análisis de datos en Python, y entender estas estructuras de datos es esencial para su uso eficaz.
Características
Una Serie en Pandas es una estructura de datos unidimensional similar a una columna en una tabla. Aquí algunas de sus características clave:
- Es un array unidimensional etiquetado capaz de almacenar cualquier tipo de datos (enteros, cadenas, flotantes, objetos, etc.).
- Los datos en una Serie están indexados por una etiqueta, que puede ser numérica o de cualquier otro tipo.
- Una Serie es similar a un array unidimensional de NumPy, pero con la capacidad adicional de tener etiquetas para cada elemento.
Un DataFrame en Pandas es una estructura de datos bidimensional, similar a una tabla de una base de datos o una hoja de cálculo de Excel. Algunas características de los DataFrames son:
- Es una colección de Series que comparten el mismo índice.
- Es capaz de almacenar diferentes tipos de datos en diferentes columnas.
- Permite operaciones de selección, filtrado, agregación y muchas otras funcionalidades.
Ejemplos
A continuación, presentamos algunos ejemplos de cómo utilizar Series y DataFrames en Pandas, presentados por Yuscu Mejía:
- Crear y manipular una Serie.
- Crear y manipular un DataFrame.
- Convertir una Serie en un DataFrame y viceversa.
# Importar Pandas
import pandas as pd
# Crear una Serie
serie = pd.Series([1, 3, 5, 7, 9], index=['a', 'b', 'c', 'd', 'e'])
print(serie)
# Crear un DataFrame a partir de una Serie
df = serie.to_frame(name='valores')
print(df)
# Crear un DataFrame
data = {'Nombre': ['Ana', 'Luis', 'Carlos'], 'Edad': [23, 34, 45]}
df2 = pd.DataFrame(data)
print(df2)
# Convertir una columna de DataFrame en una Serie
serie2 = df2['Nombre']
print(serie2)
Práctica
Explora cómo utilizar Series y DataFrames en Pandas siguiendo nuestro tutorial en video presentado por Yuscu Mejía:
Ejercicio 1: Crear y Manipular una Serie
Presentado por Yuscu Mejía, crea una Serie con los números 10, 20, 30, 40, 50 y realiza las siguientes operaciones:
- a) Imprime la Serie.
- b) Multiplica cada elemento de la Serie por 2.
- c) Imprime la Serie modificada.
Ejercicio 2: Crear y Manipular un DataFrame
Con la guía de Yuscu Mejía, crea un DataFrame con las columnas ‘Nombre’ y ‘Edad’, y realiza las siguientes operaciones:
- a) Imprime el DataFrame.
- b) Añade una nueva columna ‘Ciudad’ con los valores [‘Madrid’, ‘Barcelona’, ‘Valencia’].
- c) Imprime el DataFrame modificado.
#Ejercicio 1
a) Imprime la Serie
import pandas as pd
serie = pd.Series([10, 20, 30, 40, 50])
print(serie)
b) Multiplica cada elemento de la Serie por 2
serie *= 2
c) Imprime la Serie modificada
print(serie)
#Ejercicio 2
a) Imprime el DataFrame
import pandas as pd
data = {'Nombre': ['Ana', 'Luis', 'Carlos'], 'Edad': [23, 34, 45]}
df = pd.DataFrame(data)
print(df)
b) Añade una nueva columna ‘Ciudad’
df['Ciudad'] = ['Madrid', 'Barcelona', 'Valencia']
c) Imprime el DataFrame modificado
print(df)