Paquetes

Python intermedio para desarrolladores

Jasmin Ludolf

Senior Data Science Content Developer

Los módulos son archivos de Python

  • Módulo = archivo de Python

  • ¡Cualquiera puede crear uno!

Archivo de código en un portátil

Python intermedio para desarrolladores

Paquetes

  • Conjunto de módulos = paquete
    • También llamado biblioteca
  • Público y gratuito
  • Se descarga de PyPI
  • Luego se importa y usa como módulos

Caja de cartón grande

1 https://pypi.org/
Python intermedio para desarrolladores

Instalar un paquete

  • Terminal / Símbolo del sistema

    python3 -m pip install <package_name>
    
  • python3: ejecuta código Python desde la terminal

  • pip: instalador preferido

Terminal de código

Python intermedio para desarrolladores

Instalar un paquete

 

python3 -m pip install pandas

Logo de Pandas

$$

  • Paquete para manipular y analizar datos
Python intermedio para desarrolladores

Importar con alias

# Importa pandas
import pandas
  • Usa un alias para acortar el código
# Importa pandas con un alias
import pandas as pd
Python intermedio para desarrolladores

Crear un DataFrame

# Diccionario de ventas
sales = {"user_id": ["KM37", "PR19", "YU88"],
         "order_value": [197.75, 208.21, 134.99]}

# Convertir a un DataFrame de pandas sales_df = pd.DataFrame(sales)
print(sales_df)
  user_id  order_value
0    KM37       197.75
1    PR19       208.21
2    YU88       134.99
Python intermedio para desarrolladores

Leer un archivo CSV

# Leer un archivo CSV en el directorio actual
sales_df = pd.read_csv("sales.csv")

# Comprobar el tipo de dato print(type(sales_df))
pandas.core.frame.DataFrame
Python intermedio para desarrolladores

Previsualizar el archivo

# Método del DataFrame para previsualizar las primeras cinco filas
print(sales_df.head())
  user_id  order_value
0    KM37       197.75
1    PR19       208.21
2    YU88       134.99
3    NT43       153.54        
4    IW06       379.47
Python intermedio para desarrolladores

Comprobar la información del archivo

# Comprobar la información del archivo
print(sales_df.info())
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
 #   Column       Non-Null Count  Dtype  
<hr />  ------       --------------  -----  
 0   user_id      3 non-null      object 
 1   order_value  3 non-null      float64
dtypes: float64(1), object(1)
memory usage: 180.0+ bytes
Python intermedio para desarrolladores

Funciones vs. métodos

# Esta es una función incorporada
print(sum([1, 2 ,3, 4, 5]))
15
  • Función = código que realiza una tarea
# Esta es una función de pandas
sales_df = pd.DataFrame(sales)
  • .head() solo funciona con DataFrames de pandas
# Este es un método
print(sales_df.head())
  user_id  order_value
0    KM37       197.75
1    PR19       208.21
2    YU88       134.99
3    NT43       153.54        
4    IW06       379.47
  • Método = función específica de un tipo de dato
Python intermedio para desarrolladores

¡Vamos a practicar!

Python intermedio para desarrolladores

Preparing Video For Download...