Contenido del Curso

1. Fundamentos de Cloud Computing y AWS

5 lecciones

¿Qué es Cloud Computing?

El Cloud Computing, o computación en la nube, es un modelo de prestación de servicios tecnológicos que permite acceder a recursos informáticos —como servidores, almacenamiento, bases de datos, redes, software y más— a través de Internet, sin necesidad d e poseer o gestionar físicamente la infraestructura subyacente. En lugar de comprar hardware y software, las empresas consumen estos recursos como un servicio, pagando solo por lo que utilizan.

La idea central es que la infraestructura física y la gestión de los recursos quedan a cargo de un proveedor especializado (por ejemplo, Amazon Web Services, Microsoft Azure o Google Cloud), mientras que el cliente se enfoca en configurar y utilizar dichos recursos para satisfacer sus necesidades de negocio o desarrollo. Este cambio de paradigma ha transformado la forma en que las organizaciones implementan proyectos, ya que elimina muchas barreras de tiempo y costo asociadas a la infraestructura tradicional.

Modelos de servicio

Existen tres modelos de servicio principales en el Cloud Computing, cada uno con distintos niveles de control, flexibilidad y responsabilidad:

IaaS (Infrastructure as a Service): El proveedor entrega recursos básicos como máquinas virtuales, redes, sistemas de almacenamiento y balanceadores de carga. El cliente gestiona el sistema operativo, las aplicaciones y la configuración. Ejemplo: Amazon EC2.
PaaS (Platform as a Service): El proveedor ofrece no solo la infraestructura, sino también entornos y herramientas listas para desarrollar, probar y desplegar aplicaciones. El cliente se concentra en el código y la lógica de negocio. Ejemplo: AWS Elastic Beanstalk.
SaaS (Software as a Service): Aplicaciones completas entregadas a través de Internet, accesibles mediante navegador o API. El proveedor gestiona absolutamente todo: infraestructura, plataforma y software. Ejemplo: Google Workspace o Salesforce.

Modelos de implementación

El Cloud Computing también se clasifica por su forma de implementación:

Nube pública: Recursos compartidos entre múltiples clientes, gestionados en centros de datos del proveedor. Alta escalabilidad y pago por uso.
Nube privada: Infraestructura dedicada a una sola organización. Puede estar en las instalaciones del cliente o alojada por un tercero. Mayor control y personalización.
Nube híbrida: Combinación de nube pública y privada para aprovechar lo mejor de ambas. Útil para mover cargas de trabajo según demanda o requisitos de seguridad.

Ventajas y desafíos

Entre las principales ventajas del Cloud Computing se encuentran:

Escalabilidad elástica: aumentar o reducir recursos en minutos.
Pago por uso: se factura solo por la capacidad consumida.
Acceso global: disponibilidad de servicios desde cualquier parte del mundo.
Acceso a tecnologías avanzadas: inteligencia artificial, big data, análisis en tiempo real.

Sin embargo, también presenta desafíos:

Seguridad y cumplimiento: gestión correcta de permisos y protección de datos.
Dependencia de proveedor (vendor lock-in): dificultad para migrar a otro proveedor.
Gestión de costos: riesgo de gastos imprevistos si no se controlan los recursos.

Comprender qué es el Cloud Computing y sus modelos es el primer paso para tomar decisiones informadas sobre cuándo y cómo adoptarlo. Este conocimiento te permitirá evaluar si una solución debe construirse en infraestructura local, en la nube o en un modelo híbrido, además de elegir el tipo de servicio más adecuado para tus objetivos técnicos y de negocio.

El modelo de responsabilidad compartida en AWS

Uno de los conceptos más importantes para trabajar correctamente en la nube de AWS es entender el modelo de responsabilidad compartida. Este modelo define qué aspectos de la seguridad y la operación son responsabilidad de AWS y cuáles corresponden al cliente. Ignorar o malinterpretar esta división es una de las principales causas de incidentes de seguridad en entornos cloud.

¿Qué es la responsabilidad compartida?

En términos simples, AWS se encarga de la seguridad de la nube, mientras que tú eres responsable de la seguridad en la nube. Esto significa que AWS protege y mantiene la infraestructura física, la red, los centros de datos y los servicios que ofrece, mientras que tú configuras, gestionas y aseguras los recursos que utilizas.

Responsabilidades de AWS (seguridad de la nube)

Mantenimiento de la infraestructura física: servidores, almacenamiento, redes, hardware y centros de datos.
Seguridad física: control de acceso a los centros de datos, monitoreo, redundancia de energía y refrigeración.
Gestión del hardware, virtualización y capa de servicios base.
Cumplimiento de certificaciones y auditorías internacionales (ISO, SOC, PCI-DSS, etc.).

Responsabilidades del cliente (seguridad en la nube)

Configuración segura de los servicios (por ejemplo, políticas de acceso en S3 o seguridad de grupos en EC2).
Gestión de credenciales y control de accesos con IAM.
Protección de datos: cifrado en tránsito y en reposo.
Actualización y mantenimiento de sistemas operativos y aplicaciones instaladas en instancias.
Monitoreo y auditoría de la actividad en la cuenta.

Ejemplos prácticos

Si un bucket S3 queda con acceso público y se filtran datos, la responsabilidad es del cliente, ya que AWS proporciona las herramientas para restringir el acceso.
Si un servidor EC2 es vulnerado debido a un sistema operativo sin parches, la responsabilidad también es del cliente.
Si ocurre una caída en un centro de datos de AWS y afecta tu servicio, AWS es responsable de restablecer la infraestructura, pero tú debes haber diseñado tu arquitectura para tolerar fallos.

Buenas prácticas

Aplicar el principio de mínimo privilegio en IAM.
Habilitar MFA (autenticación multifactor) para cuentas críticas.
Configurar cifrado en todos los datos sensibles.
Monitorear logs y actividad con CloudTrail y CloudWatch.
Realizar revisiones periódicas de configuraciones de seguridad.

Comprender el modelo de responsabilidad compartida es esencial para trabajar de manera segura en AWS. No basta con confiar en que AWS es “seguro por defecto”; como cliente, debes tomar medidas activas para proteger tus datos y recursos. Con este conocimiento, podrás diseñar soluciones que no solo sean funcionales y escalables, sino también seguras y conformes a las mejores prácticas de la industria.

2. Introducción a AWS y su ecosistema

Amazon Web Services (AWS) es la plataforma de servicios en la nube más utilizada a nivel global, con presencia en prácticamente todos los sectores de la industria tecnológica. Ofrece más de 200 servicios que cubren cómputo, almacenamiento, redes, bases de datos, inteligencia artificial, análisis de datos, seguridad y mucho más. En esta clase aprenderás cómo está organizada su infraestructura global, qué categorías de servicios ofrece y cuál es el modelo de responsabilidad que define las obligaciones del proveedor y del cliente.

Infraestructura global

AWS organiza su infraestructura física y lógica para garantizar alta disponibilidad, baja latencia y tolerancia a fallos. Sus componentes principales son:

Regiones: Áreas geográficas específicas que contienen varios centros de datos. Cada región es independiente y se identifica con un nombre único, por ejemplo: us-east-1 (Norte de Virginia) o eu-west-1 (Irlanda).
Zonas de disponibilidad (Availability Zones, AZs): Múltiples centros de datos dentro de una región, físicamente separados pero conectados mediante redes de baja latencia. Su distribución permite diseñar arquitecturas resistentes a fallos.
Edge locations: Puntos de presencia distribuidos globalmente para ofrecer contenido y servicios con menor latencia, utilizados principalmente por el servicio de CDN CloudFront.

Formas de interactuar con AWS

AWS ofrece tres formas principales para administrar y consumir sus servicios:

Consola de administración: Interfaz gráfica accesible desde un navegador web, útil para configuraciones manuales y tareas de exploración.
CLI (Command Line Interface): Herramienta que permite interactuar con AWS mediante comandos en la terminal, ideal para automatización y administración avanzada.
SDKs (Software Development Kits): Librerías para distintos lenguajes de programación que permiten integrar y manipular recursos de AWS desde aplicaciones personalizadas.

Categorías de servicios

AWS agrupa sus servicios en distintas categorías, cada una enfocada en un área específica:

Cómputo: EC2 (máquinas virtuales), Lambda (funciones sin servidor), ECS/EKS (orquestación de contenedores).
Almacenamiento: S3 (almacenamiento de objetos), EBS (volúmenes de bloque), Glacier (archivado de bajo costo).
Bases de datos: RDS (relacional), DynamoDB (NoSQL), Aurora (relacional optimizada).
Redes y entrega de contenido: VPC (red privada virtual), Route 53 (DNS), CloudFront (CDN).
Seguridad e identidad: IAM (gestión de identidades y accesos), KMS (gestión de claves de cifrado), Shield (protección contra DDoS).

Modelo de responsabilidad compartida

Uno de los conceptos clave para trabajar con AWS es entender el modelo de responsabilidad compartida. AWS es responsable de la seguridad de la nube, lo que incluye la infraestructura física, el hardware, las redes y los servicios que ofrece. El cliente, por su parte, es responsable de la seguridad en la nube, es decir: configuración de recursos, control de accesos, cifrado de datos, gestión de credenciales y cumplimiento normativo.

Conocer la organización y funcionamiento del ecosistema de AWS te permite aprovechar al máximo sus capacidades y diseñar arquitecturas que sean seguras, escalables y eficientes. Esta base te ayudará a tomar decisiones correctas sobre qué servicios usar y cómo combinarlos, preparando el terreno para los temas más avanzados que veremos en los siguientes módulos.

3. Creación de tu cuenta AWS y configuración inicial

En esta clase realizaremos el primer paso práctico para comenzar a trabajar en la nube de Amazon Web Services: crear tu cuenta y dejarla configurada con las medidas básicas de seguridad y organización. Aunque el registro es sencillo, hacerlo correctamente desde el principio es fundamental para evitar vulnerabilidades, accesos no autorizados o gastos innecesarios.

Registro de la cuenta

Para comenzar, accede a aws.amazon.com y haz clic en “Crear una cuenta de AWS”. Durante el proceso de registro, se te pedirá:

Un correo electrónico válido y único para la cuenta.
Un nombre de usuario y contraseña seguros.
Datos de facturación y un método de pago (tarjeta de crédito o débito).
Un número de teléfono para verificación por llamada o SMS.

AWS ofrece el Plan gratuito (Free Tier), que permite usar ciertos servicios sin costo durante 12 meses con límites de uso. Esto es ideal para aprender y realizar pruebas sin generar cargos altos, aunque debes monitorear siempre tu consumo.

Medidas de seguridad iniciales

Una vez creada la cuenta, es fundamental configurar medidas de seguridad básicas:

Activar MFA (Multi-Factor Authentication) para la cuenta raíz, agregando una segunda capa de verificación mediante una aplicación como Google Authenticator o Authy.
No usar la cuenta raíz para tareas diarias. En su lugar, crea un usuario administrativo en IAM con permisos de administrador y utiliza ese usuario para la gestión.
Configurar una política de contraseñas segura para todos los usuarios: longitud mínima, caracteres especiales y rotación periódica.

Organización y gestión de acceso

En AWS, IAM (Identity and Access Management) es el servicio para gestionar usuarios, grupos, roles y permisos. Desde el inicio, es buena práctica:

Asignar permisos según el principio de mínimo privilegio.
Crear grupos para roles similares y evitar asignar permisos directamente a usuarios individuales.
Configurar etiquetas (tags) para identificar recursos según proyecto, ambiente o responsable.

Configuración de AWS CLI

Si planeas interactuar con AWS desde la terminal, instala y configura la CLI (Command Line Interface). Esto implica guardar de forma segura tus credenciales (Access Key y Secret Key) y definir una región predeterminada para tus operaciones. Tener la CLI lista desde el inicio facilita la automatización y el despliegue de recursos.

Control de costos

Un paso crucial es activar alertas de facturación. Con Billing Alerts y CloudWatch puedes recibir notificaciones cuando el consumo supere un umbral definido. Esto ayuda a prevenir cargos inesperados, especialmente cuando estás en etapa de pruebas y exploración.

Configurar bien tu cuenta desde el principio es una inversión en seguridad, control y tranquilidad. Con la cuenta creada, los accesos seguros configurados y las alertas de costos activadas, estarás listo para comenzar a desplegar y administrar servicios de AWS de forma profesional y sin riesgos innecesarios.

4. Comprendiendo el modelo de precios en AWS

Antes de comenzar a usar servicios en AWS de forma intensiva, es esencial entender cómo funciona su modelo de precios. Esto no solo te ayudará a evitar sorpresas en la factura, sino que también te permitirá optimizar recursos y elegir las opciones más rentables para cada proyecto. AWS sigue un esquema de pago por uso, lo que significa que pagas únicamente por la capacidad que consumes, sin contratos a largo plazo ni grandes inversiones iniciales.

Principios del modelo de precios

Aunque cada servicio de AWS tiene su propia estructura de precios, existen patrones comunes:

Pago por uso: Facturación en función del tiempo de uso (por hora o segundo), cantidad de datos almacenados o volumen de datos transferidos.
Escalabilidad automática: Ajuste dinámico de recursos para adaptarse a la demanda, evitando pagar por capacidad infrautilizada.
Sin compromiso inicial: Puedes iniciar o detener servicios cuando lo necesites, sin penalizaciones por cancelación.

Opciones de facturación

AWS ofrece varias modalidades para optimizar costos:

On-Demand: Ideal para cargas de trabajo variables o impredecibles, pagando solo por el tiempo exacto de uso.
Reserved Instances (RIs): Descuentos significativos a cambio de un compromiso de uso por 1 o 3 años. Útil para cargas estables.
Savings Plans: Flexibilidad para obtener descuentos comprometiéndose a un gasto horario fijo durante un periodo determinado.
Spot Instances: Permiten usar capacidad sobrante de AWS con descuentos de hasta el 90%, pero con riesgo de interrupción.

Componentes que afectan el costo

Los costos en AWS pueden provenir de múltiples factores, por ejemplo:

Tiempo de ejecución de instancias o funciones.
Volumen de datos almacenados y clase de almacenamiento utilizada.
Ancho de banda utilizado para transferencias de datos dentro y fuera de AWS.
Servicios adicionales como balanceadores de carga, direcciones IP elásticas o monitoreo avanzado.

Herramientas de control y estimación

Para gestionar los costos, AWS ofrece herramientas como:

AWS Pricing Calculator: Calculadora en línea para estimar el costo mensual de soluciones antes de implementarlas.
Cost Explorer: Análisis detallado del gasto por servicio, región y periodo de tiempo.
Budgets: Creación de presupuestos y alertas automáticas para mantener el gasto bajo control.

Buenas prácticas para optimizar costos

Apagar instancias y recursos no utilizados.
Usar clases de almacenamiento adecuadas según el patrón de acceso a datos.
Implementar escalado automático para evitar sobredimensionamiento.
Monitorear y revisar el gasto periódicamente para ajustar configuraciones.

Entender el modelo de precios de AWS es tan importante como dominar la parte técnica. Un diseño bien optimizado no solo funciona correctamente, sino que también es eficiente en costos. Con este conocimiento, podrás tomar decisiones que equilibren rendimiento, disponibilidad y gasto, asegurando un uso inteligente de los recursos en la nube.

5. Regiones, Zonas de disponibilidad y Edge Locations en AWS

Para diseñar arquitecturas en AWS que sean eficientes, seguras y con baja latencia, es fundamental entender cómo está organizada físicamente y lógicamente su infraestructura global. AWS no es una nube “difusa” sin ubicación, sino una red bien estructurada de centros de datos distribuidos estratégicamente en todo el mundo. En esta clase exploraremos tres conceptos clave: regiones, zonas de disponibilidad y edge locations.

Regiones

Una región de AWS es una ubicación geográfica específica que contiene un conjunto de zonas de disponibilidad. Cada región está aislada de las demás para garantizar independencia y redundancia. Se identifican con un código, por ejemplo:

us-east-1 — Norte de Virginia (Estados Unidos).
eu-west-1 — Irlanda.
ap-southeast-2 — Sídney (Australia).

Elegir la región adecuada es una decisión estratégica que depende de factores como:

Latencia: Cuanto más cerca esté la región de tus usuarios finales, menor será el tiempo de respuesta.
Cumplimiento legal: Algunas regulaciones exigen que los datos se almacenen en un país o región específica.
Disponibilidad de servicios: No todos los servicios de AWS están disponibles en todas las regiones.
Costos: El precio de algunos servicios puede variar de una región a otra.

Zonas de disponibilidad (Availability Zones - AZs)

Dentro de cada región existen varias zonas de disponibilidad. Una AZ es un centro de datos independiente con su propia energía, refrigeración y conectividad, pero interconectado con otras AZs de la misma región mediante enlaces de baja latencia. Este diseño permite que, si una AZ presenta un fallo, las demás puedan mantener la operación sin interrupciones significativas.

En la práctica, cuando se habla de “alta disponibilidad” en AWS, implica distribuir recursos y cargas de trabajo entre múltiples AZs dentro de la misma región.

Edge Locations

Las edge locations son puntos de presencia que AWS utiliza para acercar contenido y servicios a los usuarios finales. Se utilizan principalmente en el servicio Amazon CloudFront (Content Delivery Network, CDN) para almacenar en caché contenido estático o dinámico y entregarlo con baja latencia.

Por ejemplo, si tienes usuarios en Latinoamérica pero tu infraestructura principal está en Estados Unidos, las edge locations pueden servir los recursos más solicitados desde ubicaciones cercanas como São Paulo o Bogotá, reduciendo considerablemente el tiempo de carga.

Buenas prácticas en el uso de regiones y AZs

Seleccionar regiones cercanas a los usuarios y que cumplan con la legislación aplicable.
Diseñar arquitecturas distribuidas en múltiples AZs para tolerancia a fallos.
Usar edge locations para mejorar la experiencia de usuarios globales.
Verificar la disponibilidad del servicio requerido en la región elegida antes de implementar.

Comprender la estructura de regiones, zonas de disponibilidad y edge locations te permitirá diseñar soluciones que aprovechen al máximo la infraestructura de AWS. Esto se traduce en menor latencia, mayor disponibilidad y cumplimiento normativo, aspectos esenciales en cualquier proyecto de arquitectura en la nube.

2. Servicios esenciales de AWS

8 lecciones

1. Servicios que requieres conocer

Almacenamiento con Amazon S3

Amazon Simple Storage Service (Amazon S3) es el servicio de almacenamiento de objetos más utilizado en AWS y uno de los pilares de la computación en la nube. Fue diseñado para proporcionar alta durabilidad (99,999999999% o “11 nueves”), alta disponibilidad y escalabilidad prácticamente ilimitada. Con S3, puedes almacenar cualquier tipo de archivo, desde documentos pequeños hasta grandes volúmenes de datos como videos o respaldos completos, y acceder a ellos en cualquier momento desde cualquier parte del mundo.

Una de sus grandes ventajas es su modelo de pago por uso, en el que solo pagas por el almacenamiento que consumes y las solicitudes o transferencias de datos que realizas. Esto lo convierte en una opción ideal para proyectos que necesitan flexibilidad y crecimiento progresivo, evitando la inversión inicial que requiere una infraestructura física tradicional.

El almacenamiento de objetos, que es el modelo que utiliza S3, se diferencia del almacenamiento en bloque o de archivos en que los datos no se organizan en jerarquías reales de carpetas, sino como “objetos” dentro de un contenedor llamado bucket. Cada objeto incluye el contenido del archivo, metadatos (información adicional como el tipo de archivo, fecha de creación o etiquetas) y una clave única que lo identifica dentro del bucket.

Para comenzar a usar S3, lo primero es crear un bucket. Cada bucket debe tener un nombre único a nivel global y estar asociado a una región de AWS. La elección de la región es importante porque influye en la latencia (tiempo de respuesta), en el cumplimiento normativo (ubicación de los datos) y en el costo del servicio. Dentro del bucket, puedes organizar objetos usando prefijos y etiquetas que te faciliten la búsqueda y la gestión.

Amazon S3 ofrece distintas clases de almacenamiento para adaptarse a diferentes patrones de acceso y necesidades de costo. Por ejemplo, S3 Standard es ideal para datos de acceso frecuente, S3 Standard-IA (Infrequent Access) para datos de acceso poco frecuente, S3 One Zone-IA para datos que no requieren alta redundancia, y S3 Glacier o Glacier Deep Archive para archivado de largo plazo a muy bajo costo. También existe S3 Intelligent-Tiering, que mueve automáticamente los objetos entre clases según su uso.

En términos de seguridad, S3 permite un control detallado de accesos mediante políticas de bucket, listas de control de acceso (ACL) y permisos configurados en IAM. Además, soporta cifrado en reposo (AES-256 o KMS) y cifrado en tránsito (HTTPS) para proteger la integridad y confidencialidad de los datos. Un aspecto clave para evitar exposiciones accidentales es el bloqueo de acceso público, que puede activarse a nivel de cuenta o de bucket.

Los casos de uso de S3 son muy amplios: almacenamiento de copias de seguridad, hospedaje de sitios web estáticos, distribución de contenido multimedia, almacenamiento intermedio para análisis de datos, integración con flujos de big data o machine learning, entre otros. Gracias a su integración con otros servicios de AWS, S3 puede convertirse en el núcleo de muchas arquitecturas modernas.

Como buenas prácticas, es recomendable habilitar el versionado de objetos para prevenir la pérdida de datos por eliminaciones o modificaciones accidentales, configurar reglas de ciclo de vida para optimizar costos automáticamente, y monitorear la actividad del bucket con CloudTrail y CloudWatch. También es esencial implementar políticas de acceso restrictivas desde el inicio para mantener la seguridad.

En resumen, Amazon S3 es una solución de almacenamiento versátil, segura y altamente escalable, esencial para cualquier arquitecto o desarrollador que trabaje en la nube. Dominar su funcionamiento, sus opciones de configuración y sus clases de almacenamiento es un paso imprescindible para construir soluciones eficientes y confiables en AWS.

Cómputo con Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) es uno de los servicios más fundamentales de AWS y proporciona capacidad de cómputo escalable bajo demanda. Básicamente, permite lanzar máquinas virtuales en la nube —denominadas instancias— con las características que necesites, pagando solo por el tiempo que estén en ejecución. Esto significa que puedes implementar desde un sitio web simple hasta complejas aplicaciones empresariales sin la inversión inicial que requeriría comprar servidores físicos.

La gran fortaleza de EC2 radica en su flexibilidad. Puedes elegir entre distintos tipos de instancias, optimizados para casos de uso específicos como procesamiento intensivo de CPU, grandes cargas de memoria, almacenamiento de alto rendimiento o incluso aceleración gráfica. Cada instancia se lanza a partir de una Amazon Machine Image (AMI), que define el sistema operativo y, opcionalmente, aplicaciones y configuraciones iniciales. Existen AMIs proporcionadas por AWS, por la comunidad o que tú mismo puedes crear para replicar entornos personalizados.

En cuanto al almacenamiento, las instancias EC2 suelen utilizar Elastic Block Store (EBS), que actúa como un disco duro virtual persistente. También pueden usar almacenamiento efímero, que desaparece cuando la instancia se detiene, o integrarse con Amazon S3 para guardar datos de forma más económica. La seguridad y el control del acceso se gestionan con grupos de seguridad, que funcionan como firewalls virtuales donde defines qué tráfico entra y sale de cada instancia.

El modelo de precios de EC2 está pensado para adaptarse a distintos escenarios. Puedes pagar On-Demand, ideal para cargas impredecibles; reservar capacidad por uno o tres años para obtener descuentos significativos; o aprovechar Spot Instances, que ofrecen precios muy bajos usando capacidad sobrante, aunque con riesgo de interrupción. Además, con los Savings Plans puedes comprometerte a un gasto fijo por hora y obtener flexibilidad para cambiar entre diferentes tipos de instancias.

Para garantizar que las aplicaciones escalen y se mantengan disponibles, EC2 se integra con Auto Scaling y Elastic Load Balancing. El primero ajusta automáticamente la cantidad de instancias según la demanda, y el segundo distribuye el tráfico entre ellas para evitar sobrecargas. Esta combinación es clave para aplicaciones críticas que deben responder bien en picos de uso.

En temas de seguridad, además de los grupos de seguridad, es recomendable usar roles de IAM para otorgar permisos temporales a las instancias, evitando credenciales fijas. Para conectarte a instancias Linux se usan pares de claves SSH, mientras que en Windows se utilizan credenciales RDP. También es aconsejable mantener las instancias actualizadas y realizar respaldos periódicos mediante snapshots de los volúmenes EBS.

En resumen, Amazon EC2 es una pieza central en la mayoría de arquitecturas en AWS. Su capacidad de adaptarse a múltiples casos de uso, junto con su escalabilidad y opciones de costo flexible, lo convierten en una herramienta esencial tanto para desarrolladores como para arquitectos de sistemas. Dominar EC2 te permitirá construir soluciones más eficientes, seguras y resilientes en la nube.

Bases de datos con Amazon RDS y Amazon DynamoDB

En la nube de AWS, el manejo de datos estructurados y no estructurados se facilita enormemente gracias a servicios administrados como Amazon RDS y Amazon DynamoDB. Estos servicios eliminan gran parte del trabajo de configuración, mantenimiento y escalado que normalmente requiere administrar bases de datos en servidores propios, permitiéndote enfocarte en el diseño y uso de la información.

Amazon RDS (Relational Database Service) es un servicio administrado para bases de datos relacionales. Soporta motores populares como MySQL, PostgreSQL, MariaDB, Oracle y Microsoft SQL Server, además de Amazon Aurora, un motor optimizado para la nube que ofrece alto rendimiento y compatibilidad con MySQL y PostgreSQL. Con RDS, AWS se encarga de tareas como la instalación, configuración, parches de seguridad, backups automáticos y replicación, reduciendo la carga operativa. Esto lo hace ideal para aplicaciones que requieren integridad referencial, transacciones y estructuras de datos bien definidas.

En RDS puedes configurar opciones de alta disponibilidad mediante Multi-AZ Deployment, lo que replica la base de datos en una segunda zona de disponibilidad para garantizar continuidad en caso de fallo. También puedes habilitar réplicas de solo lectura (Read Replicas) para distribuir la carga de consultas y mejorar el rendimiento de lectura. La capacidad de escalado vertical y horizontal depende del motor de base de datos y del tipo de instancia que elijas.

Por otro lado, Amazon DynamoDB es un servicio de base de datos NoSQL totalmente administrado, diseñado para ofrecer rendimiento rápido y consistente con escalabilidad prácticamente ilimitada. Al ser una base de datos de tipo clave-valor y documento, DynamoDB es ideal para aplicaciones que requieren baja latencia y grandes volúmenes de datos distribuidos, como juegos en línea, plataformas de comercio electrónico o aplicaciones móviles con millones de usuarios.

Una de las principales ventajas de DynamoDB es que escala automáticamente para manejar cambios en la demanda, y permite elegir entre capacidad bajo demanda o capacidad provisionada, ajustando costos y rendimiento según tus necesidades. También ofrece integración con DynamoDB Streams para capturar cambios en tiempo real y Global Tables para replicar datos en múltiples regiones, mejorando la disponibilidad global.

En términos de seguridad, tanto RDS como DynamoDB se integran con AWS Identity and Access Management (IAM) para controlar el acceso, soportan cifrado en reposo y en tránsito, y permiten aislar las bases de datos dentro de una Amazon VPC para protegerlas del acceso público no autorizado.

A la hora de elegir entre RDS y DynamoDB, la decisión suele depender del tipo de datos y del patrón de acceso. Si necesitas transacciones complejas, integridad referencial y estructuras bien definidas, RDS es la elección natural. Si requieres escalabilidad masiva, baja latencia y un modelo flexible de datos, DynamoDB es la opción más adecuada.

En conclusión, dominar estos dos servicios te permitirá cubrir un espectro muy amplio de necesidades de almacenamiento y procesamiento de datos en AWS. RDS aporta la solidez del mundo relacional, mientras que DynamoDB ofrece la flexibilidad y escalabilidad del modelo NoSQL, y combinarlos estratégicamente puede ser clave para el éxito de muchas soluciones modernas.

Redes con Amazon VPC

Amazon Virtual Private Cloud (Amazon VPC) es el servicio de AWS que te permite crear y administrar una red virtual aislada dentro de la nube. En esta red puedes definir tu propio rango de direcciones IP, crear subredes, configurar tablas de enrutamiento y establecer reglas de seguridad. VPC es la base sobre la que se construyen prácticamente todos los entornos en AWS, ya que permite controlar cómo se comunican tus recursos entre sí y con el exterior.

Cuando creas una VPC, básicamente estás construyendo una red personalizada en la nube que se comporta de forma similar a una red local tradicional, pero con la flexibilidad y escalabilidad de AWS. Puedes segmentar esa red en subredes, que pueden ser públicas (con acceso directo a Internet) o privadas (sin acceso directo desde Internet, típicamente para bases de datos o servicios internos).

El control del tráfico dentro de una VPC se realiza mediante varios componentes. Las tablas de enrutamiento definen hacia dónde se envía el tráfico desde una subred. Las Internet Gateways permiten la comunicación entre recursos de la VPC y la red pública de Internet. Por su parte, los NAT Gateways y las instancias NAT permiten que recursos en subredes privadas inicien conexiones hacia Internet (por ejemplo, para actualizaciones), sin exponerse a conexiones entrantes.

La seguridad se gestiona a dos niveles: con grupos de seguridad (firewalls virtuales aplicados a instancias) y con listas de control de acceso a la red (NACLs) que funcionan a nivel de subred. Los grupos de seguridad son estatales (si permites tráfico entrante, la respuesta se permite automáticamente), mientras que las NACLs son listas explícitas que permiten o bloquean tráfico según reglas.

Otro aspecto importante es la conectividad híbrida. VPC se puede extender para comunicarse con redes locales mediante VPNs cifradas o usando AWS Direct Connect para enlaces dedicados de baja latencia y alto rendimiento. También puedes establecer conexiones privadas entre VPCs mediante VPC Peering o usar Transit Gateway para gestionar la interconexión de múltiples redes.

Diseñar correctamente una VPC implica pensar en aspectos como el tamaño de la red (definido por el bloque CIDR), la separación de cargas de trabajo en subredes públicas y privadas, y la configuración de medidas de seguridad que minimicen el riesgo de accesos no autorizados. Por ejemplo, colocar bases de datos en subredes privadas y exponer a Internet únicamente los balanceadores de carga o servidores de aplicación.

En conclusión, Amazon VPC es el cimiento de cualquier arquitectura en AWS. Controlar su configuración y entender cómo interactúa con otros servicios es esencial para construir entornos seguros, organizados y con un rendimiento óptimo. Un buen diseño de red en la nube no solo garantiza la conectividad, sino también la protección y el aislamiento de tus recursos.

Balanceo de carga con Elastic Load Balancing (ELB)

En aplicaciones modernas, especialmente aquellas que deben atender a miles o millones de usuarios, distribuir el tráfico de manera eficiente es clave para garantizar un buen rendimiento y alta disponibilidad. En AWS, esta tarea se realiza mediante Elastic Load Balancing (ELB), un servicio que reparte automáticamente el tráfico entrante entre múltiples recursos, como instancias EC2, contenedores, direcciones IP o incluso funciones Lambda.

El objetivo principal de ELB es evitar que un solo servidor se sature mientras otros están subutilizados, y asegurar que, si un recurso falla, el tráfico se redirija automáticamente a otros que sigan disponibles. Esto no solo mejora la experiencia del usuario final, sino que también aumenta la tolerancia a fallos y permite escalar de forma más sencilla.

Elastic Load Balancing ofrece varios tipos de balanceadores, cada uno adaptado a escenarios distintos. El Application Load Balancer (ALB) funciona a nivel de capa 7 (HTTP/HTTPS) y permite decisiones de enrutamiento basadas en el contenido de las solicitudes, como la URL, cabeceras o cookies. El Network Load Balancer (NLB) trabaja a nivel de capa 4 (TCP/UDP) y está optimizado para manejar grandes volúmenes de tráfico con latencias muy bajas. Por último, el Gateway Load Balancer (GWLB) se utiliza para distribuir tráfico hacia dispositivos virtuales de seguridad o análisis, como firewalls o sistemas de detección de intrusiones.

La integración de ELB con Auto Scaling es una de sus mayores ventajas. Cuando la demanda aumenta, Auto Scaling puede lanzar nuevas instancias EC2 que se registran automáticamente en el balanceador, y cuando la demanda disminuye, se pueden retirar sin interrumpir el servicio. Esto permite ajustar la capacidad en tiempo real sin intervención manual.

En cuanto a la seguridad, ELB se integra con Security Groups y puede usarse junto con AWS Certificate Manager para manejar certificados SSL/TLS y así habilitar conexiones seguras (HTTPS). Además, soporta el uso de health checks, que son comprobaciones automáticas de estado que determinan si un recurso está funcionando correctamente antes de enviarle tráfico.

Un uso típico sería colocar un ALB frente a una arquitectura de microservicios que recibe tráfico HTTP/HTTPS, donde cada ruta se dirige a un conjunto de contenedores distintos. En cambio, para servicios financieros o de juegos en línea que requieren alta velocidad y conexiones persistentes, un NLB puede ser la mejor opción.

Elastic Load Balancing es una pieza fundamental para cualquier arquitectura escalable en AWS. Al distribuir la carga de manera inteligente, proteger las conexiones y trabajar de forma conjunta con Auto Scaling, ELB te permite construir aplicaciones que no solo soporten grandes volúmenes de tráfico, sino que también se adapten de forma dinámica a las necesidades cambiantes de los usuarios.

Monitoreo y métricas con Amazon CloudWatch

En cualquier infraestructura en la nube, no basta con desplegar recursos: es esencial monitorearlos para asegurarse de que están funcionando correctamente, detectar problemas antes de que afecten a los usuarios y optimizar su rendimiento y costos. En AWS, la herramienta principal para lograr esto es Amazon CloudWatch, un servicio que recopila y analiza métricas, logs y eventos de casi todos los servicios de la plataforma.

CloudWatch permite centralizar la observación de tu entorno, ofreciendo visibilidad en tiempo real de lo que sucede en tus instancias EC2, bases de datos RDS, buckets S3, balanceadores de carga, funciones Lambda y muchos otros recursos. Esta visibilidad es clave para tomar decisiones informadas sobre escalabilidad, ajustes de configuración o medidas de seguridad.

El servicio se basa en tres elementos principales. Primero, las métricas, que son datos cuantitativos sobre el rendimiento o el estado de un recurso (como el uso de CPU, la memoria, el número de solicitudes o el tráfico de red). Segundo, los logs, que permiten almacenar y analizar registros generados por tus aplicaciones o por los servicios de AWS. Y tercero, los eventos, que representan cambios o situaciones específicas y pueden servir para automatizar respuestas, como el escalado automático de recursos.

Con CloudWatch puedes crear alarmas que se activan cuando una métrica supera un umbral que hayas definido. Por ejemplo, si la CPU de una instancia EC2 permanece por encima del 80% durante más de cinco minutos, la alarma podría enviar una notificación a través de Amazon SNS o activar una acción automática, como añadir más instancias mediante Auto Scaling.

La funcionalidad de dashboards permite visualizar métricas en gráficos personalizados, facilitando la supervisión de varios recursos al mismo tiempo. Esto es especialmente útil para operaciones de equipos DevOps o administradores de sistemas que necesitan una visión consolidada del estado del sistema.

CloudWatch Logs, por su parte, ofrece almacenamiento y análisis de registros, pudiendo incluso filtrar y buscar patrones específicos. Además, se integra con servicios como AWS Lambda para reaccionar en tiempo real ante ciertos eventos o anomalías detectadas en los logs.

En cuanto a buenas prácticas, es recomendable identificar métricas críticas para tu aplicación, establecer umbrales y alarmas acordes a tu capacidad de respuesta, y configurar retención de logs según necesidades legales o de auditoría. También es útil etiquetar y agrupar métricas para facilitar el análisis por aplicación, entorno o equipo responsable.

Amazon CloudWatch es una herramienta esencial para la observabilidad en AWS. Su capacidad para recopilar datos, generar alertas y ofrecer visibilidad centralizada te permite mantener el control de tu infraestructura y responder de forma proactiva a problemas, optimizando tanto el rendimiento como los costos.

Gestión de identidades y accesos con AWS IAM

En un entorno en la nube, la seguridad y el control de acceso son fundamentales. En AWS, el servicio encargado de esta tarea es Identity and Access Management (IAM), que permite gestionar usuarios, grupos, roles y permisos de forma centralizada. Con IAM, puedes definir exactamente quién puede acceder a qué recursos y bajo qué condiciones, aplicando el principio de mínimo privilegio para reducir riesgos.

IAM funciona a través de identidades (usuarios, grupos y roles) y políticas que describen permisos. Los usuarios representan personas o aplicaciones que interactúan con AWS; los grupos agrupan usuarios para asignar permisos comunes; y los roles son identidades temporales que pueden asumir usuarios o servicios para realizar tareas específicas sin compartir credenciales permanentes.

Las políticas de IAM se definen en formato JSON y establecen qué acciones están permitidas o denegadas sobre recursos concretos. Por ejemplo, una política podría permitir a un usuario listar y leer objetos en un bucket S3, pero no eliminarlos. Estas políticas se pueden adjuntar a usuarios, grupos o roles, y se evalúan de forma conjunta para determinar el acceso final.

Una característica clave de IAM es su integración con otros servicios de AWS. Por ejemplo, puedes asignar un rol de IAM a una instancia EC2 para que pueda acceder a un bucket S3 sin almacenar credenciales dentro de la máquina. También puedes usar IAM para habilitar Single Sign-On o federar identidades desde un directorio corporativo, permitiendo a los usuarios iniciar sesión con sus credenciales existentes.

En cuanto a seguridad, AWS recomienda activar autenticación multifactor (MFA) para todos los usuarios con acceso privilegiado. También es buena práctica evitar el uso de la cuenta raíz para tareas diarias, limitándola solo a operaciones críticas y protegidas con MFA.

IAM se complementa con Service Control Policies (SCPs) en entornos con AWS Organizations, lo que permite establecer restricciones a nivel global para todas las cuentas de una organización. Esto es útil para prevenir la creación de recursos no autorizados o el uso de servicios en regiones específicas.

En resumen, AWS IAM es la piedra angular de la seguridad en la nube de Amazon. Su correcta implementación garantiza que solo las personas o procesos autorizados puedan interactuar con los recursos, y que lo hagan con los permisos estrictamente necesarios. Dominar IAM no solo mejora la seguridad, sino que también facilita el cumplimiento normativo y la administración eficiente de entornos complejos.

2. Amazon S3

Amazon S3 (Simple Storage Service) es un servicio de almacenamiento de objetos ofrecido por Amazon Web Services (AWS) que ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento. Esto lo hace adecuado para una gran variedad de usos, como sitios web, aplicaciones móviles, respaldo y restauración, archivado, aplicaciones empresariales, dispositivos IoT y análisis de big data.

Clases de Almacenamiento en S3

Cada clase de almacenamiento está optimizada para un caso de uso específico:

S3 Standard: Uso general, acceso frecuente, alta disponibilidad y rendimiento.
S3 Intelligent-Tiering: Optimiza automáticamente los costos para datos con patrones de acceso variables.
S3 Standard-IA: Datos poco accedidos pero que requieren acceso rápido cuando se necesitan.
S3 One Zone-IA: Igual que Standard-IA pero en una sola zona de disponibilidad, más económico.
S3 Glacier: Archivado a largo plazo con costos muy bajos y tiempos de recuperación en minutos a horas.
S3 Glacier Deep Archive: La opción más económica para archivado a muy largo plazo, recuperación en 12 horas.

Clase de Almacenamiento	Durabilidad	Disponibilidad	Accesibilidad	Características Principales
S3 Standard	99.999999999% (11 nueves)	99.99%	Acceso inmediato	Ideal para datos de acceso frecuente.
S3 Intelligent-Tiering	99.999999999% (11 nueves)	99.9%	Acceso inmediato	Optimización automática de costos para datos con acceso variable.
S3 Standard-IA	99.999999999% (11 nueves)	99.9%	Acceso rápido, con costo	Para datos poco accedidos, pero que requieren acceso rápido.
S3 One Zone-IA	99.999999999% (11 nueves)	99.5%	Acceso rápido, con costo	Más económico, datos en una sola AZ.
S3 Glacier	99.999999999% (11 nueves)	99.99% (indirecto)	Acceso en minutos a horas	Archivado a largo plazo con costos muy bajos.
S3 Glacier Deep Archive	99.999999999% (11 nueves)	99.99% (indirecto)	Acceso en 12 horas	Archivado a muy largo plazo al menor costo.

Casos de Uso por Clase de Almacenamiento en Amazon S3

S3 Standard

S3 Standard está diseñado para datos de acceso frecuente que requieren alta disponibilidad y baja latencia. Es ideal para sitios web estáticos, donde se almacenan imágenes, estilos CSS, archivos JavaScript y otros recursos de uso constante. También es perfecto para aplicaciones móviles que necesitan servir archivos multimedia (fotos, audio, video) a miles de usuarios en tiempo real. Otro caso de uso clave es la distribución de grandes volúmenes de datos, como software, datasets de machine learning o contenido multimedia global, aprovechando la integración con Amazon CloudFront para acelerar la entrega.

S3 Intelligent-Tiering

S3 Intelligent-Tiering es la mejor opción cuando los patrones de acceso son impredecibles o cambian con el tiempo. Los objetos se mueven automáticamente entre niveles de acceso frecuente e infrecuente, lo que optimiza costos sin necesidad de gestión manual. Es ampliamente utilizado en Big Data y proyectos de analítica, donde algunos datos son accedidos constantemente durante fases de exploración o reportes, pero después se consultan con menor frecuencia. También es muy útil para datos de IoT y telemetría, donde la frecuencia de consultas disminuye con el tiempo.

S3 Standard-IA (Infrequent Access)

S3 Standard-IA está orientado a datos que no se consultan con frecuencia, pero que deben estar disponibles de forma rápida cuando se necesiten. Es ideal para respaldos de datos críticos (por ejemplo, bases de datos empresariales), planes de recuperación de desastres que requieren restauración inmediata y archivos legales o financieros que deben conservarse durante años pero con accesibilidad inmediata. A pesar de ser más barato que Standard, tiene un costo por recuperación, por lo que es recomendable solo cuando los accesos son poco frecuentes.

S3 One Zone-IA

S3 One Zone-IA almacena los datos en una sola zona de disponibilidad, reduciendo costos en comparación con Standard-IA. Es ideal para datos replicables que pueden regenerarse fácilmente, como miniaturas de imágenes, copias temporales de procesamiento de video o datos secundarios de respaldos que ya existen en otro sistema. También es muy utilizado en entornos de desarrollo y pruebas, donde no se requiere el mismo nivel de durabilidad y redundancia que en ambientes de producción.

S3 Glacier

S3 Glacier está optimizado para archivado de datos a largo plazo con costos de almacenamiento muy bajos. Se utiliza comúnmente en archivado regulatorio, donde las empresas deben retener documentos por obligación legal (por ejemplo, registros médicos o históricos contables). También es muy usado en la industria de medios de comunicación para almacenar bibliotecas de video y audio que deben conservarse durante décadas, pero cuyo acceso es poco frecuente. La recuperación de datos puede tomar de minutos a horas, dependiendo de la opción elegida.

S3 Glacier Deep Archive

S3 Glacier Deep Archive es la clase de almacenamiento más económica de AWS y está pensada para archivado de décadas. Se utiliza en escenarios donde los datos casi nunca se acceden, pero deben conservarse por razones de cumplimiento legal, auditorías o históricos corporativos. Un caso muy común es el de investigación científica, donde datasets masivos (como información genética, climática o astronómica) deben preservarse para consultas futuras, aunque el acceso sea extremadamente raro. Su tiempo de recuperación es más largo (12 a 48 horas), lo cual debe tenerse en cuenta en la planificación.

Limitaciones de Amazon S3

Tamaño de objeto: Máximo de 5 TB por objeto. Archivos grandes requieren multipart upload.
Rendimiento: No es ideal para latencias ultra bajas.
Consistencia: Actualmente ofrece consistencia fuerte en todas las operaciones.
Costos: Incluyen almacenamiento, solicitudes y transferencias de datos.
Seguridad y acceso: Requiere correcta configuración de políticas y permisos.
Límites de la API: AWS impone límites de solicitudes por bucket.

S3 Event Notifications

Amazon S3 Event Notifications permiten que tus buckets emitan eventos automáticos cuando se producen cambios en los objetos, como la creación, eliminación, restauración desde Glacier o copias.

Estos eventos pueden integrarse con otros servicios de AWS como Amazon SNS para notificaciones, Amazon SQS para encolado de mensajes, AWS Lambda para ejecutar código sin servidores o incluso endpoints externos HTTP/S. De esta manera, puedes automatizar procesos: por ejemplo, cuando un usuario sube una imagen, se dispara una función Lambda que la redimensiona y la guarda optimizada en otro bucket.

URLs Pre-Firmadas en S3

Las URLs prefirmadas de S3 permiten acceder o modificar objetos de manera segura durante un tiempo limitado, sin necesidad de exponer credenciales de AWS.

Se generan mediante el SDK o CLI de AWS y pueden permitir operaciones como GET (descargar) o PUT (subir). Esto es muy útil para compartir archivos de forma temporal con clientes, permitir que usuarios suban directamente datos a un bucket desde sus dispositivos o restringir accesos por tiempo limitado. Es importante generar estas URLs con permisos mínimos y monitorear su uso para evitar abusos.

ACLs en S3

Las Listas de Control de Acceso (ACLs) permiten definir qué usuarios o cuentas de AWS tienen permisos sobre un bucket o un objeto específico. Entre los permisos disponibles se incluyen lectura, escritura, lectura de ACLs, modificación de ACLs y control total. Aunque las ACLs siguen siendo soportadas, hoy en día se recomienda preferir Bucket Policies o IAM Policies, ya que son más flexibles y seguras. Aun así, las ACLs pueden ser útiles en escenarios específicos, como compartir objetos públicos en un sitio web estático.

S3 Transfer Acceleration

S3 Transfer Acceleration acelera la subida y descarga de archivos hacia y desde Amazon S3 utilizando la red global de CloudFront. Esto significa que los datos viajan primero al punto de presencia más cercano al usuario y luego se transfieren por la red interna de AWS hasta el bucket.

Es especialmente útil para usuarios en diferentes partes del mundo que necesitan subir grandes archivos a un bucket ubicado en otra región, reduciendo la latencia y mejorando la velocidad de transferencia.

S3 Glacier Vaults

En Amazon S3 Glacier, un vault es una “bóveda digital” donde se almacenan archivos a largo plazo. Estos vaults permiten aplicar políticas de retención para cumplir con normativas, mantienen inventarios automáticos de los archivos guardados, y ofrecen múltiples opciones de recuperación dependiendo del costo y la urgencia.

Además, soportan cifrado en reposo con AWS KMS para mayor seguridad. Un uso típico de Glacier Vaults es el almacenamiento de documentos legales o financieros que deben conservarse por años.

S3 Block Public Access

S3 Block Public Access es una configuración de seguridad que evita que buckets y objetos de S3 se expongan accidentalmente al público. Ofrece cuatro protecciones principales: BlockPublicAcls para bloquear nuevas ACLs públicas, IgnorePublicAcls para ignorar ACLs públicas existentes, BlockPublicPolicy para evitar políticas de bucket públicas y RestrictPublicBuckets para restringir accesos solo a cuentas autorizadas de AWS. Esta función es altamente recomendada para proteger datos sensibles y se puede aplicar tanto a nivel de bucket como de cuenta completa.

S3 Lifecycle Configuration

La configuración de ciclo de vida en S3 permite automatizar la gestión de objetos a lo largo del tiempo. Puedes definir reglas que indiquen cuándo mover objetos a clases de almacenamiento más económicas (como Glacier), cuándo eliminarlos automáticamente después de cierto período o cuándo borrar versiones antiguas en buckets versionados. Esto ayuda a optimizar costos y mantener una correcta gestión del almacenamiento. Por ejemplo, los registros de logs pueden guardarse en S3 Standard por 30 días, luego moverse a Glacier y finalmente eliminarse al cumplirse un año.

Modos de Recuperación en S3 Glacier

Cuando los datos se almacenan en S3 Glacier, la recuperación depende del tiempo y costo que elijas. Expedited Retrievals permiten acceder a los datos en 1-5 minutos, pero con un costo mayor. Standard Retrievals son la opción más común, con acceso en 3-5 horas y costo moderado. Bulk Retrievals permiten recuperar grandes volúmenes en 5-12 horas a un costo muy bajo. Adicionalmente, AWS permite definir políticas de recuperación como No Retrieval Limit (sin restricciones), Free Tier Only (solo dentro del nivel gratuito) y Max Retrieval Rate (con un límite de tasa de recuperación) para controlar mejor los gastos. Esto da flexibilidad para elegir entre rapidez y optimización de costos según las necesidades.

3. Amazon EC2

Amazon EC2 (Elastic Compute Cloud) es el servicio de computación en la nube de Amazon Web Services (AWS) que permite crear y administrar servidores virtuales conocidos como instancias. Con EC2 puedes ejecutar aplicaciones, bases de datos y servicios en un entorno flexible, seguro y escalable, sin necesidad de invertir en infraestructura física propia.

Características Clave

EC2 ofrece un conjunto de funcionalidades que lo convierten en la base de muchos proyectos en la nube:

Elasticidad: Permite lanzar, detener o terminar instancias en minutos, ajustando la capacidad de cómputo según la demanda.
Tipos de instancias: AWS dispone de instancias optimizadas para distintos usos: cómputo intensivo, memoria, almacenamiento o GPU.
Control total: Tienes acceso administrativo al sistema operativo (Linux o Windows) y puedes instalar y configurar cualquier software.
Integración: Se conecta de forma nativa con otros servicios como S3, RDS, CloudWatch y VPC.
Modelos de pago flexibles: Puedes elegir entre instancias bajo demanda, reservadas, spot o dedicadas según tus necesidades de costo y disponibilidad.

Casos de Uso de Amazon EC2

Amazon EC2 es uno de los servicios más versátiles de AWS y puede aplicarse a múltiples escenarios tecnológicos. Su flexibilidad en tipos de instancias, sistemas operativos y modelos de precios lo convierte en una solución adaptable para startups, empresas en crecimiento y grandes corporaciones.

Aplicaciones Web

EC2 permite hospedar sitios web y aplicaciones de forma sencilla utilizando servidores como Apache, Nginx o IIS. Es una solución ideal para proyectos que requieren escalabilidad, ya que las instancias pueden ajustarse dinámicamente a medida que crece el tráfico. Además, se integra fácilmente con servicios como Amazon RDS, S3 y CloudFront para construir aplicaciones web completas y de alto rendimiento.

Bases de Datos Personalizadas

Aunque AWS ofrece servicios administrados como RDS o Aurora, en algunos casos es necesario ejecutar bases de datos con configuraciones avanzadas o motores no soportados por esos servicios. Con EC2 puedes instalar y administrar tu propio motor de base de datos, como MongoDB, Cassandra o PostgreSQL en configuraciones específicas, con control total sobre el sistema operativo, almacenamiento y seguridad.

Procesamiento de Datos y Machine Learning

Gracias a su capacidad para usar instancias optimizadas con GPU o grandes cantidades de CPU y memoria, EC2 es ideal para cargas intensivas como análisis de Big Data, entrenamiento de modelos de inteligencia artificial o renderizado de video en alta resolución. Con la integración a servicios como Amazon EMR o SageMaker, los datos pueden procesarse de forma más rápida y eficiente.

Entornos de Desarrollo y Pruebas

EC2 ofrece la posibilidad de crear entornos aislados para desarrollo y pruebas, evitando la necesidad de invertir en servidores físicos. Esto permite a los equipos de desarrollo trabajar en paralelo en diferentes proyectos, probar configuraciones antes de llevarlas a producción y simular entornos reales de forma rápida y económica.

Aplicaciones Empresariales

Muchas organizaciones utilizan EC2 para migrar sistemas internos como ERP, CRM o SAP hacia la nube. Este tipo de aplicaciones requieren alta disponibilidad, seguridad y escalabilidad, características que EC2 proporciona a través de su integración con balanceadores de carga, almacenamiento elástico y redes privadas virtuales (VPC). De esta manera, las empresas logran modernizar su infraestructura y reducir los costos de mantenimiento de servidores físicos.

Ventajas de Amazon EC2

Amazon EC2 ofrece una serie de beneficios que lo convierten en uno de los pilares fundamentales de AWS. Estas ventajas permiten desplegar infraestructura en la nube de forma rápida, segura y rentable, adaptándose tanto a proyectos pequeños como a grandes entornos corporativos.

Escalabilidad

Con EC2 puedes aumentar o reducir la capacidad de cómputo en minutos, lo que permite responder a cambios en la demanda sin interrupciones. Por ejemplo, una aplicación de comercio electrónico puede incrementar sus recursos durante temporadas de alta demanda y reducirlos cuando la carga baja, optimizando costos y manteniendo un rendimiento constante.

Alcance Global

AWS cuenta con múltiples regiones y zonas de disponibilidad en todo el mundo. Esto significa que puedes lanzar instancias en ubicaciones cercanas a tus usuarios, reduciendo la latencia y mejorando la experiencia de acceso a tus aplicaciones, sin necesidad de invertir en centros de datos físicos en cada país.

Seguridad Avanzada

EC2 está diseñado con un fuerte enfoque en seguridad. Se integra con AWS Identity and Access Management (IAM) para la gestión de permisos, Security Groups para controlar el tráfico de red y Amazon VPC para aislar recursos en redes privadas. Esto te permite definir quién puede acceder a tus instancias y cómo se comunican, asegurando el cumplimiento de políticas de seguridad y regulaciones.

Costo-Eficiencia

Amazon EC2 ofrece diferentes modelos de precios que se adaptan a diversos escenarios. Las instancias bajo demanda permiten pagar solo por el tiempo de uso, las instancias reservadas ofrecen descuentos importantes a cambio de un compromiso a 1 o 3 años, y las instancias spot permiten ahorrar aprovechando capacidad no utilizada. Esta flexibilidad facilita optimizar costos en función del tipo de carga de trabajo.

Flexibilidad Tecnológica

EC2 permite elegir entre múltiples sistemas operativos como Linux, Windows, Ubuntu, Red Hat y más, además de instalar frameworks, aplicaciones y configuraciones personalizadas. También es posible utilizar AMIs (Amazon Machine Images) preconfiguradas para desplegar rápidamente aplicaciones. Esto le da a los equipos de desarrollo y operaciones la libertad de trabajar con el entorno más adecuado para sus necesidades.

Flexibilidad y Tipos de Instancias

La gran fortaleza de EC2 radica en su flexibilidad. Puedes elegir entre distintos tipos de instancias, optimizados para casos de uso específicos como procesamiento intensivo de CPU, grandes cargas de memoria, almacenamiento de alto rendimiento o incluso aceleración gráfica. Cada instancia se lanza a partir de una Amazon Machine Image (AMI), que define el sistema operativo y, opcionalmente, aplicaciones y configuraciones iniciales. Existen AMIs proporcionadas por AWS, por la comunidad o que tú mismo puedes crear para replicar entornos personalizados.

Las instancias EC2 pueden encontrarse en diferentes estados a lo largo de su ciclo de vida. Conocerlos es clave para entender costos y comportamiento:

pending: La instancia está en proceso de arranque (booting).
running: La instancia está activa y lista para usarse. En este estado se generan cargos por uso.
stopping: La instancia se encuentra en proceso de apagado.
stopped: La instancia está apagada, no se generan cargos por cómputo, pero sí por almacenamiento EBS asociado.
shutting-down: La instancia está en proceso de ser terminada permanentemente.
terminated: La instancia ha sido eliminada y no se puede volver a iniciar (a menos que se use Recycle Bin).
hibernated: La memoria RAM de la instancia se guarda en EBS para que al reanudarla continúe desde el mismo estado (similar a hibernación en laptops).

Almacenamiento en EC2

Las instancias EC2 suelen utilizar Elastic Block Store (EBS), que actúa como un disco duro virtual persistente. También pueden usar almacenamiento efímero, que desaparece cuando la instancia se detiene, o integrarse con Amazon S3 para guardar datos de forma más económica. La seguridad y el control del acceso se gestionan con grupos de seguridad, que funcionan como firewalls virtuales donde defines qué tráfico entra y sale de cada instancia.

Modelos de Precios

El modelo de precios de EC2 está pensado para adaptarse a distintos escenarios:

On-Demand: Ideal para cargas impredecibles, pagas solo por el tiempo que usas las instancias.
Reserved Instances: Permiten reservar capacidad por uno o tres años con descuentos significativos.
Spot Instances: Ofrecen precios muy bajos aprovechando la capacidad sobrante de AWS, aunque con riesgo de interrupción.
Savings Plans: Compromiso de gasto fijo por hora con flexibilidad para cambiar entre diferentes tipos de instancias.

Escalabilidad y Alta Disponibilidad

Para garantizar que las aplicaciones escalen y se mantengan disponibles, EC2 se integra con Auto Scaling y Elastic Load Balancing (ELB). Auto Scaling ajusta automáticamente la cantidad de instancias según la demanda, mientras que ELB distribuye el tráfico entre ellas para evitar sobrecargas. Esta combinación es clave para aplicaciones críticas que deben responder correctamente en picos de uso.

Seguridad y Acceso

Además de los grupos de seguridad, se recomienda usar roles de IAM para otorgar permisos temporales a las instancias, evitando el uso de credenciales fijas. Para conectarse a instancias Linux se utilizan pares de claves SSH, mientras que en Windows se emplean credenciales RDP. También es aconsejable mantener las instancias actualizadas y realizar respaldos periódicos mediante snapshots de los volúmenes EBS.

4. Resumen de servicios esenciales de AWS y su modelo de cobro

Hemos cubierto los servicios más utilizados en AWS, cada uno con un propósito específico dentro de una arquitectura en la nube. A continuación se presenta un resumen de su función, principales características y el esquema de facturación que utiliza cada uno.

1. Amazon S3 (Almacenamiento de objetos)

S3 es un servicio para almacenar objetos (archivos) de forma segura, escalable y con alta disponibilidad. Se utiliza para guardar desde copias de seguridad hasta contenido estático para sitios web. El acceso es global y puedes definir permisos granulares.

Cómo se cobra: Se paga por el volumen de datos almacenados (en GB al mes), el número y tipo de solicitudes (PUT, GET, DELETE), y la transferencia de datos saliente hacia Internet. El precio varía según la clase de almacenamiento utilizada (Standard, IA, Glacier, etc.).

2. Amazon EC2 (Cómputo en la nube)

EC2 proporciona capacidad de cómputo bajo demanda mediante máquinas virtuales llamadas instancias. Puedes elegir tipos de instancias optimizadas para cómputo, memoria, almacenamiento o GPU.

Cómo se cobra: El costo depende del tipo de instancia, la región, el tiempo de uso (por hora o por segundo), el almacenamiento asociado (EBS), la transferencia de datos y el modelo de compra elegido: On-Demand, Reserved Instances, Savings Plans o Spot.

3. Amazon RDS y DynamoDB (Bases de datos)

RDS ofrece bases de datos relacionales administradas, como MySQL, PostgreSQL, Oracle, SQL Server y Aurora, con backups automáticos y escalabilidad sencilla. DynamoDB es una base de datos NoSQL de alta disponibilidad y baja latencia, ideal para aplicaciones de gran volumen y rendimiento constante.

Cómo se cobra: En RDS, se paga por el tipo y tamaño de instancia, el almacenamiento asignado, las operaciones de I/O y las transferencias de datos. En DynamoDB, el costo depende de la capacidad provisionada o bajo demanda, el almacenamiento en GB y las lecturas/escrituras realizadas.

4. Amazon VPC (Red privada virtual)

VPC permite crear una red privada en AWS, definiendo subredes, tablas de enrutamiento y reglas de seguridad. Es la base para aislar y controlar el tráfico de los recursos en la nube.

Cómo se cobra: No hay costo por crear y usar una VPC básica. Se facturan componentes adicionales como NAT Gateways, direcciones IP elásticas, endpoints privados y transferencia de datos entre zonas o regiones.

5. Elastic Load Balancing (ELB)

ELB distribuye el tráfico entrante entre múltiples recursos para mejorar el rendimiento y la disponibilidad. Admite balanceadores a nivel de aplicación (ALB), de red (NLB) y gateway (GWLB).

Cómo se cobra: Se paga por hora de uso del balanceador activo y por el volumen de datos procesados (GB) a través de él. El tipo de balanceador influye en la tarifa.

6. Amazon CloudWatch (Monitoreo y métricas)

CloudWatch recopila métricas, logs y eventos de los servicios de AWS y tus aplicaciones, permitiendo crear alarmas y dashboards para supervisión en tiempo real.

Cómo se cobra: Incluye un nivel gratuito limitado. Los costos adicionales dependen del número de métricas personalizadas, dashboards, alarmas activas, almacenamiento y análisis de logs, y eventos procesados.

7. AWS IAM (Gestión de identidades y accesos)

IAM controla quién puede acceder a qué recursos y bajo qué condiciones, usando usuarios, grupos, roles y políticas. Es esencial para la seguridad en AWS.

Cómo se cobra: IAM no tiene costo adicional. Solo se paga por servicios relacionados que utilicen sus permisos (por ejemplo, el acceso a recursos que generen facturación).

Conclusión

Estos servicios forman el núcleo de muchas soluciones en AWS. Entender no solo cómo funcionan, sino también cómo se cobra por ellos, es clave para diseñar arquitecturas eficientes en costo y alto rendimiento. Optimizar el uso y elegir el modelo de facturación correcto puede representar ahorros significativos sin comprometer la calidad del servicio.

5. Amazon RDS

Amazon Relational Database Service (Amazon RDS) es un servicio administrado de AWS que facilita la creación, operación y escalado de bases de datos relacionales en la nube.

Con RDS puedes ejecutar motores de base de datos populares sin preocuparte por las tareas de administración complejas, como instalaciones, parches de software, configuración de copias de seguridad o monitoreo de rendimiento. El servicio está diseñado para ofrecer alta disponibilidad, seguridad y escalabilidad, con un modelo de pago por uso que elimina la necesidad de inversión en hardware.

Motores de Base de Datos Soportados

Amazon RDS soporta varios motores de base de datos relacional ampliamente utilizados en la industria:

Amazon Aurora: Motor desarrollado por AWS, compatible con MySQL y PostgreSQL, altamente escalable y optimizado para la nube.
MySQL: Uno de los motores de código abierto más usados en aplicaciones web.
PostgreSQL: Motor open-source avanzado, reconocido por su confiabilidad y extensibilidad.
MariaDB: Derivado de MySQL, con mejoras en rendimiento y compatibilidad.
Oracle Database: Soporta cargas empresariales complejas con capacidades avanzadas.
Microsoft SQL Server: Popular en entornos corporativos que utilizan tecnologías de Microsoft.

Características Clave de Amazon RDS

Entre sus principales funcionalidades destacan:

Automatización de tareas administrativas: Copias de seguridad automáticas, parches de software y restauración de fallos.
Escalabilidad: Ajuste de capacidad de cómputo y almacenamiento en minutos sin interrumpir la aplicación.
Alta disponibilidad: Implementación Multi-AZ (múltiples zonas de disponibilidad) para mejorar la tolerancia a fallos.
Seguridad: Cifrado en reposo y en tránsito, integración con IAM y control de accesos mediante VPC y grupos de seguridad.
Monitoreo: Integración con Amazon CloudWatch y Performance Insights para análisis de rendimiento.

Modelos de Almacenamiento en RDS

Amazon RDS ofrece distintos tipos de almacenamiento para adaptarse a diferentes cargas de trabajo:

Almacenamiento General Purpose (SSD): Equilibrio entre costo y rendimiento, ideal para la mayoría de aplicaciones.
Provisioned IOPS (SSD): Diseñado para cargas críticas que requieren alta velocidad de I/O como bases de datos transaccionales.
Magnetic: Opción más antigua y económica, recomendada solo para cargas pequeñas y no críticas.

Casos de Uso de Amazon RDS

Amazon RDS puede aplicarse en múltiples escenarios prácticos:

Aplicaciones Web y Móviles

Ideal para aplicaciones que requieren una base de datos relacional en segundo plano, como e-commerce, blogs o sistemas de reservas. Permite escalar automáticamente a medida que aumenta la demanda de usuarios.

Aplicaciones Empresariales

Permite ejecutar bases de datos críticas para sistemas ERP, CRM o herramientas de analítica empresarial, con la confiabilidad y disponibilidad que requieren los entornos corporativos.

Analítica y Reporting

Con RDS puedes mantener bases de datos para análisis de datos, integrándolas con servicios como Amazon Redshift o AWS Glue para obtener insights valiosos en tiempo real o por lotes.

Ambientes de Desarrollo y Pruebas

RDS permite crear rápidamente entornos de base de datos para pruebas, sin necesidad de complejas instalaciones ni configuración de hardware.

Ventajas de Usar Amazon RDS

Amazon RDS ofrece una serie de beneficios que facilitan la gestión de bases de datos en la nube, optimizando el tiempo de administración, reduciendo costos y aumentando la seguridad. A continuación se detallan sus principales ventajas:

Ahorro de Tiempo

RDS automatiza tareas administrativas como copias de seguridad, parches de software, aprovisionamiento y monitoreo, lo que libera a los equipos de TI para que se concentren en el desarrollo de aplicaciones y en la innovación del negocio en lugar de en la gestión de infraestructura.

Escalabilidad Bajo Demanda

Con Amazon RDS puedes escalar verticalmente (más recursos de CPU o memoria) o ampliar el almacenamiento de manera rápida y sin interrumpir el servicio. Esto permite responder de forma inmediata a picos de carga y mantener un rendimiento estable en todo momento.

Resiliencia y Alta Disponibilidad

La opción de replicación Multi-AZ garantiza que las bases de datos estén siempre disponibles, incluso en caso de fallos en el hardware o en la infraestructura. RDS crea automáticamente una réplica en otra zona de disponibilidad, lo que asegura continuidad del servicio y tolerancia a fallos.

Seguridad Avanzada

Amazon RDS protege los datos en reposo y en tránsito mediante cifrado. Además, se integra con AWS Identity and Access Management (IAM) y con Amazon VPC, lo que permite controlar quién accede a las bases de datos y desde dónde. Esto asegura el cumplimiento de políticas de seguridad y regulaciones de la industria.

Integración con el Ecosistema de AWS

RDS se integra de manera nativa con otros servicios de AWS como CloudWatch para monitoreo, Lambda para automatización y S3 para almacenamiento de datos. Esta compatibilidad permite construir soluciones más completas, escalables y alineadas con las necesidades del negocio.

Características Avanzadas de Amazon RDS

Además de las ventajas principales, Amazon RDS ofrece características avanzadas que permiten construir bases de datos más seguras, escalables y fáciles de administrar. Estas funcionalidades son clave para entornos empresariales y aplicaciones críticas.

Tipos de Implementación

RDS permite diferentes configuraciones según las necesidades del negocio:

Single-AZ: La opción más económica, donde la base de datos corre en una sola zona de disponibilidad. Recomendado para entornos de desarrollo o pruebas.
Multi-AZ: Replica automáticamente los datos en una zona de disponibilidad secundaria, lo que asegura alta disponibilidad y tolerancia a fallos. Ideal para producción.
Read Replicas: Réplicas de solo lectura que permiten escalar consultas intensivas sin sobrecargar la base de datos principal. Útil en aplicaciones con muchos reportes o dashboards.

Backups y Snapshots

Amazon RDS ofrece backups automáticos diarios que permiten restaurar la base de datos a cualquier punto dentro del periodo de retención configurado. Además, los administradores pueden crear snapshots manuales que permanecen disponibles hasta ser eliminados, muy útiles para migraciones o puntos de restauración antes de aplicar cambios importantes.

Monitoreo con Performance Insights

RDS incluye la herramienta Performance Insights, que permite identificar consultas lentas, visualizar consumo de CPU y analizar métricas de rendimiento en tiempo real. Esto facilita la optimización de la base de datos y la resolución de cuellos de botella sin necesidad de herramientas externas.

Compatibilidad Multi-Region

Con Amazon Aurora (motor soportado por RDS) se puede habilitar Aurora Global Database, lo que permite replicar datos en múltiples regiones de AWS con baja latencia. Esto es especialmente útil para aplicaciones globales que necesitan brindar tiempos de respuesta consistentes a usuarios en diferentes partes del mundo.

Consideraciones de Costos

El costo de usar RDS no se limita a la instancia de base de datos. También incluye el almacenamiento en EBS, los backups automáticos y la transferencia de datos. Es importante planificar el modelo de almacenamiento (General Purpose, IOPS Provisionado o Magnético) para balancear costo y rendimiento según el caso de uso.

Casos de Uso Específicos

Además de los usos generales, RDS es ideal en situaciones más concretas:

Migraciones desde on-premise: Integrado con AWS Database Migration Service (DMS), facilita la migración de bases locales a la nube con mínima interrupción.
Aplicaciones SaaS: Permite manejar bases multi-tenant con alto aislamiento y seguridad para distintos clientes.
Gaming: Almacena perfiles de jugadores, progresos y métricas de uso con alta disponibilidad.

Buenas Prácticas de Seguridad

Para proteger las bases de datos en Amazon RDS, se recomienda:

Activar cifrado en reposo con AWS KMS y cifrado en tránsito con SSL/TLS.
Desplegar las instancias en subredes privadas dentro de una VPC para reducir la exposición.
Utilizar IAM Roles y AWS Secrets Manager para gestionar credenciales de manera segura.
Configurar grupos de seguridad con las reglas mínimas necesarias de acceso.

6. VPC

Amazon Virtual Private Cloud (Amazon VPC) es el servicio de AWS que permite crear y administrar una red virtual aislada dentro de la nube. En esta red puedes definir tu propio rango de direcciones IP, crear subredes, configurar tablas de enrutamiento y establecer reglas de seguridad. VPC es la base de prácticamente todos los entornos en AWS, ya que permite controlar cómo se comunican tus recursos entre sí y con el exterior.

Cómo Funciona Amazon VPC

Cuando creas una VPC, básicamente estás definiendo una red privada virtual en la nube que se comporta de manera muy similar a una red local en un centro de datos tradicional, pero con la ventaja de la flexibilidad, escalabilidad y automatización que ofrece AWS. Esto significa que tienes control total sobre aspectos como direcciones IP, subredes, tablas de enrutamiento y reglas de seguridad.

Dentro de una VPC puedes segmentar recursos en subredes, que son divisiones lógicas de la red:

Subredes públicas: Diseñadas para recursos que necesitan comunicarse directamente con Internet, como balanceadores de carga, servidores web o APIs públicas.
Subredes privadas: Ideales para recursos internos que no deben ser accesibles desde el exterior, como bases de datos, servidores de aplicaciones o sistemas de backend.

Esta separación permite construir arquitecturas más seguras y organizadas, asegurando que solo los componentes necesarios estén expuestos públicamente, mientras que los datos sensibles y servicios críticos se mantienen aislados dentro de subredes privadas.

Componentes Clave de una VPC

Amazon VPC está compuesto por varios elementos que trabajan en conjunto para definir cómo se enruta, controla y asegura el tráfico dentro de la red. Estos son los principales componentes:

Tablas de Enrutamiento

Las tablas de enrutamiento determinan el destino del tráfico que sale de una subred. Cada subred de una VPC debe estar asociada a una tabla de enrutamiento, la cual define si el tráfico se mantiene dentro de la propia red, se dirige hacia otra subred, o se envía hacia recursos externos como Internet o una red local conectada mediante VPN. En la práctica, esto permite controlar con precisión qué subredes son públicas (y tienen acceso hacia Internet) y cuáles permanecen privadas.

Internet Gateway

Un Internet Gateway es el componente que conecta tu VPC con la red pública de Internet. Sin este elemento, los recursos dentro de la VPC no pueden comunicarse hacia afuera. Generalmente se asocia con subredes públicas, donde residen servicios que deben ser accesibles desde Internet como servidores web, APIs o balanceadores de carga.

NAT Gateway y NAT Instances

Un NAT (Network Address Translation) Gateway o una NAT Instance permiten que recursos en subredes privadas inicien conexiones hacia Internet sin estar expuestos a tráfico entrante no autorizado. Esto es útil, por ejemplo, cuando servidores de aplicaciones o bases de datos en una subred privada necesitan descargar parches, librerías o actualizaciones. El NAT actúa como intermediario: habilita la salida hacia Internet, pero bloquea accesos entrantes desde el exterior, reforzando la seguridad de los recursos internos.

Conectividad Híbrida

Amazon VPC no solo permite crear redes privadas en la nube, sino que también puede extenderse para integrarse con infraestructura local (on-premise) u otras VPCs dentro de AWS. Esto habilita arquitecturas híbridas y multi-VPC que combinan lo mejor de los entornos locales con la flexibilidad de la nube.

VPNs Cifradas

Las conexiones VPN (Virtual Private Network) permiten enlazar una red corporativa local con una VPC en AWS a través de Internet de manera segura. El tráfico se cifra usando protocolos como IPSec, garantizando que la información viaje de forma protegida. Este tipo de conexión es común cuando una empresa quiere migrar gradualmente a la nube o necesita mantener comunicación entre sistemas locales y recursos desplegados en AWS.

AWS Direct Connect

AWS Direct Connect es un enlace dedicado de red entre el centro de datos de una empresa y AWS. A diferencia de una VPN, no depende de Internet, lo que asegura baja latencia, mayor ancho de banda y mayor confiabilidad. Es ideal para cargas críticas como aplicaciones financieras, bases de datos con replicación en tiempo real o entornos donde la transferencia de datos es muy intensiva.

VPC Peering

El VPC Peering permite conectar dos VPCs de forma privada, usando direcciones IP internas sin pasar por Internet. Esto es útil cuando tienes distintos entornos separados por VPCs (por ejemplo, producción y desarrollo) y necesitas que se comuniquen de manera directa y segura. Es importante planificar bien los bloques de direcciones IP (CIDR), ya que las VPCs en peering no pueden tener rangos superpuestos.

AWS Transit Gateway

El Transit Gateway simplifica la gestión de múltiples conexiones, actuando como un hub central de interconexión. En lugar de tener múltiples peering entre VPCs o VPNs, todas las redes se conectan al Transit Gateway, lo que reduce la complejidad y mejora la escalabilidad. Es ideal para organizaciones grandes que manejan docenas de VPCs y múltiples conexiones on-premise, ya que centraliza el enrutamiento y hace más fácil la administración de la red híbrida.

Seguridad en Amazon VPC

Grupos de Seguridad

Son firewalls virtuales aplicados a nivel de instancia. Son estatales: si permites tráfico entrante, la respuesta se permite automáticamente. Se usan para definir qué puertos y protocolos pueden acceder a un recurso específico.

Listas de Control de Acceso a la Red (NACLs)

Funcionan a nivel de subred y permiten crear reglas explícitas para permitir o bloquear tráfico entrante y saliente. A diferencia de los grupos de seguridad, no son estatales, lo que otorga un mayor control, pero también requiere una gestión más detallada.

Buenas Prácticas de Diseño

Diseñar correctamente una VPC implica planificar aspectos como:

Definir el bloque CIDR adecuado para el tamaño de la red.
Separar cargas de trabajo en subredes públicas y privadas.
Proteger recursos sensibles (como bases de datos) en subredes privadas.
Exponer a Internet solo lo necesario, como balanceadores de carga o servidores de aplicaciones.
Aplicar múltiples capas de seguridad combinando grupos de seguridad y NACLs.

7. AWS IAM

En un entorno en la nube, la seguridad y el control de acceso son fundamentales. En AWS, el servicio encargado de esta tarea es Identity and Access Management (IAM), que permite gestionar usuarios, grupos, roles y permisos de forma centralizada. Con IAM puedes definir exactamente quién puede acceder a qué recursos y bajo qué condiciones, aplicando el principio de mínimo privilegio para reducir riesgos.

Identidades en IAM

IAM funciona a través de identidades que representan a usuarios, grupos o roles dentro de AWS:

Usuarios: Representan personas o aplicaciones que necesitan interactuar directamente con AWS.
Grupos: Conjuntos de usuarios a los que se asignan permisos comunes, simplificando la administración.
Roles: Identidades temporales que pueden ser asumidas por usuarios, servicios o aplicaciones para realizar tareas específicas sin necesidad de credenciales permanentes.

Políticas de IAM

El control de acceso en IAM se define mediante políticas, que son documentos en formato JSON donde se establecen los permisos que determinan qué acciones pueden realizarse sobre qué recursos y bajo qué condiciones. Cada política puede permitir o denegar operaciones específicas y se adjunta a usuarios, grupos o roles. Cuando un usuario intenta ejecutar una acción, AWS evalúa todas las políticas asociadas para decidir si la acción está autorizada.

Por ejemplo, una política puede otorgar a un usuario la capacidad de listar y leer objetos en un bucket de Amazon S3, pero al mismo tiempo impedir que los elimine. De esta forma se aplica el principio de mínimo privilegio, otorgando solo los accesos estrictamente necesarios.

Ejemplo de Política en JSON

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Effect": "Allow",
      "Action": [
        "s3:ListBucket",
        "s3:GetObject"
      ],
      "Resource": [
        "arn:aws:s3:::mi-bucket",
        "arn:aws:s3:::mi-bucket/*"
      ]
    },
    {
      "Effect": "Deny",
      "Action": "s3:DeleteObject",
      "Resource": "arn:aws:s3:::mi-bucket/*"
    }
  ]
}

En este ejemplo:

Se permite al usuario listar el contenido del bucket (s3:ListBucket).
Se permite al usuario leer objetos (s3:GetObject).
Se deniega explícitamente la eliminación de objetos (s3:DeleteObject).

Este tipo de políticas otorgan control granular, permitiendo diseñar accesos seguros y alineados con las necesidades del negocio sin exponer recursos de forma innecesaria.

Integración con Otros Servicios

Una de las principales fortalezas de IAM es su integración nativa con otros servicios de AWS, lo que permite administrar credenciales y permisos de forma centralizada, segura y escalable. En lugar de gestionar claves de acceso manualmente en cada recurso, IAM facilita que los servicios de AWS se comuniquen entre sí utilizando roles y políticas.

EC2 y Acceso a S3

Un caso típico es asignar un rol de IAM a una instancia EC2 para que pueda leer o escribir en un bucket S3. Esto evita tener que almacenar credenciales en la máquina, reduciendo riesgos de seguridad. Por ejemplo, una aplicación en EC2 puede descargar archivos desde S3 o subir registros automáticamente, con permisos limitados solo a ese bucket.

Single Sign-On (SSO) y Federaciones de Identidades

IAM se integra con AWS Single Sign-On (SSO) y con directorios corporativos como Active Directory, Azure AD o proveedores SAML. De esta forma, los usuarios pueden iniciar sesión en AWS con sus credenciales existentes de la empresa, sin necesidad de administrar múltiples usuarios y contraseñas. Esto mejora la seguridad y facilita la administración en organizaciones grandes.

Roles para Servicios Administrados

IAM también permite controlar el acceso de servicios como AWS Lambda, ECS o Glue. Por ejemplo:

Un rol de Lambda puede otorgarle permisos para escribir logs en CloudWatch o acceder a datos en DynamoDB.
Un rol de ECS puede habilitar que contenedores dentro de un clúster lean secretos desde Secrets Manager.
Un rol de Glue puede otorgar acceso a catálogos de datos en S3 para tareas de ETL.

Esto asegura que cada servicio tenga exactamente los permisos que necesita, sin exponer credenciales ni otorgar permisos excesivos.

Integración Multicuenta con AWS Organizations

En entornos con múltiples cuentas, IAM se complementa con AWS Organizations y Service Control Policies (SCPs). Esto permite definir permisos y restricciones a nivel organizacional, garantizando que todos los servicios de todas las cuentas cumplan con las políticas de seguridad globales.

Buenas Prácticas de Seguridad en IAM

AWS recomienda una serie de prácticas para reforzar la seguridad en IAM:

Activar autenticación multifactor (MFA) para todos los usuarios con acceso privilegiado.
Evitar el uso de la cuenta raíz en operaciones diarias; reservarla únicamente para tareas críticas y protegidas con MFA.
Aplicar el principio de mínimo privilegio: otorgar solo los permisos estrictamente necesarios.
Rotar y auditar credenciales de manera periódica para reducir riesgos de filtración.

IAM y AWS Organizations

En entornos donde una empresa utiliza múltiples cuentas de AWS, IAM se complementa con AWS Organizations para aplicar políticas de seguridad y control de acceso a nivel global. Mientras que IAM gestiona permisos dentro de una sola cuenta (usuarios, grupos, roles y políticas), Organizations permite un gobierno centralizado sobre todas las cuentas de la organización.

Service Control Policies (SCPs)

Las Service Control Policies (SCPs) son un componente clave de AWS Organizations que permiten definir qué acciones o servicios pueden utilizarse dentro de las cuentas de una organización. A diferencia de las políticas de IAM, las SCPs no otorgan permisos por sí mismas, sino que actúan como una restricción de nivel superior: limitan lo que los usuarios y roles pueden hacer incluso si sus políticas de IAM lo permiten.

Ejemplos de Uso de SCPs

Restricción de Regiones: Impedir la creación de recursos en regiones no aprobadas por la empresa (por ejemplo, solo permitir us-east-1 y eu-west-1).
Control de Servicios: Bloquear el uso de servicios que no cumplen con normativas internas, como impedir que se creen buckets S3 sin cifrado habilitado.
Seguridad Obligatoria: Forzar el uso de configuraciones seguras, como requerir que todas las instancias de EC2 usen roles de IAM en lugar de credenciales estáticas.
Costos: Prevenir la creación de recursos costosos en cuentas de desarrollo, como instancias EC2 de gran tamaño o clusters de Redshift.

Mejores Prácticas

Al implementar IAM junto con AWS Organizations, es recomendable:

Organizar las cuentas en Unidades Organizacionales (OUs) según su propósito (producción, desarrollo, pruebas, proyectos específicos).
Aplicar SCPs en la OU adecuada para que las restricciones sean consistentes en todas las cuentas que la conforman.
Usar SCPs en combinación con políticas de IAM para aplicar una defensa en profundidad.
Revisar periódicamente las políticas y restricciones para adaptarlas a cambios en los requisitos del negocio o normativos.

Beneficio Principal

La combinación de IAM y AWS Organizations proporciona un modelo jerárquico de seguridad y gobierno. IAM asegura el acceso granular dentro de cada cuenta, mientras que Organizations con SCPs asegura que todas las cuentas sigan un marco común de seguridad, cumplimiento y optimización de costos. Esto resulta fundamental en empresas grandes o con múltiples equipos trabajando en diferentes proyectos.

8. Amazon CloudWatch

En cualquier infraestructura en la nube, no basta con desplegar recursos: es fundamental monitorearlos de manera continua para garantizar que funcionen correctamente, detectar problemas antes de que impacten a los usuarios y optimizar tanto el rendimiento como los costos.

En AWS, la herramienta principal para lograrlo es Amazon CloudWatch, un servicio que recopila y analiza métricas, logs y eventos de prácticamente todos los servicios de la plataforma.

Visibilidad Centralizada con CloudWatch

CloudWatch actúa como un panel de control unificado que permite observar el estado de tu entorno en tiempo real. Desde allí puedes monitorear instancias EC2, bases de datos RDS, buckets S3, balanceadores de carga, funciones Lambda y muchos otros recursos de AWS.

Esta visibilidad centralizada es clave para tomar decisiones informadas relacionadas con la escalabilidad de la infraestructura, ajustes de configuración y medidas de seguridad necesarias para mantener la estabilidad del sistema.

Componentes Principales de CloudWatch

Métricas

Son datos cuantitativos sobre el estado o rendimiento de un recurso. Ejemplos incluyen el uso de CPU en una instancia EC2, el número de solicitudes a un balanceador de carga, el tráfico de red o la latencia de una aplicación. Las métricas permiten establecer líneas base de rendimiento y detectar desviaciones.

Logs

CloudWatch Logs almacena y analiza registros generados tanto por aplicaciones como por servicios de AWS. Se pueden buscar patrones específicos, aplicar filtros y reaccionar automáticamente a eventos críticos. Por ejemplo, detectar un error recurrente en los logs de una aplicación web y ejecutar una función Lambda para mitigar el problema.

Eventos

Los eventos representan cambios en el estado de un servicio o recurso. Mediante CloudWatch Events (hoy parte de EventBridge), es posible automatizar respuestas, como iniciar un backup cuando un volumen EBS entra en estado crítico o activar un escalado automático cuando aumenta la carga.

Alarmas y Automatización

Una de las funcionalidades más potentes de Amazon CloudWatch es la capacidad de crear alarmas que se activan cuando una métrica supera un umbral previamente definido. Estas alarmas permiten detectar comportamientos anómalos y desencadenar acciones automáticas sin intervención humana, lo que reduce tiempos de respuesta y mejora la disponibilidad del sistema.

Por ejemplo, si la CPU de una instancia EC2 se mantiene por encima del 80% durante más de cinco minutos, la alarma puede enviar una notificación a través de Amazon SNS o incluso ejecutar de manera automática un ajuste en un grupo de Auto Scaling para añadir nuevas instancias y balancear la carga. De forma similar, si el espacio de almacenamiento en un RDS está por agotarse, la alarma podría generar una alerta inmediata para que el equipo de operaciones actúe antes de que se produzca una interrupción.

Las alarmas también pueden integrarse con acciones automatizadas, como:

Reiniciar una instancia EC2 que dejó de responder.
Detener recursos en horarios no productivos para reducir costos.
Ejecutar funciones Lambda que realicen tareas de corrección ante errores detectados en los logs.

De esta manera, las alarmas de CloudWatch no solo informan de un problema, sino que pueden convertirse en la primera línea de defensa para mantener la continuidad del servicio y optimizar el uso de la infraestructura.

Dashboards Personalizados

Otra característica clave de CloudWatch es la creación de dashboards personalizados, que permiten visualizar métricas y alarmas en gráficos interactivos dentro de un único panel de control. Estos dashboards facilitan a los equipos de DevOps, arquitectos y administradores contar con una visión consolidada en tiempo real del estado de los recursos y aplicaciones en AWS.

Los dashboards pueden configurarse para mostrar métricas de distintos servicios en un solo lugar: uso de CPU en EC2, latencia en un balanceador de carga, número de invocaciones en Lambda o espacio disponible en un RDS. Esto ayuda a correlacionar información y detectar patrones o anomalías más rápidamente.

Además, los dashboards son altamente personalizables: es posible combinar métricas de diferentes cuentas y regiones, agregar filtros por aplicación o entorno (producción, desarrollo, pruebas) y compartirlos con diferentes equipos para mejorar la colaboración. Incluso se pueden integrar con sistemas de monitoreo externos o pantallas de operación en tiempo real, lo que los convierte en una herramienta fundamental para la observabilidad.

Buenas Prácticas con CloudWatch

Identificar métricas críticas: CPU, memoria, latencia, errores de aplicación, tiempos de respuesta.
Definir umbrales y alarmas realistas: que se alineen con tu capacidad de respuesta.
Configurar la retención de logs: de acuerdo con necesidades legales o de auditoría.
Etiquetar y agrupar métricas: por aplicación, entorno (desarrollo, staging, producción) o equipo responsable.
Automatizar respuestas: integrando alarmas con Auto Scaling, SNS o Lambda para mejorar la resiliencia.

3. Diseño de arquitecturas escalables y seguras

2 lecciones

1. Principios de arquitectura en la nube

Diseñar en la nube no es solo desplegar recursos: es construir sistemas que se adapten a la demanda en segundos, que permanezcan disponibles frente a fallas de componentes o zonas y que se recuperen automáticamente sin intervención humana.

En AWS, estos objetivos se concretan en tres principios que guían cada decisión arquitectónica: escalabilidad, alta disponibilidad y tolerancia a fallos. Aplicarlos desde el diseño —con automatización, desacoplamiento y redundancia— marca la diferencia entre una prueba de concepto y una plataforma lista para producción.

Escalabilidad

La escalabilidad es la capacidad de un sistema para aumentar o reducir su capacidad de manera eficiente cuando cambia la carga. En la nube, esto se traduce en agregar o quitar recursos bajo demanda para mantener rendimiento y costos bajo control.

Formas de escalar

Escalado vertical (scale up)

Consiste en aumentar la capacidad de una misma unidad de cómputo (más CPU, RAM, IOPS o ancho de banda de red). Es útil para ganancias rápidas cuando la aplicación es monolítica o depende de un único proceso intensivo. Normalmente implica cambio de tipo de instancia o de plan de base de datos.

Ventajas: simple de ejecutar, no requiere cambios de arquitectura, ideal para resolver cuellos de botella puntuales.
Desventajas: límite físico del tamaño máximo; puede requerir reinicio (downtime breve); crecimiento de costo en “saltos”.
Cuándo usarlo: picos previsibles de corta duración, licencias por socket/nodo, procesos single-thread o con estado difícil de distribuir.

Escalado horizontal (scale out)

Añade más unidades idénticas detrás de un balanceador de carga para compartir la demanda. Es el enfoque preferido en la nube por su elasticidad, resiliencia y afinidad con modelos de pago por uso. Permite crecer y decrecer en pasos finos, con menos riesgo de “sobredimensionamiento”.

Ventajas: alta disponibilidad natural, fallas aisladas por nodo, elasticidad automática, optimización de costos fina.
Desventajas: requiere aplicaciones stateless o externalizar el estado (sesiones, archivos); mayor complejidad operativa.
Cuándo usarlo: servicios HTTP/REST, colas de trabajo, microservicios, procesamiento por lotes, flujos event–driven.

Costos y límites prácticos

El vertical escala rápido pero salta en bloques de precio; el horizontal permite pagar exactamente por la carga. Mide y limita la concurrencia, el tiempo de arranque (warm-up) y el límite de conexión a BD antes de escalar para evitar cascadas de fallos.

Patrones recomendados

Aplicaciones stateless

Evita guardar sesión o archivos en el nodo. Mueve el estado a ElastiCache (Redis/Memcached), S3 o una base de datos. Esto permite replicar y reemplazar instancias sin impacto. Para sesiones web, usa stickiness solo si es imprescindible y temporal.

Desacoplamiento con colas y eventos

Coloca SQS/SNS/EventBridge entre productores y consumidores para absorber picos y suavizar la demanda. Permite reintentos, DLQ (dead-letter queues) y back-pressure controlado. Útil en pipelines de procesamiento, ETL y notificaciones.

Caché de contenido y datos

Reduce latencia y descarga orígenes con CloudFront (CDN) para estáticos/dinámicos y ElastiCache para resultados frecuentes. Define expiraciones (TTL), invalidaciones y caché por clave bien diseñadas para evitar cache stampede (usa locking o jitter).

Base de datos escalable

Para lectura intensiva, usa read replicas (RDS/Aurora) y connection pooling. Para crecimiento horizontal de escritura, considera particionamiento/sharding o motores elásticos como Aurora y DynamoDB (autoscaling u on-demand).

Alta disponibilidad (High Availability)

La alta disponibilidad busca que el sistema esté operativo la mayor parte del tiempo (mínimo downtime) frente a fallos de componentes o mantenimiento. Se logra eliminando puntos únicos de fallo y distribuyendo la carga en múltiples zonas de disponibilidad (AZ) o regiones.

Ejes clave

Redundancia en varias AZ para cómputo, datos y red.
Balanceo de tráfico con health checks y failover automático.
Backups y restauración probada; objetivos de SLA/SLO claros.

Implementación típica en AWS

Instancias en múltiples AZ detrás de ALB/NLB.
RDS/Aurora Multi-AZ, EFS (multi-AZ), S3 (alta durabilidad/ disponibilidad).
Route 53 con health checks y políticas de failover; CloudFront con origin failover.

Tolerancia a fallos (Fault Tolerance)

La tolerancia a fallos diseña el sistema para que siga funcionando aun cuando ocurren fallas en componentes internos o externos. No solo evita el downtime: también limita el impacto y permite una degradación controlada del servicio.

Patrones recomendados

Gracia en la degradación (graceful degradation): reducir funcionalidades no críticas ante presión.
Reintentos con backoff y jitter, timeouts y circuit breaker para aislar servicios inestables.
Idempotencia en operaciones para tolerar reintentos sin efectos secundarios.
Bulkheads (mamparos) para aislar fallos por dominio, cola o pool de conexiones.

Implementación típica en AWS

SQS/SNS/EventBridge para desacoplar y reintentar; DLQ (dead-letter queues) para eventos fallidos.
Step Functions para orquestación con retires integrados y manejo de errores.
Multi-región activo/pasivo o activo/activo con replicación (Aurora Global Database, S3 CRR) y conmutación por error en Route 53.

Diferencias rápidas

Principio	Objetivo	Cómo se logra	Ejemplos en AWS
Escalabilidad	Adaptar capacidad a la demanda	Scale out/in, caché, desacoplamiento	ASG + ALB, Lambda, ElastiCache, DynamoDB autoscaling
Alta disponibilidad	Minimizar el tiempo fuera de servicio	Redundancia multi-AZ/Región, health checks, failover	RDS Multi-AZ, EFS, Route 53 failover, ALB
Tolerancia a fallos	Seguir operando durante fallas	Reintentos, circuit breakers, colas, aislamiento	SQS+DLQ, Step Functions, EventBridge, Aurora Global

Medición y objetivos

Define y monitorea objetivos de resiliencia: RTO (tiempo máximo de recuperación), RPO (dato máximo perdible), SLO/SLA de disponibilidad y latencia. Usa CloudWatch, X-Ray y alarmas para validar que los diseños cumplen lo esperado.

2. Patrones de escalabilidad

Escalar no es “agregar más servidores”; es diseñar para que el sistema absorba picos impredecibles, mantenga latencias P95 estables y controle costos sin sacrificar fiabilidad. Los patrones de escalabilidad convierten estos objetivos en piezas de diseño reutilizables: desacoplar con colas y eventos, hacer el cómputo stateless, introducir caché en capas, escalar la capa de datos (réplicas, particiones) y automatizar la capacidad con métricas de negocio además de CPU. Implementados correctamente, permiten que tu arquitectura crezca y se contraiga con la demanda, degrade funciones de forma elegante ante presión y resista fallos sin interrupciones visibles.

En las siguientes secciones verás cómo aterrizar estos patrones en AWS —con ALB/Auto Scaling, SQS/SNS/EventBridge, CloudFront/ElastiCache, Aurora/DynamoDB, Lambda/Fargate y despliegues multi-AZ/Región— para construir plataformas que rinden, escalan y se mantienen bajo control incluso en los días de mayor tráfico.

Desacoplamiento y nivelación de carga

Desacoplar productores y consumidores evita picos súbitos, reduce la presión sobre servicios aguas abajo y previene fallas en cascada. La nivelación de carga introduce un búfer temporal para procesar al ritmo que el sistema puede sostener, manteniendo la latencia y el throughput bajo control incluso cuando la demanda es irregular.

Colas para nivelar demanda (Queue-Based Load Leveling)

El patrón consiste en insertar una cola entre quien produce trabajo y quien lo consume. El productor publica mensajes tan rápido como lo necesite; los consumidores procesan a un ritmo constante o elástico según su capacidad. En AWS, el servicio recomendado es Amazon SQS.

Tipos de cola: Standard (alto rendimiento, entrega al menos una vez, orden no garantizado) y FIFO (orden estricto por grupo, deduplicación, menor throughput por partición).
Fiabilidad: usa dead-letter queues (DLQ) y redrive policy para aislar mensajes que fallan repetidamente sin bloquear el flujo.
Reintentos seguros: ajusta visibility timeout (regla práctica: ≈ 3× el tiempo máximo de procesamiento) y aplica idempotencia en consumidores.
Coste y latencia: habilita long polling (WaitTimeSeconds) y batching para reducir llamadas y mejorar throughput.
Seguridad y red: cifra con SSE-SQS / KMS, limita acceso con IAM y usa VPC endpoints para tráfico privado.
Escalado de consumidores: Lambda (event source mapping con tamaño de lote y concurrencia), ECS/EKS (auto scaling por tamaño de cola o tiempo en cola).
Observabilidad: métricas clave: ApproximateNumberOfMessagesVisible, NotVisible, edad del mensaje más antiguo, errores y tamaño de lote efectivo.

Buenas prácticas: define claves de deduplicación (FIFO), agrega message attributes para ruteo, aplica backoff exponencial con jitter en reintentos y documenta contratos de mensaje. Antipatrones: bloquear el hilo productor esperando respuesta sincrónica; depender del orden en colas Standard; procesar sin idempotencia.

Arquitecturas dirigidas por eventos

En modelos event-driven un servicio publica un hecho (“pedido creado”) y múltiples consumidores reaccionan de forma independiente (fan-out). Esto reduce el acoplamiento y permite evolucionar cada componente a su propio ritmo.

Pub/Sub simple: Amazon SNS (push) publica a múltiples suscriptores: HTTP(S), email, Lambda, SQS. Usa message filtering para que cada suscriptor reciba solo lo relevante.
Enrutamiento avanzado: Amazon EventBridge ofrece buses de eventos, rules con patrones por contenido, integraciones SaaS, archiving y replay de eventos.
Fan-out resistente: combina SNS → SQS (cada consumidor tiene su cola) para desacoplar ritmos y añadir resiliencia con DLQ por suscriptor.
Contratos y evolución: define esquemas versionados (EventBridge Schema Registry), usa compatibilidad retroactiva y agrega correlationId / traceId para trazabilidad (X-Ray).
Seguridad: restringe quién puede PutEvents/Publish, cifra con KMS y segmenta por cuentas/regiones si aplica.
Métricas: tasa de publicación, entregas fallidas, tamaño de DLQ, reglas que no hacen match, invocaciones y throttles en Lambda.

¿SNS o EventBridge? (resumen rápido)

Uso típico	Modelo	Ruteo	Orden	Casos recomendados
SNS	Pub/Sub push	Filtro por atributos de mensaje	No garantizado	Fan-out simple, notificaciones, triggers directos a Lambda/SQS/HTTP
EventBridge	Bus de eventos	Rules por patrón de contenido, cross-account, SaaS	No garantizado	Enrutamiento selectivo, múltiples productores/consumidores, auditoría (archive/replay)

Eliminar estado del cómputo

Diseñar el cómputo como stateless permite escalar horizontalmente, desplegar sin interrupciones y reemplazar nodos sin impactar al usuario. La idea central es externalizar el estado (sesiones, archivos, colas de trabajo, configuración) hacia servicios gestionados y compartidos.

Servicios stateless

Mantén las instancias intercambiables: cualquier petición puede ser atendida por cualquier nodo. Evita almacenar en disco local o memoria datos que deban sobrevivir al ciclo de vida de la instancia.

Sesiones y caché: mueve sesiones y datos temporales a Amazon ElastiCache (Redis/Memcached). Define TTL y políticas de invalidación.
Autenticación sin estado: usa Amazon Cognito con JWT/OIDC para no depender de sesiones de servidor.
Archivos y blobs: persiste en Amazon S3 (versión, cifrado, lifecycle). Sirve estáticos vía CloudFront.
Configuración y secretos: centraliza en AWS Systems Manager Parameter Store o AWS Secrets Manager.

Almacenamiento compartido y objetos

Cuando una carga requiere un sistema de archivos compartido POSIX (lectura/escritura simultánea por varios nodos), utiliza Amazon EFS; para objetos (blobs), usa Amazon S3.

Amazon EFS: NFS administrado, multi-AZ y elástico. Elige Performance Mode (General Purpose vs Max I/O) y Throughput Mode (Bursting vs Provisioned) según el patrón de I/O.
Amazon S3: almacenamiento de objetos con alta durabilidad, ideal para contenido estático, backups, datos multimedia y adjuntos.
¿EBS, EFS o S3? EBS = disco de una sola instancia con IOPS altas; EFS = archivo compartido para varios nodos; S3 = objetos, acceso vía API/HTTP.

Gestión de sesiones y autenticación

Para permitir escalado y despliegues sin “pegajosidad”:

Evita sticky sessions en el balanceador; si son necesarias, úsalas solo como transición y con expiración corta.
Mantén la sesión fuera del servidor (Redis/Cognito) e incluye idempotency keys en operaciones sensibles.
Propaga correlation IDs en cabeceras para trazabilidad con AWS X-Ray/CloudWatch.

Subidas y procesado de archivos

No hagas que el servidor de aplicación “intermedie” archivos pesados:

Usa URLs prefirmadas para subir/descargar directamente a Amazon S3.
Dispara procesos asíncronos con S3 Event Notifications → SQS/Lambda para transcodificar, validar o indexar.

Buenas prácticas

Trata los nodos como efímeros: rolling/blue-green sin pérdida de estado.
Externaliza colas y trabajos a SQS/EventBridge; usa DLQ y reintentos con backoff.
Observa métricas de caché (hit ratio), sesiones activas y latencia a S3/EFS para ajustar TTL, tamaños de lote y patrones de acceso.

Antipatrones a evitar

Guardar sesión/archivos en disco local o memoria del proceso.
Dependencia de sticky sessions como requisito para que la app funcione.
Subir archivos a través del backend cuando pueden ir directo a S3.
Compartir estado via base de datos con locks globales que impiden escalar.

Caché en capas

La caché no es un único componente, sino una estrategia en capas: en el cliente (navegador/app), en el borde (CDN), en la aplicación (Resultados/HTML) y en la capa de datos (consultas/objetos). Bien aplicada, reduce latencia, suaviza picos y alivia a bases de datos y orígenes, con un impacto directo en costos y resiliencia.

CDN en el borde (Amazon CloudFront)

Coloca Amazon CloudFront delante de tu origen para cachear contenido estático y —cuando la lógica lo permite— contenido dinámico. Además de cachear, CloudFront ofrece compresión (Brotli/Gzip), TLS en el borde, HTTP/2 y HTTP/3, y se integra con AWS WAF y Shield para protección.

Clave de caché (cache key): define qué diferencia un objeto en caché (ruta + parámetros + cabeceras + cookies). Usa cache policies e origin request policies para incluir solo lo necesario; evita clave excesiva (rompe hit ratio).
TTL y control de frescura: diseña Cache-Control (max-age, s-maxage, stale-while-revalidate) y versiona activos (hash en el nombre de archivo) para invalidaciones cero-dolor. Usa invalidaciones solo cuando sea imprescindible.
Dinámico cacheable: si la respuesta es la misma para todos, cachea; si es personalizada, varía la clave por usuario/segmento o no cachees. Evita cachear cuando existe Authorization si no controlas la variación.
Funciones en el borde: CloudFront Functions / Lambda@Edge para reescritura de URLs, normalizar headers, A/B testing, auth ligera en el borde.
Robustez: habilita Origin Shield y Origin Failover para reducir presión al origen y soportar caídas.
Métricas clave: Cache Hit Ratio, latencia, bytes servidos por el borde, 4xx/5xx por distribución y comportamiento.
Buenas prácticas: separa rutas estáticas (/static/) y APIs (/api/), usa ETag/Last-Modified, y restringe contenido privado con Signed URLs/Cookies.

Caché de datos (aplicación y base de datos)

Usa Amazon ElastiCache para respuestas frecuentes, contadores, sesiones y rate limiting. El objetivo es reducir lecturas repetitivas y proteger a la base de datos. Diseña claves y TTL con intención y planifica la invalidadión.

Patrones: cache-aside (lazy-load: lee de caché, si falta va a la BD y rellena), write-through (escribe primero en caché y BD) y write-behind (cola cambios y persiste asíncrono; úsalo con cuidado).
Evitar “cache stampede”: usa locking, jitter en expiraciones y early refresh para renovar claves populares antes de expirar.
Hot keys: detecta claves calientes; aplica sharding lógico o distribuye por sufijos; incrementa réplicas de lectura en Redis.
ElastiCache Redis vs Memcached: Redis (replicación, cluster mode, persistencia opcional RDB/AOF, estructuras avanzadas), Memcached (simple, multihilo, sin persistencia, útil como pool distribuido). Elige según necesidades.
Sesiones y estado: almacena sesiones en Redis (TTL). Evita sticky sessions salvo transición breve.
Observabilidad: hit ratio, evictions, uso de memoria, CPU, lag de replicación y latencia p95/p99.
Seguridad: VPC-only con subredes privadas, encriptación en tránsito/en reposo y IAM/SGs restrictivos.

DAX para DynamoDB

Considera DynamoDB Accelerator (DAX) para workloads de lectura intensa: provee lecturas de microsegundos con API compatible de DynamoDB. Funciona como read-through/write-through, reduce la carga de la tabla y suaviza picos.

Cuándo usarlo: claves de acceso conocidas, patrones de lectura repetitiva, latencia muy baja para GetItem/Query.
Consistencia: orientado a lecturas eventualmente consistentes; evalúa si realmente necesitas lecturas fuertemente consistentes.
Diseño: cuida el tamaño de ítems y TTL; dimensiona nodos según QPS y latencia objetivo; monitoriza client-side throttling.

Antipatrones y alertas

TTL demasiado largo en contenido mutable (sirves datos viejos) o demasiado corto (hit ratio pobre).
Cachear contenido personalizado sin variar la clave por usuario/segmento.
Usar Redis como fuente de verdad sin persistencia cuando los datos son críticos.
No invalidar al actualizar datos base; mezcla de modelos que deja “dos verdades”.

Resumen operativo

Define qué puede cachearse, por cuánto tiempo y cómo se invalida. Mide hit ratio y latencia, y ajusta claves/TTL. En el borde, controla la clave de caché y versiona; en datos, aplica patrones de escritura/lectura con invalidación fiable. Una caché bien diseñada es la manera más barata de ganar rendimiento a escala.

Escalado de bases de datos

Escalar la capa de datos suele ser más desafiante que escalar cómputo: las escrituras requieren coordinación y las lecturas deben mantener consistencia razonable. En la nube, combinamos réplicas de lectura, particionamiento y motores elásticos para sostener el crecimiento sin sacrificar fiabilidad ni costos.

Réplicas de lectura

Las read replicas descargan tráfico de lectura de la base principal. En Amazon RDS/Aurora puedes añadir réplicas y dirigir el tráfico a endpoints de solo lectura (en Aurora, el reader endpoint balancea entre réplicas). Son ideales para consultas, reportes y APIs intensivas en lectura.

Consistencia: la replicación suele ser asíncrona; asume eventual consistency y diseña para manejar un replication lag variable (evita lecturas inmediatamente después de escribir si necesitas read-after-write fuerte).
Ruteo de tráﬁco: separa lecturas y escrituras en la aplicación/driver. No uses balanceadores L4/L7 genéricos delante de la BD.
Conexiones: usa RDS Proxy o pooling (p. ej., PgBouncer) para evitar tormentas de conexiones (Lambda/web de alta concurrencia).
Métricas clave: ReplicaLag, CPU/IOPS de réplicas, tasa de errores y latencia de queries; habilita Performance Insights y logs lentos.
Buenas prácticas: fija read timeouts y fallback a otra réplica; usa caché para resultados calientes; evita transacciones largas que bloqueen la réplica.

Particionamiento / sharding

El particionamiento divide datos por clave para paralelizar lectura/escritura y aislar “calor” de carga. En DynamoDB la clave de partición determina la distribución; en RDS puedes aplicar particionamiento lógico (por esquema/tabla) o por rango/hash.

Elección de clave: busca alta cardinalidad y distribución uniforme. Evita “hot keys” (p. ej., timestamps puros); mezcla con un sufijo hash o bucketización por tiempo.
DynamoDB: diseña acceso por partition key + sort key, apóyate en GSI/LSI para proyecciones; usa on-demand o autoscaling para RCU/WCU.
RDS: patrones por rango (p. ej., por cliente/tenant) o hash; añade catálogo de enrutamiento (service/tabla que mapea claves → shard) y automatiza resharding.
Consultas: evita scatter-gather (consultar todos los shards). Prefiere consultas dirigidas a la partición correcta.
Observabilidad: mide la distribución de QPS por partición/shard, latencias p95/p99, bloqueos y errores de cuota (en DynamoDB, ThrottledRequests).

Motores elásticos

Algunos motores escalan capacidad de forma granular y automática, útiles para cargas con picos impredecibles.

Aurora Serverless v2: ajusta capacidad en incrementos finos mientras mantiene conexiones; combina con réplicas de lectura y Global Database para DR multi-región.
DynamoDB: modo On-Demand (pago por request) o autoscaling de RCU/WCU; añade DAX para micro-latencias en lecturas frecuentes.
Multi-región: DynamoDB Global Tables (lectura/escritura local en varias regiones con last-writer-wins) y Aurora Global Database (réplicas de baja latencia y failover regional planeado).
Costos/SLAs: define límites de concurrencia y umbrales de escalado; valida RPO/RTO con pruebas de failover.

Patrones complementarios

CQRS: separa modelos de lectura y escritura; genera materialized views para queries rápidas.
Caché delante de la BD: ElastiCache (cache-aside/write-through) y CloudFront para APIs cacheables; evita “cache stampede” (jitter/locking).
Backpressure: limita conexiones y cola las operaciones con SQS cuando la BD está bajo presión.

Antipatrones a evitar

Usar réplicas para escalar escrituras (no lo hacen); las réplicas son para lecturas.
Confiar en consistencia inmediata en réplicas asíncronas; leer después de escribir en la principal si la operación lo exige.
Diseñar claves de partición que concentran tráfico (hot partitions) o realizar full scans frecuentes.
Tormentas de conexiones desde aplicaciones serverless; mitígalo con RDS Proxy o pools.
Transacciones gigantes o bloqueos a largo plazo que impiden replicación y degradan el cluster.

Checklist operativo

Define targets de latencia p95/p99 y alarmas por ReplicaLag, errores de cuota y locks.
Separa read/write en el código; implementa reintentos idempotentes con backoff.
Ejecuta pruebas de carga por patrón (reads, writes, mixes) y verifica que el escalado no rompe límites aguas abajo.

4. Automatización e Infraestructura como código

0 lecciones

5. DevOps y despliegue continuo en AWS

0 lecciones

6. Seguridad, monitoreo y optimización de costos

0 lecciones

Lección 1 de 6

Introducción al Cloud Computing

¿Qué es Cloud Computing?

Modelos de servicio

Existen tres modelos de servicio principales en el Cloud Computing, cada uno con distintos niveles de control, flexibilidad y responsabilidad:

IaaS (Infrastructure as a Service): El proveedor entrega recursos básicos como máquinas virtuales, redes, sistemas de almacenamiento y balanceadores de carga. El cliente gestiona el sistema operativo, las aplicaciones y la configuración. Ejemplo: Amazon EC2.
PaaS (Platform as a Service): El proveedor ofrece no solo la infraestructura, sino también entornos y herramientas listas para desarrollar, probar y desplegar aplicaciones. El cliente se concentra en el código y la lógica de negocio. Ejemplo: AWS Elastic Beanstalk.
SaaS (Software as a Service): Aplicaciones completas entregadas a través de Internet, accesibles mediante navegador o API. El proveedor gestiona absolutamente todo: infraestructura, plataforma y software. Ejemplo: Google Workspace o Salesforce.

Modelos de implementación

El Cloud Computing también se clasifica por su forma de implementación:

Nube pública: Recursos compartidos entre múltiples clientes, gestionados en centros de datos del proveedor. Alta escalabilidad y pago por uso.
Nube privada: Infraestructura dedicada a una sola organización. Puede estar en las instalaciones del cliente o alojada por un tercero. Mayor control y personalización.
Nube híbrida: Combinación de nube pública y privada para aprovechar lo mejor de ambas. Útil para mover cargas de trabajo según demanda o requisitos de seguridad.

Ventajas y desafíos

Entre las principales ventajas del Cloud Computing se encuentran:

Escalabilidad elástica: aumentar o reducir recursos en minutos.
Pago por uso: se factura solo por la capacidad consumida.
Acceso global: disponibilidad de servicios desde cualquier parte del mundo.
Acceso a tecnologías avanzadas: inteligencia artificial, big data, análisis en tiempo real.

Sin embargo, también presenta desafíos:

Seguridad y cumplimiento: gestión correcta de permisos y protección de datos.
Dependencia de proveedor (vendor lock-in): dificultad para migrar a otro proveedor.
Gestión de costos: riesgo de gastos imprevistos si no se controlan los recursos.

El modelo de responsabilidad compartida en AWS

¿Qué es la responsabilidad compartida?

Responsabilidades de AWS (seguridad de la nube)

Mantenimiento de la infraestructura física: servidores, almacenamiento, redes, hardware y centros de datos.
Seguridad física: control de acceso a los centros de datos, monitoreo, redundancia de energía y refrigeración.
Gestión del hardware, virtualización y capa de servicios base.
Cumplimiento de certificaciones y auditorías internacionales (ISO, SOC, PCI-DSS, etc.).

Responsabilidades del cliente (seguridad en la nube)

Configuración segura de los servicios (por ejemplo, políticas de acceso en S3 o seguridad de grupos en EC2).
Gestión de credenciales y control de accesos con IAM.
Protección de datos: cifrado en tránsito y en reposo.
Actualización y mantenimiento de sistemas operativos y aplicaciones instaladas en instancias.
Monitoreo y auditoría de la actividad en la cuenta.

Ejemplos prácticos

Si un bucket S3 queda con acceso público y se filtran datos, la responsabilidad es del cliente, ya que AWS proporciona las herramientas para restringir el acceso.
Si un servidor EC2 es vulnerado debido a un sistema operativo sin parches, la responsabilidad también es del cliente.
Si ocurre una caída en un centro de datos de AWS y afecta tu servicio, AWS es responsable de restablecer la infraestructura, pero tú debes haber diseñado tu arquitectura para tolerar fallos.

Buenas prácticas

Aplicar el principio de mínimo privilegio en IAM.
Habilitar MFA (autenticación multifactor) para cuentas críticas.
Configurar cifrado en todos los datos sensibles.
Monitorear logs y actividad con CloudTrail y CloudWatch.
Realizar revisiones periódicas de configuraciones de seguridad.

Curso de Numpy & Pandas

Contenido del Curso

¿Qué es Cloud Computing?

Modelos de servicio

Modelos de implementación

Ventajas y desafíos

El modelo de responsabilidad compartida en AWS

¿Qué es la responsabilidad compartida?

Responsabilidades de AWS (seguridad de la nube)

Responsabilidades del cliente (seguridad en la nube)

Ejemplos prácticos

Buenas prácticas

Infraestructura global

Formas de interactuar con AWS

Categorías de servicios

Modelo de responsabilidad compartida

Registro de la cuenta

Medidas de seguridad iniciales

Organización y gestión de acceso

Configuración de AWS CLI

Control de costos

Principios del modelo de precios

Opciones de facturación

Componentes que afectan el costo

Herramientas de control y estimación

Buenas prácticas para optimizar costos

Regiones

Zonas de disponibilidad (Availability Zones - AZs)

Edge Locations

Buenas prácticas en el uso de regiones y AZs

Almacenamiento con Amazon S3

Cómputo con Amazon EC2

Bases de datos con Amazon RDS y Amazon DynamoDB

Redes con Amazon VPC

Balanceo de carga con Elastic Load Balancing (ELB)

Monitoreo y métricas con Amazon CloudWatch

Gestión de identidades y accesos con AWS IAM

Clases de Almacenamiento en S3

Casos de Uso por Clase de Almacenamiento en Amazon S3

S3 Standard

S3 Intelligent-Tiering

S3 Standard-IA (Infrequent Access)

S3 One Zone-IA

S3 Glacier

S3 Glacier Deep Archive

Limitaciones de Amazon S3

S3 Event Notifications

URLs Pre-Firmadas en S3

ACLs en S3

S3 Transfer Acceleration

S3 Glacier Vaults

S3 Block Public Access

S3 Lifecycle Configuration

Modos de Recuperación en S3 Glacier

Características Clave

Casos de Uso de Amazon EC2

Aplicaciones Web

Bases de Datos Personalizadas

Procesamiento de Datos y Machine Learning

Entornos de Desarrollo y Pruebas

Aplicaciones Empresariales

Ventajas de Amazon EC2

Escalabilidad

Alcance Global

Seguridad Avanzada

Costo-Eficiencia

Flexibilidad Tecnológica

Flexibilidad y Tipos de Instancias

Almacenamiento en EC2

Modelos de Precios

Escalabilidad y Alta Disponibilidad

Seguridad y Acceso

Hemos cubierto los servicios más utilizados en AWS, cada uno con un propósito específico dentro de una arquitectura en la nube. A continuación se presenta un resumen de su función, principales características y el esquema de facturación que utiliza cada uno.

1. Amazon S3 (Almacenamiento de objetos)

2. Amazon EC2 (Cómputo en la nube)

3. Amazon RDS y DynamoDB (Bases de datos)

4. Amazon VPC (Red privada virtual)

5. Elastic Load Balancing (ELB)

6. Amazon CloudWatch (Monitoreo y métricas)

7. AWS IAM (Gestión de identidades y accesos)