Incidencia general en infraestructura tecnológica

Incident Report for Zipnova

Postmortem

Durante la madrugada de hoy se produjeron incidentes técnicos en nuestro proveedor de infraestructura tecnológica, Amazon Web Services (AWS):

Comunicado de AWS
20 de octubre a las 7:53 p. m. UTC-3 Entre las 3:49 del y las 6:24 del 20 de octubre, experimentamos un aumento en las tasas de error y las latencias de los servicios de AWS en la región US-EAST-1. Además, los servicios o las funciones que dependen de los puntos de conexión US-EAST-1, como IAM y las tablas globales de DynamoDB, también experimentaron problemas durante este período. A las 04:26 del 20 de octubre, identificamos el desencadenante del evento como problemas de resolución de DNS para los puntos de conexión del servicio regional de DynamoDB. Después de resolver el problema de DNS de DynamoDB a las 6:24, los servicios comenzaron a recuperarse, pero sufrimos una falla posterior en el subsistema interno de EC2, responsable del lanzamiento de las instancias de EC2, debido a su dependencia de DynamoDB. A medida que continuamos trabajando en las fallas de lanzamiento de las instancias de EC2, las comprobaciones de estado del balanceador de carga de red también se vieron afectadas, lo que provocó problemas de conectividad de red en varios servicios, como Lambda, DynamoDB y CloudWatch. Recuperamos las comprobaciones de estado del balanceador de carga de red a las 13:38. Como parte de la recuperación, limitamos temporalmente algunas operaciones, como el lanzamiento de instancias EC2, el procesamiento de colas de SQS mediante asignaciones de orígenes de eventos Lambda y las invocaciones asincrónicas de Lambda. Con el tiempo, redujimos la limitación de las operaciones y trabajamos en paralelo para resolver los problemas de conectividad de red hasta que los servicios se recuperaron por completo. A las 19:01, todos los servicios de AWS volvieron a funcionar con normalidad. Algunos servicios, como AWS Config, Redshift y Connect, siguen teniendo una acumulación de mensajes que finalizarán de procesar en las próximas horas. Compartiremos un resumen detallado de AWS posterior al evento.

Zipnova utiliza varios de los servicios de AWS que se vieron comprometidos, lo que ocasionó problemas y demoras para procesar ordenes y envíos durante la primer fase del evento (3:49 am - 6:24 am). Luego vimos cierta recuperación en los mismos, sin lograr una completa recuperación hasta horas mas tarde.

Adicionalmente, muchos servicios o plataformas con las cuales estamos integrados, como Mercado Libre, Tienda Nube, VTEX, algunos transportes y otros servicios tecnológicos de uso interno, también están montados en la nube de AWS, con lo cual se vieron afectados por los mismos problemas.

Lamentamos mucho las molestias ocasionadas por este inconveniente técnico que, aunque estuviera fuera de nuestro control, haya podido ocasionar en sus respectivas operaciones durante la jornada de hoy.

Posted Oct 20, 2025 - 20:17 GMT-03:00

Resolved

El proveedor AWS informa que todos los problemas están resueltos.
Vemos una normalización en todos los servicios internos de procesamiento de datos, y en la recepción de actualizaciones desde los canales de venta integrados.
Podría haber algún remanente de ordenes y envíos pendientes de sincronización que irán ingresando en las próximas horas.
Posted Oct 20, 2025 - 20:07 GMT-03:00

Update

AWS informa que de a poco se va normalizando la situación y estiman oficialmente una resolución completa dentro de las próximas dos horas.
Nuestros servicios internos de sincronización y procesamiento ya muestran una reducción considerable en el índice de errores y demoras.
Hemos notado que han comenzado a llegar lentamente notificaciones de actualizaciones desde la API de Mercado Libre.
Continuaremos monitoreando la situación e informar en cuanto tengamos novedades.
Posted Oct 20, 2025 - 18:09 GMT-03:00

Update

Los inconvenientes con nuestro proveedor tecnológico AWS persisten. Estos problemas están generando dentro de Zipnova algunas demoras de procesamiento de ordenes y envíos.
Adicionalmente, estamos viendo demoras y fallas en la sincronización de ordenes y envíos provenientes de canales de venta como Mercado Libre.
Continuamos monitoreando la situación y tomando las acciones correctivas necesarias mientras el proveedor trabaja en la resolución definitiva del inconveniente.
Posted Oct 20, 2025 - 13:13 GMT-03:00

Monitoring

Durante la madrugada de hoy se han estado experimentado problemas en la infraestructura de Amazon Web Services, nuestro proveedor tecnológico de infraestructura.

En cuanto a los servicios propios de Zipnova, los mismos se encuentran funcionando correctamente en este momento.

Desde las 4:11 am se produjo un inconveniente con Amazon Web Services, proveedor de infraestructura nuestra y de muchos otros servicios con los que estamos conectados. Amazon ha estado trabajando en resolver el problema, el cual hasta el momento no ha sido completamente resuelto.

Entre las 4 am y 5:50 am aproximadamente, se afectó parcialmente el funcionamiento de Zipnova, generando demoras en el procesamiento de envíos, ordenes, envío de notificaciones y con afectación a la velocidad de respuesta de nuestra plataforma.

Servicios de terceros, como Tienda Nube, VTEX, Mercado Libre, MercadoPago y otras plataformas basadas en los servicios de AWS, han experimentado problemas o continúan experimentándolos, mayormente con caídas parciales o demoras en sus servicios.

Continuaremos monitoreando la situación.
Posted Oct 20, 2025 - 11:41 GMT-03:00
This incident affected: API and Integraciones (Tienda Nube, Mercado Libre, VTEX).