Estimado cliente de Servicios Web SW®:
Sabemos que necesitas certidumbre sobre nuestros servicios, por esta razón como responsable del Área Técnica de SW® te informo, que ya hemos detectado y solucionado la causa raíz, de los “timeouts” presentados de manera esporádica, para algunos de nuestros clientes.
¿Qué causó los timeouts esporádicos en algunos de nuestros clientes?
- El problema estaba relacionado con el servicio externo de caché de Microsoft Azure, el cual de manera intermitente, incrementaba considerablemente los tiempos de respuesta.
- Esta situación afectó a los clientes que en su mayoría, utilizaban el servicio de autenticación en cada transacción, o aquellos cuyo token expiraba y al regenerarlo les marcaba timeout .
Recomendaciones generales
- Nuestra recomendación para eficientar el timbrado es utilizar el token infinito, o si vas a utilizar token temporal lo renueves cada 2 horas. Evita generar un token nuevo en cada transacción.
¿Qué acciones y medidas realizamos para mitigar esta situación?
Desde la primera vez comenzamos a tomar cartas en el asunto, para detectar con precisión la situación; concluyendo este viernes 8 de marzo, alrededor del las 23:00 (hora central) con la implementación de las siguientes acciones y medidas:
- Crecimos la infraestructura de nuestro servicio de caché, garantizando así una mayor disponibilidad, menor latencia y un mayor poder de procesamiento.
- Reducimos 50% las peticiones que se hacen a caché.
- Implementamos llamadas FireandForget para peticiones a caché, para las cuales no es necesario esperar una respuesta por parte del servicio.
- Autohealing de conexión, en caso de intermitencias con la red o intermitencia del servicio.
¿Qué acciones y medidas complementarias realizaremos?
- Implementación de un Circuit Breaker** para servicios externos, ya que mediante este patrón controlaremos los tiempos de espera de estos servicios y evitaremos que la situación se propague. Lo anterior significa que si nuestro servicio caché presentara alguna falla o tiempos elevados de respuesta, con Circuit Breaker** podremos determinar si el servicio no está disponible por el momento; nos permite “fallar” de manera rápida y utilizar inmediatamente, el segundo recurso disponible para ejecutar la petición, que en este caso es una consulta directa a la base de datos.
Como responsable del área técnica y en nombre de todo el equipo de SW® lamentamos los inconvenientes causados por esta situación y ratificamos nuestro compromiso de seguir brindándote el servicio profesional y personalizado que siempre nos caracteriza.
** Para mayor información de cómo opera Circuit Breaker, te compartimos las siguientes ligas de referencia: https://goo.gl/3vBfDv | https://goo.gl/V4zCPy