1. Home
  2. Blog
  3. Avisos
  4. [11-Marzo-2019] Causa y solución a situación técnica presentada

[11-Marzo-2019] Causa y solución a situación técnica presentada

Estimado cliente de Servicios Web SW®:

Sabemos que necesitas certidumbre sobre nuestros servicios, por esta razón como responsable del Área Técnica de SW® te informo, que ya hemos detectado y solucionado la causa raíz, de los “timeouts” presentados de manera esporádica, para algunos de nuestros clientes.

¿Qué causó los timeouts esporádicos en algunos de nuestros clientes?

  • El problema estaba relacionado con el servicio externo de caché de Microsoft Azure, el cual de manera intermitente, incrementaba considerablemente los tiempos de respuesta.
  • Esta situación afectó a los clientes que en su mayoría, utilizaban el servicio de autenticación en cada transacción, o aquellos cuyo token expiraba y al regenerarlo les marcaba timeout .

Recomendaciones generales

  • Nuestra recomendación para eficientar el timbrado es utilizar el token infinito, o si vas a utilizar token temporal lo renueves cada 2 horas. Evita generar un token nuevo en cada transacción.

¿Qué acciones y medidas realizamos para mitigar esta situación?
Desde la primera vez comenzamos a tomar cartas en el asunto, para detectar con precisión la situación; concluyendo este viernes 8 de marzo, alrededor del las 23:00 (hora central) con la implementación de las siguientes acciones y medidas:

  1. Crecimos la infraestructura de nuestro servicio de caché, garantizando así una mayor disponibilidad, menor latencia y un mayor poder de procesamiento.
  2. Reducimos 50% las peticiones que se hacen a caché.
  3. Implementamos llamadas FireandForget para peticiones a caché, para las cuales no es necesario esperar una respuesta por parte del servicio.
  4. Autohealing de conexión, en caso de intermitencias con la red o intermitencia del servicio.

¿Qué acciones y medidas complementarias realizaremos?

  • Implementación de un Circuit Breaker** para servicios externos, ya que mediante este patrón controlaremos los tiempos de espera de estos servicios y evitaremos que la situación se propague. Lo anterior significa que si nuestro servicio caché presentara alguna falla o tiempos elevados de respuesta, con Circuit Breaker** podremos determinar si el servicio no está disponible por el momento; nos permite “fallar” de manera rápida y utilizar inmediatamente, el segundo recurso disponible para ejecutar la petición, que en este caso es una consulta directa a la base de datos.

Como responsable del área técnica y en nombre de todo el equipo de SW® lamentamos los inconvenientes causados por esta situación y ratificamos nuestro compromiso de seguir brindándote el servicio profesional y personalizado que siempre nos caracteriza.

 

** Para mayor información de cómo opera Circuit Breaker, te compartimos las siguientes ligas de referencia:   https://goo.gl/3vBfDv  | https://goo.gl/V4zCPy

Updated on marzo 12, 2019

Was this article helpful?

Related Articles