¿Qué son los percentiles de latencia P90, P95 y P99? Comprender las métricas de rendimiento
- La latencia P90, P95, P99 son métricas de rendimiento y son una de las formas de medir el tiempo de respuesta de un sistema. Se utiliza para medir el rendimiento del sistema y analizar el tiempo de respuesta del sistema.
- Las latencia P90, P95 y P99 representan tiempos de respuesta del 90 %, 95 % y 99 %, respectivamente.
- P90: significa que el 90% de las solicitudes se procesaron dentro de este tiempo.
- P95: significa que el 95% de las solicitudes se procesaron dentro de este tiempo.
- P99: significa que el 99% de las solicitudes se procesaron dentro de este tiempo.
- Puede ser difícil de entender si solo lees la explicación anterior, así que comprendamos con el siguiente ejemplo.
Latencia | Número de solicitudes | Suma de solicitudes |
---|---|---|
100 ms | 3 | 3 |
200 ms | 5 | 8 |
300 ms | 10 | 18 |
400 ms | 30 | 48 |
500 ms | 20 | 68 |
600 ms | 15 | 83 |
700 ms | 10 | 93 |
800 ms | 4 | 97 |
2000 ms | 2 | 99 |
10000ms | 1 | 100 |
*Los datos anteriores representan el tiempo de respuesta para 100 solicitudes.
- Calculemos P90, P95 y P99.
- P90: Indica el momento en el que se procesaron el 90% de las solicitudes. Por lo tanto, necesitamos encontrar el tiempo de respuesta de 100 * 0,9 = solicitud número 90. El tiempo de respuesta para la solicitud número 90 es de 700 ms.
- P95: Indica el momento en que se procesaron el 95% de las solicitudes. Por lo tanto, necesitamos encontrar el tiempo de respuesta de 100 * 0,95 = solicitud número 95. El tiempo de respuesta para la solicitud número 95 es de 800 ms.
- P99: Indica el momento en que se procesaron el 99% de las solicitudes. Por lo tanto, necesitamos encontrar el tiempo de respuesta de 100 * 0,99 = solicitud número 99. El tiempo de respuesta para la solicitud número 99 es de 2000 ms.
- Por lo tanto, P90, P95 y P99 en los datos anteriores son 700 ms, 800 ms y 2000 ms, respectivamente.
- El tiempo de respuesta más lento aquí es de 10000 ms. Esto representa el momento en que se procesaron el 100% de las solicitudes.
- La mayoría de las velocidades de solicitud están entre 300 ms y 800 ms, pero es posible que observe que algunas solicitudes pueden demorar hasta 10000 ms.
- Si los valores de los números primos especiales son muy grandes, el valor promedio se vuelve muy alto, por lo que puede no ser apropiado medir el rendimiento solo por el valor promedio.
- Puede considerar el salario promedio anual como ejemplo en el caso anterior. Si unos pocos ejecutivos tienen salarios muy altos, el salario promedio puede ser alto, pero la mayoría de los empleados pueden tener salarios por debajo del promedio.
- Debido a que el promedio puede reaccionar con sensibilidad a los valores atípicos, además de medir la latencia con el promedio, la latencia se mide usando P90, P95 y P99.