< Previous18 Sección Artículo Vol. 21 • No. 4 En esta tercera entrega, desarrollaremos la etapa de descripción de procesos (Fig 1) posterior a la generación de información por un proceso de medición. Hemos establecido en función del modelo las 5M que un requisito de calidad (variable de respuesta, aleatoria o “y”) es dependiente de factores presentes en los procesos (variable predictora, independiente o x). Descripción de procesos Por: QFB Alejando Alcántara, ANCF 1a Parte Es importante, para el desarrollo de esta publicación, describir lo que es el ciclo de la estadística (Fig. 2) y ejemplificarlo en el área farmacéutica. En el ámbito de nuestro interés, se fabrican lotes, que son un conjunto de elementos que presentan una característica medible en común (característica de calidad, y), que en estadística se le denomina la población de elementos, donde es común que N represente el tamaño de la población. Podemos hablar de que el lote de un jarabe de 50 mil frascos en su presentación final, es la población. En este caso, se trata de una población finita y real, pues físicamente existe. La población se clasifica como dis- creta debido a que sus elementos son independientes, es decir, frascos en su empaque primario y secundario. Si se comentara del granel de 5,000 litros, el granel es un lote masificado y/o una población continua, donde sus elementos pueden ser porciones de 100 mL, lo que da lugar a 50 mil elementos. Es importante diferenciar la población de elementos de la población de mediciones, pues cada elemento tiene asociada una característica medible en común y esta última es la población de mediciones. A las medidas representativas se le llama pará- metros y se representan por letras del alfabeto, que son dependientes de la escala de medición del instrumento utilizado en el método de prueba, los cuales, en casi todos los casos, son desconocidos en su magnitud. Para tener conocimiento de los parámetros, es necesario obtener una muestra de estos elementos por un método muestral; en el ámbito farmacéutico el método más frecuente es el muestreo aleatorio simple o sus variantes; en términos de atributos, conteos o variables nos permiten determinar el tamaño de la muestra o determinado por el método de prueba (n) para realizar el proceso de verificación, en términos 20 Sección Artículo Vol. 21 • No. 4 de poblaciones discretas (tapones, frascos, etiquetas o producto terminado) o la cantidad de masa a muestrear en términos de poblaciones continuas (graneles de líquidos, sólidos o semisólidos). Habiendo generado la muestra, que es un subcon- junto de los elementos de la población, la siguiente actividad es someter a los elementos o unidades muestrales al proceso de medición, según el método de prueba y realizar la descripción de la información muestral, la cual es dependiente, si medimos atribu- Ya se ha establecido que la variable aleatoria se genera por un método de prueba aplicando un proceso de medición, el cual involucra un instrumento de medición que tiene asociada una escala para determinar la mag- nitud de la variable aleatoria (valor) y las escalas son: a) Escala nominal. b) Escala cuantitativa discreta. c) Escala cuantitativa continua. A continuación, desarrollaremos cada caso. 1. Escala nominal o categórica Es importante que, para describir la información, se desarrolle el concepto de distribución de la variable, la cual se define como aquel modelo probabilístico que relaciona el valor de la variable aleatoria con la probabilidad de ocurrencia, lo que permite sustentar el tipo de descripción de una variable en términos analíticos y gráficos. tos, conteos o variables en la unidad muestral y cuyo propósito es inferir o generalizar respecto de la po- blación. Como ejemplo, en la prueba de disolución se toma una muestra de 6 comprimidos de un lote de 500 mil, se somete a la prueba de disolución y se generan seis valores del porciento disuelto (variable aleatoria) y con base a su estadística descrip- tiva (valor mínimo del porciento disuelto) se procede a inferir o a extrapolar si el lote cumple o no cumple la especificación, es decir, necesitamos realizar una descripción de la información. En el caso de la escala nominal, si ésta presenta sola- mente dos categorías como es el caso de atributos (cumple, no cumple), la distribución binomial permite llevar a cabo la descripción mediante el modelo descrito en la fórmula (1). Donde: y = número de frascos que presentan el atributo n = número de unidades muestrales o tamaño de la muestra. p = proporción o fracción muestral que presentan el atributo (frascos que presentan el color Pantone 2707), cuya fórmula es: La esperanza o media de la distribución ( E ( y )), donde la fórmula es: …..(3)22 Sección Artículo Vol. 21 • No. 4 Desviación estándar de la distribución S ( y ), cuya fórmula es; …..(4) Demos un ejemplo para explicar la descripción en términos analíticos de las fórmulas; supongamos que en el proceso de inspección de un lote de 5000 frascos (N), el atributo del frasco es que cumpla con el número de color “Pantone 2707”, para lo cual se selecciona de manera aleatoria 200 frascos (n) y en la inspección esta muestra; donde se recomienda codificar el resultados de la inspección de un frasco como cero (no cumple) y uno (cumple), por lo que nuestra base de datos serán valores de cero y uno; donde se presentan 192 frascos presentan el atributo, por lo tanto: Lo que se debe interpretar que la proporción o frac- ción de frascos que cumplen con el atributo es de 0.96, también que la probabilidad de que un frasco en la muestra de 200 cumpla con el atributo es de 0.96 o que el 96% de los frascos de la muestra presentan el atributo. Otra interpretación analítica es la esperanza y su desviación estándar, que al calcularlas: En este último cálculo al ser un atributo, es conve- niente redondearlo a un valor entero, lo que da 3. Lo anterior representa la estadística descriptiva analítica o numérica de la fracción de frascos que cumplen con el atributo, que en términos simples nos representan la estimación de la tendencia y variación de la variable aleatoria. Otro elemento importante, es la estadística descriptiva gráfica, que permite visualizar el compor- tamiento distribucional de la variable aleatoria, que dado la fórmula (1) podemos obtenerla de forma tabular (tabla 1) y gráfica (gráfica 1), de la cual es importante deducir que el máximo de la distribución corresponde a la esperanza, cuya magnitud es 0.1425 que en términos frecuenciales podemos interpretar que si se llevaran a cabo 100 muestreos de 200 frascos, para este caso (p=0.96) esperaríamos que en al menos 14 de ellos se presentarán 192 frascos cumpliendo el atributo, pero una ventaja es que teniendo el conocimiento del valor de la desviación estándar, se pueden generar intervalos, donde se espera incluir un porcentaje específico de frascos asociados al atributo. Existe un teorema que aplica a cualquier distribución que se ha denominado teorema de Chebyshev que establece que si se generan los límites ……(5) Se espera que al menos en dicho intervalo al menos se incluya el: …..(6)24 Sección Artículo Vol. 21 • No. 4 Es decir si k = 2 en el intervalo descrito por la fór- mula (5) se incluya al menos el 75% de los valores (fórmula 6), por lo tanto: 186, 198 Que redondeado a números enteros, ya que la variable es discreta; se espera que al menos el 75% de los valores deben incluir de 186 a 198 frascos que cumplan con el atributo. 2. Escala cuantitativa discreta En el caso de la escala cuantitativa discreta, como es el caso de unidades formadoras de colonias (ufc) en una unidad muestral como el caso de control micro- biológico de agua purificada nivel 1 por filtración por membrana, en la cual se determinan el número de unidades formadoras de colonias (variable aleatoria discreta, y) presentes en la unidad muestral (100 mL de agua). En la tabla 2, se muestra el resultado de ufc de bacterias mesófilas aerobias de 50 muestreos en un sistema de agua purificada. Esta variable aleatoria, es cuantitativa discreta y la bibliografía reporta que puede ser descrita mediante la distribución de Poisson, modelo distribucional descrito en la fórmula (7). .....(7) Donde: y = número de ufc presentes en la unidad muestral. = esperanza o media de la distribución. En este caso asumiremos que la esperanza o la media de la distribución, es una variable cuantitativa discreta, por lo que su calculará con el valor de la media arit- mética redondeado a su valor entero. Para esta distribución la media y la varianza son iguales ( = S2 ( y )); bajo el mismo contexto, el cálculo de la varianza se realiza de manera similar al de la media: Valor similar a la media, lo que puede justificar el uso de esta distribución al respecto. En estadística es más común informar la desviación estándar, que es la raíz cuadrada de la varianza y tiene la ventaja de tener las mismas unidades de la variable aleatoria. ufc Estos valores representan la estadística descriptiva analítica o numérica de la las ufc presentes en la unidad muestral, que en términos sencillos nos describen la estimación de la tendencia y variación de la variable aleatoria de este proceso. Otro elemento importante es la estadística descriptiva gráfica, que permite visualizar el comportamiento distribucional de la variable aleatoria esperada y la observada. La variable aleatoria esperada está dada por la fórmula (7), que podemos obtenerla de forma tabular (tabla 3 y gráfica 2).26 Sección Artículo Vol. 21 • No. 4 La distribución observada se describe mediante un histograma, a partir de una tabla de frecuencias (tabla 4) y se muestra en la gráfica 3.27 Sección Artículo Vol. 21 • No. 4 La forma distribucional es similar, lo que permite justificar de manera gráfica el empleo de la distribución de Poisson, la cual es similar en forma a la distribución normal, que al considerar una de sus propiedades, para explicar la interpretación de la desviación estándar, nos indica que en el límite superior redondeado al entero respectivo, al menos se espera el 99% de los valores muestrales de ufc se incluya hasta dicha magnitud. El valor de 2.33 está asociado al valor de la distribución normal es- tandarizada (z) con una densidad de probabilidad de 0.99; debido a que la especificación que aplica a la variable es unilateral superior o un máximo. Al calcular: Por lo tanto, esperamos que hasta dicho valor se incluya el 99% de los datos observados, es decir, en este intervalo al menos se deben incluir el 0.99 x 50 = 49.5 50 valores observados de las ufc. Al inspec- cionar los resultados (ver tabla 2), todos los resultados se incluyen en el intervalo (n=50), por lo que se puede dar como válida esta interpretación y bajo una aplicación práctica, estos límites pueden representar el límite de acción de este sistema de agua purificada; si los límites de acción reportados es de 10,000 ufc / 100 mL (FEUM 12ª edición), así se asegura que este sistema de agua purificada es capaz de cumplir el requisito, siempre y cuando la operación se mantenga. Continuará…Next >