Type a search term to find related articles by LIMS subject matter experts gathered from the most trusted and dynamic collaboration tools in the laboratory informatics industry.
En estadística, la moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Esto va en forma de una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. En el caso de la distribución uniforme discreta, cuando todos los datos tienen una misma frecuencia, se puede definir las modas como indicado, pero estos valores no tienen utilidad. Por eso algunos matemáticos califican esta distribución como «sin moda».
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Siendo la frecuencia absoluta del intervalo de la moda las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.
Por otra parte, la moda poblacional de una distribución de probabilidad discreta es el valor en el que la función de masa de probabilidad alcanza su valor máximo. En otras palabras, es el valor que tiene más probabilidades de ser muestreado. La moda poblacional de una distribución de probabilidad continua es el valor , en el que la función de densidad de probabilidad alcanza el valor máximo. En otras palabras, es el valor que se encuentra en el pico. La moda poblacional tampoco es necesariamente única, ya que la función de masa de probabilidad o la función de densidad de probabilidad pueden tener el mismo valor máximo en varios puntos . El caso extremo se da en las distribuciones uniformes, en las que todos los valores se dan con la misma frecuencia.
Según la definición anterior, los máximos globales son modas. Cuando una función de densidad de probabilidad tiene varios máximos locales, es común referirse a todos los máximos locales como modos de la distribución. Una distribución continua de este tipo se denomina multimodal (por oposición a unimodal). En las distribuciones unimodales simétricas, como la distribución normal o la distribución de Gauss (una distribución cuya función de densidad de probabilidad forma la curva en forma de campana cuando se representa gráficamente), la media, la mediana y la moda coinciden. En muestras extraídas de distribuciones simétricas, la media puede ser el Estimador de la moda de la población. Es importante recordar que el valor expresado como mayoritario en un conjunto de datos no representa necesariamente el valor de la moda estadística.[1]
Asimismo, la moda se aplicó por primera vez en el trading técnico, mediante el concepto de moda móvil (MM), ideado por el español Pedro L. Asensio Álvarez, donde establece como concepto para su desarrollo "la moda es el precio más frecuente para un período determinado".
Hasta mediados del año 2023, no se había utilizado este tipo de indicador en plataformas de trading , ya que el uso de medias móviles estaba mucho más estandarizado. El salto a plataformas financieras como Metatrader, supuso un antes y un después en el Trading estadístico y cuantitativo.
El término "moda" se originó en 1895 con Karl Pearson, influenciado por la expresión "estar a la moda" utilizada para objetos muy utilizados por la sociedad como un modelo de coche, una prenda de vestir, un tipo de teléfono móvil, entre otros utensilios que dan idea de frecuencia.[2][3][4] Si en la vida cotidiana moda significa muy usado, en estadística moda significa el valor más frecuente en un conjunto de datos.
Según W. Allen Wallis y Harry V. Roberts, en el libro Course in Statistics, hay una referencia temprana al concepto en el asedio de Platea y atenienses por parte del Peloponeso y los beocios. En el invierno del 428 a. C., los mesetarios y atenienses asediados por los peloponesios y los beocios construyeron escaleras para escapar a través de las murallas enemigas. Para construir escaleras de la altura de las murallas enemigas, muchos mesetas y atenienses contaron las capas de ladrillos. Aunque hubiera errores, la mayoría de los sitiados habría acertado en los recuentos. Es decir, el gran número de recuentos habría sido fiable.[2]
Una muestra puede ser unimodal (un modo), bimodal (dos modos), multimodal (varios modos) y amodal (sin modo).[5] Ciertas distribuciones patológica como la distribución de Cantor no tienen modo establecido. En una votación en la que la cantidad de votos determina la victoria, un resultado unimodal determina el ganador, mientras que un valor multimodal requiere un desempate. La muestra se denomina homogénea cuando sólo tiene una moda y heterogénea cuando tiene más de una moda.[6]
El modo de una muestra es el elemento que aparece con más frecuencia en la colección. Por ejemplo, el modo de la muestra [1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17] es 6. Dada la lista de datos [1, 1, 2, 4, 4] su modo no es único. En tal caso, se dice que un conjunto de datos es bimodal, mientras que un conjunto con más de dos modos puede describirse como multimodal.
Para una muestra de una distribución continua, como [0,935..., 1,211..., 2,430..., 3,668..., 3,874...], el concepto es inutilizable en su forma bruta, ya que no habrá dos valores exactamente iguales, por lo que cada valor ocurrirá precisamente una vez. Para estimar la moda de la distribución subyacente, la práctica habitual consiste en discretizar los datos asignando valores de frecuencia a intervalos de igual distancia, como para hacer un histograma, sustituyendo de hecho los valores por los puntos medios de los intervalos a los que están asignados. La moda es entonces el valor en el que el histograma alcanza su punto máximo. Para muestras pequeñas o medianas, el resultado de este procedimiento es sensible a la elección del ancho del intervalo si se elige demasiado estrecho o demasiado ancho; normalmente se debería tener una fracción considerable de los datos concentrados en un número relativamente pequeño de intervalos (de 5 a 10), mientras que la fracción de los datos que caen fuera de estos intervalos también es considerable. Un enfoque alternativo es la estimación de densidad kernel, que esencialmente difumina muestras puntuales para producir una estimación continua de la función de densidad de probabilidad que puede proporcionar una estimación de la moda.
El siguiente ejemplo de código MATLAB (o Octave) calcula la moda de una muestra:
X = sort(x); % x es un conjunto de datos de vectores de columnas
indices = find(diff([X; realmax]) > 0); % índices en los que cambian los valores repetidos
[modeL,i] = max (diff([0; indices])); % longitud de persistencia más larga de los valores repetidos
mode = X(indices(i));
El algoritmo requiere como primer paso ordenar la muestra en orden ascendente. A continuación, calcula la derivada discreta de la lista ordenada y encuentra los índices en los que esta derivada es positiva. A continuación calcula la derivada discreta de este conjunto de índices, localizando el máximo de esta derivada de índices, y finalmente evalúa la muestra ordenada en el punto donde se produce ese máximo, que corresponde al último miembro del tramo de valores repetidos.
A diferencia de la media y la mediana, el concepto de moda también tiene sentido para " datos nominales" (es decir, que no consisten en valores numéricos en el caso de la media, ni siquiera en valores ordenados en el caso de la mediana). Por ejemplo, si tomamos una muestra de Nombre de familia coreano, podríamos encontrar que "Kim" aparece con más frecuencia que cualquier otro nombre. Entonces, "Kim" sería la moda de la muestra. En cualquier sistema de votación en el que una pluralidad determina la victoria, un único valor modal determina el vencedor, mientras que un resultado multimodal requeriría algún procedimiento de desempate.
A diferencia de la mediana, el concepto de moda tiene sentido para cualquier variable aleatoria que asuma valores de un espacio vectorial, incluidos los números reales (un espacio vectorial de una dimensión) y los enteros (que pueden considerarse incrustados en los reales). Por ejemplo, una distribución de puntos en el plano suele tener una media y una moda, pero no se aplica el concepto de mediana. La mediana tiene sentido cuando hay un orden lineal en los valores posibles. Las generalizaciones del concepto de mediana a espacios de mayor dimensión son la mediana geométrica y el punto central.
Para algunas distribuciones de probabilidades, el valor esperado puede ser infinito o indefinido, pero si está definido, es único. La media de una muestra (finita) siempre está definida. La mediana es el valor tal que las fracciones que no la superan y que no caen por debajo de ella son al menos 1/2 cada una. No es necesariamente única, pero nunca infinita o totalmente indefinida. Para una muestra de datos, es el valor "a medio camino" cuando la lista de valores se ordena en valor creciente, mientras que normalmente para una lista de longitud par se toma la media numérica de los dos valores más próximos a "medio camino". Por último, como ya se ha dicho, la moda no es necesariamente única. Ciertas distribuciones patológicas (por ejemplo, la distribución de Cantor) no tienen moda definida en absoluto. Para una muestra de datos finita, la moda es uno (o más) de los valores de la muestra.
Aunque común, es una falsa creencia que no es posible obtener información sobre la variabilidad de la población a partir de una única observación y que no es posible un intervalo de confianza de longitud finita para la media y/o la varianza.
Es posible para una distribución unimodal desconocida estimar el intervalo de confianza para la moda con un tamaño de muestra de 1.[8] Esto fue demostrado por primera vez por Abbot y Rosenblatt y ampliado por Blachman[9] y Machol[10] El intervalo de confianza puede afinarse si puede suponerse que la distribución es simétrica. También es posible afinar el intervalo si la distribución es normal.
Para obtener la moda en datos agrupados se usa la siguiente fórmula:
Donde:
Sus principales propiedades son: