Semana 4: Probabilidades y Data Science
Probabilidades y Data Science
Las probabilidades siempre han sido enfocadas en Matemáticas puras, un tema tabú sólo apto para matemáticos de carrera. Sé de buena fuente que científicos que han estudiado Física y Matemáticas ahora se dedican a tareas más mundanas como analistas en entidades financieras y startups.
Se puede hacer una profesión muy lucrativa solamente estudiando las bases de la matemática estadística que apoya tus estudios de informática. Aquí tengo una síntesis de los conceptos más importantes.
¿Qué es un evento?
Es un elemento de un conjunto de eventos similares, es una única ocurrencia.
¿Qué es un conjunto?
Son todos los eventos agrupados. Son las posibilidades que tenemos en el sistema. Está compuesto de eventos elementales, también se le llama espacio muestral.
Propiedades de los conjuntos.
Los conjuntos de datos estadísticos tienen ciertas propiedades que los distinguen del resto de conjuntos, concretamente se llaman métricas. Algunas de estas métricas son:
Promedio
Media
Mediana
Variación
Desviación estándar
¿Qué es la probabilidad?
La probabilidad es una creencia que tenemos sobre la ocurrencia de eventos elementales
Probabilidad de un evento
Las probabilidades pueden ser:
Marginal P(A), cuando se trata de un sólo evento
Conjunta P(AuB), cuando están involucrados varios eventos y,
Condicional P(A|B), la probabilidad de que suceda A sabiendo que ha sucedido B
Propiedades de las probabilidades
A cada evento se asigna un valor entre 0 y 1, designado por P
0 <= P <= 1
Certeza: P = 1
Imposibilidad P = 0
Disyunción P(AuB) = P(A) +P(B)
Teorema de Bayes
Se refiere a la probabilidad de un suceso condicionado por la ocurrencia de otro suceso.
P(A|B)=[P(B|A)P(A)]/P(B)
Más información está aquí
¿Qué es una distribución y que aplicaciones le podemos dar?
Una función matemática que a cada ocurrencia de variable aleatoria asigna una probabilidad. Por ello un nombre más apropiado sería función de densidad de probabilidad, las distribuciones pueden ser discretas o continuas.
Unas cuantas distribuciones son:
Distribución binomial
Distribución multinomial
Distribución Poisson
Distribución Geométrica
Distribución hipergeométrica
Distribución binomial negativa
Distribución Exponencial
Distribución Pareto
Pero más allá de ser unos interesantes objetos matemáticos, su importancia es capital. Nos ayudan a estimar métricas estadísticas sobre las cuales podemos tomar decisiones que de otro modo no serían tan fáciles.
Por ejemplo, modelos estadísticos que incluyen uso de distribuciones se emplearon para determinar la afectación en las capa de ozono. Una medida que ha resultado exitosa para la conservación del planeta.
Se ha empleado para adelantarse al aparecimiento de plagas y control sanitario de los alimentos. Tal vez sí se hubiese empleado esto en China, este momento no estaríamos lamentando una pandemia.
Comentarios
Publicar un comentario