Semana 4: Probabilidades y Data Science

 Probabilidades y Data Science

 

Las probabilidades siempre han sido enfocadas en Matemáticas puras, un tema tabú sólo apto para matemáticos de carrera. Sé de buena fuente que científicos que han estudiado Física y Matemáticas ahora se dedican a tareas más mundanas como analistas en entidades financieras y startups.

Se puede hacer una profesión muy lucrativa solamente estudiando las bases de la matemática estadística que apoya tus estudios de informática. Aquí tengo una síntesis de los conceptos más importantes.

¿Qué es un evento?

Es un elemento de un conjunto de eventos similares, es una única ocurrencia. 


¿Qué es un conjunto?

Son todos los eventos agrupados. Son las posibilidades que tenemos en el sistema. Está compuesto de eventos elementales, también se le llama espacio muestral.


Propiedades de los conjuntos.

Los conjuntos de datos estadísticos tienen ciertas propiedades que los distinguen del resto de conjuntos, concretamente se llaman métricas. Algunas de estas métricas son:

Promedio   
Media
Mediana    
Variación   
Desviación estándar


¿Qué es la probabilidad?

La probabilidad es una creencia que tenemos sobre la ocurrencia de eventos elementales 


Probabilidad de un evento

Las probabilidades pueden ser:

Marginal P(A), cuando se trata de un sólo evento

Conjunta P(AuB), cuando están involucrados varios eventos y,

Condicional P(A|B), la probabilidad de que suceda A sabiendo que ha sucedido B


Propiedades de las probabilidades

A cada evento se asigna un valor entre 0 y 1, designado por P
    0 <= P <= 1
    Certeza: P = 1
    Imposibilidad P = 0
    Disyunción P(AuB) = P(A) +P(B)


Teorema de Bayes

Se refiere a la probabilidad de un suceso condicionado por la ocurrencia de otro suceso.

P(A|B)=[P(B|A)P(A)]/P(B)

Más información está aquí
 

¿Qué es una distribución y que aplicaciones le podemos dar?

Una función matemática que a cada ocurrencia de variable aleatoria asigna una probabilidad. Por ello un nombre más apropiado sería función de densidad de probabilidad, las distribuciones pueden ser discretas o continuas.

Unas cuantas distribuciones son:
Distribución binomial   
Distribución multinomial   
Distribución Poisson   
Distribución Geométrica   
Distribución hipergeométrica   
Distribución binomial negativa   
Distribución Exponencial  
Distribución Pareto

Pero más allá de ser unos interesantes objetos matemáticos, su importancia es capital. Nos ayudan a estimar métricas estadísticas sobre las cuales podemos tomar decisiones que de otro modo no serían tan fáciles.

Por ejemplo, modelos estadísticos que incluyen uso de distribuciones se emplearon para determinar la afectación en las capa de ozono. Una medida que ha resultado exitosa para la conservación del planeta.

Se ha empleado para adelantarse al aparecimiento de plagas y control sanitario de los alimentos. Tal vez sí se hubiese empleado esto en China, este momento no estaríamos lamentando una pandemia.


  



  


    
    
    
    
  


Comentarios

Entradas populares de este blog

Semana 5: Predictor de encuentros deportivos

Semana 3: El Motor de videojuegos y la resolución de las pantallas

Semana 1: Lógica Proposicional