Estadística

Estadística
Por: Francisco Alonso Alavez Sosa Grupo: 506

domingo, 23 de noviembre de 2014

Ejemplo

En el estudio de unos árboles, se registraron diferentes datos correspondientes a la altitud a la que se encuentran y a la tasa de respiración que tienen.  Los datos son los siguientes. 

Altitud (x): 90, 230, 240, 260, 330, 400

Tasa de respiración (y): 0.11, 0.20, 0.13, 0.15, 0.18, 0.16

n=6
Σx= 1150Σy=0.93
Σx^2= 455100
Σy^2= 0.1495
(Σx)^2= 2402500
(Σy)^2= 0.8649

Coeficiente R de Pearson


r=249.5 - (1550)(0.93)
                                            6                                         
                                                        455100- 2402500         0.1495- 0.8649
                                                                            6                                6

             r=            9.25                               
√54683.33 √5.35 x10^-3

             r=            9.25                               
                                                                    (233.84)(0.0731)

             r=            9.25                               
                                                                             17.10

r= 0.54        Positiva Moderada


Recta de Regresión y= mx + b

m=             249.5 - (1550)(0.93)            

                               6               

                                                                      455100- 2402500        
                                                                                      6     


m=  9.25           
54683.33

m= 1.69 x10^-4


b= 0.93 - (1.69 x10^-4)(1150)
       6                                   6      

b= 0.155 - 0.044

b= 0.111


y= (1.69 x10^-4)x + 0.111

Regresión y Correlación Lineal 

Regresión 

Técnica que permite cuantificar la relación que puede ser observada cuando se gráfica un diagrama de puntos dispersos correspondientes a dos variables, cuya tendencia general es rectilínea relación que cabe compendiar mediante una ecuación “del mejor ajuste” de la forma: 
y=mx + b





Correlación

El análisis de  la correlación tiene mucho que ver y está enlazado con el análisis de regresión y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.

La correlación entre dos variables es el grado de asociación entre las mismas. Este es expresado por un único valor llamado coeficiente "R" de Pearson, el cual puede tener valores que se encuentean entre -1 y +1. Cuando “r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo de “b” en el análisis de regresión).



Interpretación del Coeficiente R de Pearson

-1  Correlación negativa grande y perfecta     

-0,9 a -0,99  Correlación negativa muy alta                                 

-0,7 a -0,89  Correlación negativa alta                                       

-0,4 a -0,69  Correlación negativa moderada                            

-0,2 a -0,39  Correlación negativa baja                                    

         -0,01 a -0,19  Correlación negativa muy baja                                       

  0  Correlación nula                                      

0,01 a 0,19  Correlación positiva muy baja                               

0,2 a 0,39  Correlación positiva baja                                     

0,4 a 0,69  Correlación positiva moderada                             

0,7 a 0,89  Correlación positiva alta                                       

0,9 a 0,99  Correlación positiva muy alta                               

1  Correlación positiva grande y perfecta  



domingo, 28 de septiembre de 2014

Gráficas para Tablas Cualitativas

Para representar tablas de tipo cualitativo podemos usar las gráficas de barra o de pastel y las de barras. Es mucho más rápido que las cuantitativas porque no hay que calcular ningún intervalo. 

Para la gráfica de pastel o circular: Podemos aplicar una regla de 3 simple para saber el número de grados que se necesitan para cierta frecuencia. El número total de datos es la suma de todas las frecuencias.  

360° = número total de datos (n)
 x = frecuencia obtenida (f)

x= f * 360°/n
En cada área irá el porcentaje obtenido y en las acotaciones, el dato al que pertenece la frecuencia. 



Para la gráfica de barras: En el eje X irá el nombre de los datos obtenidos. En el eje de las Y se pondrán los valores de las frecuencias.

Formas Gráficas para Representar Tablas Cuantitativas


 



Una vez obtenido el Intervalo de Clase Real, observaremos el límite superior de cada intervalo, ya que de ahí se determinarán valores futuros. 

Obtendremos además una marca de clase (x), que resulta de sumar el límite inferior con el superior y dividir el total entre 2. 

También calcularemos el valor del alcance (C) restando del límite superior el límite inferior de cada intervalo.  

Las frecuencia relativa sigue obteniéndose de la frecuencia entre el número total de datos. 

Las frecuencias acumulativa y acumulativa por porcentajes tendrán de base el límite superior de los intervalos de clase real. 

GRÁFICA CIRCULAR O DE PASTEL 
Al ser un círculo, contamos con 360°, lo que  será el 100 %. Con esta relación obtendremos el área que debe de cubrir cada intervalo. Sí recordamos, en la frecuencia relativa, dividimos las frecuencias entre el total de datos (100%). Por lo tanto, sólo es cuestión de multiplicar la frecuencia relativa por 360° y resultará la cantidad de grados para dicha frecuencia. 

GRÁFICA DE BARRAS
En el eje X acomodaremos los intervalos de clase. En el eje Y corresponderá intervalos razonables para acercarnos a las frecuencias que resultaron. Las barras deben tener cierta separación entre ellas para distinguir que son de otro intervalo. 

HISTOGRAMAS
Un histograma es una representación gráfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. 



FUNCIÓN ESCALÓN
Nos muestra la relación entre las frecuencias acumulativas menores o iguales a la variable y los intervalos de clase real. Gráficamente podemos observar el avance de nuestras frecuencias para cada intervalo.

Tablas de Series de Frecuencias por Intervalos.

x: Variable
FR: Frecuencias relativas
f: Frecuencias
fa: Frecuencias Acumulativas


Para un cierto número de datos en el que existan series, tomando como ejemplo, lanzar un dado en repetidas ocasiones.

Las variables serán los resultados que puedas obtener: 1 2 3 4 5 6
Sí lancé mi dado un total de 89 veces, la suma de las frecuencias de cada variable debe resultar 89.

Las frecuencias relativas están referidas a la probabilidad que se tiene que de aparezca cierta variable. La obtendremos dividiendo la frecuencia de una variable entre el total. Al finalizar, la suma de las frecuencias relativas tiene que resultar 1.00. 

Las frecuencias acumulativas las podemos tener menores o iguales a las de la variable o mayores que la misma. 

Las frecuencias acumulativas menores o iguales (Fa≤), en el caso de la variable 1 del dado, frecuencias que sean del número 1 y menores  a él. Por lo tanto en la variable 2, las frecuencias acumulativas serán las de 2 y menores a 2. 

También está el otro tipo de frecuencia acumulativa, mayores a la variable (Fa>). En ésta, contaremos sólo las frecuencias de las variables mayores a la que tomemos en cuenta. Sí estamos en la variable 1, sumaremos las frecuencias de las variables mayores a 1. 

Las frecuencias acumulativas también se calculan porcentaje Fa%≤ y Fa%>. Se repite exactamente el mismo proceso, sólo que ahora en vez de sumar las frecuencias, se suman las frecuencias relativas. 

Tablas de Frecuencias por Intevalos

1.-Primero se organizan los datosm de menor a mayor. Podemos utilizar un diagrama de tronco y hoja para facilitar el proceso de acomodar la información.                                                                                                                                            2.- Después obtenemos el rango: R=dato mayor - dato menor.
3.- El número de categorías lo obtenemos mediante la "Regla de Sturges".
                                                            m= 1+3.3 log N
Donde N será el número total de datos. 
4.- El intervalo (I) lo conseguimos dividiendo el rango (R) entre el número de Categorías (m).
                                                           I= R/m
*Sí el intervalo resulta exacto, se le puede aumentar una unidad para futuros asjustes. 
5.- Determinamos el nuevo rango: NR=Im. 
Al nuevo rango le restamos el primero para que tengamos uno real. El excedente se repartirá al principio y al final de nuestros intervalos. La mitad para cada uno sí es un número par, si es un número impar, la mayor parte será para el dato mayor. 

6.-En nuestra tabla encontraremos 3 intervalos de clase.

-El primero es el que tiene como rango el total calculado, sin embargo, con éste puede haber ambigüedades al registrar las frecuencias. 

-Por las dudas anteriores, se recorre un número del límite superior hacia la izquierda, es decir, se reduce en una unidad. 

-El tercer dato es llamado Intervalo de Clase Real y en los intervalos, el límite inferior se suma con el superior y se divide entre dos, para tener la clase real. 



domingo, 7 de septiembre de 2014

Conceptos Generales

Estadística: Conjunto de procedimientos destinados a recopilar, procesar y analizar la información que se obtiene con una muestra para inferir las características o parámetros de una población o de un problema determinado. 

Estadística Descriptiva: Registra los datos en las tablas y los representa en gráficos. Calcula los parámetros estadísticos (medidas de centralización y dispersión), que describen el conjunto estudiado. 

Estadística Inferencial: Estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos. 

Población: Conjunto de los individuos de un lugar determinado que comparten una característica o circunstancia común y son objeto de un estudio estadístico. 

Muestra: Una pequeña parte tomada del conjunto total para analizarla y hacer estudios que permitan inferir las características de un problema. 

Probabilidad: Se encarga de evaluar y permitir la medición de la frecuencia con la que es posible obtener un cierto resultado en el marco de un experimento aleatorio.

Fenómeno:Objetos de estudio que se presentan en tiempo y lugar determinados, Se analiza su mayor o menor intensidad de repetición. Dependiendo del resultado puede ser aleatorio o determinista.

Fenómeno Aleatorio: Todo experimento que puede repetirse indefinidamente, para el cual existe un intervalo de resultados definidos que se dan de manera aleatoria, es decir, impredecible. Cada repetición del experimento se denomina experiencia o prueba.

Fenómeno Determinista: Hechos o sucesos que ocurren con seguridad. En ellos se conoce de antemano, con certeza, el resultado. 

Parámetro: Número que se obtiene a partir de los datos de una distribución estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Dato: Cada uno de los valores que se ha obtenido al realizar un estudio estadístico.

Variable: Medida en un experimento, representada por una "x" o por una "y" que puede tomar el valor de un conjunto de valores. 

Variable Cualitativa: Se manifiesta en atributos, como pueden ser, bueno, malo, peor, regular, aceptable, defectuoso, feo, bonito, etc. 

Variable Cuantitativa: Es la que se expresa en cantidades.

Variable Continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. (Números Decimales).

Variable Discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. (Números enteros)

Población Finita: Conjunto compuesto por una cantidad limitada de elementos, como el número de especies, el número de estudiantes, el número de obreros, etc. 

Población Infinita: Es la que tiene un número extremadamente grande de componentes, como el conjuntos de especies que tiene el reino animal. 

Escala: Sucesión ordenada por grado o intensidad, de cosas distintas pero de la misma especie. 

Escala Nominal: Usa nombres para establecer categorías. Puede usar números pero éstos son de carácter simbólico. 

Escala Ordinal: También establece categorías, pero establece una relación "<" o ">" (mayor o menor que). Los números indicados sí indican jerarquía. No se puede establecer distancia entre dos puntos. 

Escala de Intervalo: Reúne las características anteriores pero registra de manera numérica la distancia entre dos puntos. Es cero no indica ausencia de variable y es arbitrario. 

Escala de Razón: Escala más fuerte donde el cero indica la ausencia de variable. La diferencia de dos valores es de magnitud conocida.  


Relación de la Estadística con Otras Ciencias

Esta ciencia se relaciona con otras, por ejemplo la Economía , la Planificación, la Computación, la Contabilidad, la Psicología, la Administración, etc.
La Estadística estudia las masas desde el punto de vista cuantitativo enriqueciendo su análisis con la argumentación de la Economía. A través de observaciones en las diferentes actividades humanas, se pueden lograr estimaciones muy certeras en la economía. 

La Planificación tiene estrecha relación con la Estadística, múltiples análisis estadísticos con diversos indicadores económicos, son necesarios para proyectar las variables económicas. Por otra parte al realizar el control del cumplimiento del plan se hacen considerables cálculos estadísticos que deben permitir la toma de decisiones, presentándose la Estadística como un instrumento de dirección nos ayuda a crear un proyecto y organizarnos de acuerdo a los objetivos. 

En la actualidad es inconcebible que el tratamiento de toda la información estadística se haga manualmente desechando las posibilidades reales que ofrecen los medios de cómputo moderno. Al aplicar la computación se obtienen resultados más exactos y confiables, pero también los resultados son más rápidos.

La Estadística podemos encontrar diferentes elementos muy útiles a la hora de recoger la datos de cualquier tema, analizarlos y obtener resultados precisos:

- La información de los hechos apoyándose en censos, muestreos y descripciones monográficas.

- La inferencia de las principales variables.

- El cálculo de magnitudes promedios para así eliminar el enfoque individual e infundado en la característica de los hechos.

- La tabulación de los datos estadísticos.

- El cálculo de los índices para caracterizar determinados fenómenos.

sábado, 6 de septiembre de 2014

Método Científico y sus Etapas

El método científico es un conjunto de principios y procedimientos para la búsqueda sistemática del conocimiento. Según la Enciclopedia Británica, "El método científico es un término colectivo que denota los diferentes procesos que ayudan a construir la ciencia".
En la estadística existen cuatro pasos fundamentales para llevar acabo dicho método:


  • PLANTEAMIENTO DEL PROBLEMA: consiste en encontrar y analizar atentamente algún fenómeno que tiene lugar en el entorno y que puede ser percibido fácilmente por los sentidos.
  • HIPÓTESIS: Después de las observaciones, se plantea el cómo y el por qué de lo que ha ocurrido y se formula una hipótesis, lo que consiste en elaborar una explicación provisional y personal de los hechos observados y de sus posibles causas.

  • OBSERVACIÓN Y/O EXPERIMENTACIÓN: Una vez formulada la hipótesis, se debe comprobar si es cierta. Para ello se realizarán múltiples experimentos modificando las variables que intervienen en el proceso y se deberá comprobar si se cumple la hipótesis antes propuesta.
    Experimentar consiste en reproducir y observar varias veces el hecho o fenómeno que se quiere estudiar, modificando las circunstancias que se consideren convenientes.
  • CONCLUSIÓN: El análisis de los datos experimentales permite comprobar si la hipótesis era correcta y dar una explicación científica y por lo tanto fundamentada al fenómeno observado.
    La emisión de conclusiones consiste en la interpretación de los hechos observados de acuerdo con los datos experimentales. Por medio de gráficas y estadísticas de distintos tipos, podemos entender los resultados.