CONVERTIR TANTO POR CIENTO A DECIMALES Y VICEVERSA

Se debe recordar siempre que un por ciento significa un centésimo. Lo dice la palabra misma: por ciento es por cien, se está comparando con cien: si 15% de la populación son ancianos, significa que 15 personas de cada cien son ancianos.

NOTACIÓN CIENTÍFICA

La notación científica (o notación índice estándar) es un modo conciso de representar un número utilizando potencias de base diez. Los números se escriben como un producto: a · 10k, (siendo a un número mayor o igual que 1 y menor que 10, y k un número entero). Esta notación se utiliza para poder expresar fácilmente números muy grandes.
La notación científica utiliza un sistema llamado coma flotante, o de punto flotante en países de habla inglesa y en algunos hispanohablantes.

DEFINICIÓN Y OBJETO DE LA ESTADÍSTICA

Historia de la Estadística
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del imperio.}

La historia de la estadística está resumida en tres grandes etapas o fases.
Primera Fase: Los Censos. Desde el momento en que se constituye una autoridad política, la idea de inventariar de una forma más o menos regular la población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos. Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política. Las ideas mercantilistas extrañan una intensificación de este
tipo de investigación. Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población: los intendentes del Reino envían a París sus memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética Política. Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla los estudios industriales, de las producciones y los cambios, haciéndose sistemáticos durante las dos terceras partes del siglo XIX. Tercera Fase: Estadística y Cálculo de Probabilidades. El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de fenómenos “cuyas causas son demasiado complejas para conocerlos totalmente y hacer posible su análisis”.
Definición de Estadística
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello, gracias al análisis de estos datos, significados precisos o unas previsiones para el futuro.
La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva.
Otros autores tienen definiciones de la Estadística semejantes a las anteriores, y algunos otros no tan afines. Para Chacón esta se define como “la ciencia que tiene por objeto el estudio cuantitativo de los colectivos”.
La más aceptada, sin embargo, es la de Minguez, que define la Estadística como “La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima”.

ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales, es decir, únicamente los adquiere, los recopila y los organiza. Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. La estadística inferencial simplemente es el procedimiento por medio del cual se llega a las inferencias acerca de una población base en los resultados obtenidos de una muestra extraída de la población, es decir, la Estadística Inferencial investiga o analiza una población partiendo de una toma de muestra.

VARIABLES DISCRETAS Y CONTINUAS

En líneas anteriores se ha señalado que el objeto de estudio de la Estadística son las poblaciones y que estas están formadas por entes o elementos. El número total de los mismos determina el tamaño de la población. Para estudiar una población, lo primero que debe hacerse es observarla de alguna de las formas que ya se ha señalado en las líneas anteriores. Pero observar una población es equivalente a observar sus elementos. Ahora bien, esos elementos poseen una serie de características que son las que realmente se observan. Por ejemplo, el conjunto de todas las empresas industriales radicadas en España constituyen una población. Los elementos de esa población son las empresas. Pero una empresa no se observa en abstracto. Lo que realmente tiene interés son las distintas características de esas empresas, como, por ejemplo, el número de empleados, el volumen de ventas, los costos salariales, los gastos en publicidad, los beneficios de las mismas, la naturaleza de los productos que fabrican, etc.

FUENTE DE DATOS

En los apartados anteriores se ha señalado que el objetivo de la Estadística es el estudio de los fenómenos de masas. Pero ello requiere el manejo de una información numérica amplia. La cuestión inmediata que surge es saber a dónde se puede recurrir para encontrar esa información necesaria y sin la cual el análisis estadístico no se puede realizar. En definitiva, se trata de conocer las fuentes que suministran información de carácter estadístico. Estas fuentes son susceptibles de clasificarse según distintos criterios. Atendiendo al agente que elabore esa información, la misma puede agruparse en endógena y exógena. La primera sería la que elabora el propio investigador. En este caso, la operación estadística conducente a recabar los datos necesarios para la realización del análisis estadístico se supone que la lleva a cabo el propio investigador. Será quien se encargue de observar los distintos caracteres, cuantitativos o cualitativos, relevantes de los elementos de una población. El resultado será una base de datos, obtenida mediante una muestra, o cualquiera de los otros procedimientos indicados con anterioridad, que permitirá el correspondiente análisis estadístico.
Esta situación se da cuando no existe fuente alternativa exógena capaz de facilitar esa información. Pero ¿qué se entiende por fuente exógena? En general, la podemos definir como aquella cuyo objeto principal es la obtención de información estadística pero que no actúa como usuaria, es decir, no es elaborada por el propio investigador.
Las fuentes exógenas son múltiples y a su vez se clasifican en dos categorías distintas. Por un lado están las fuentes oficiales o públicas, en el caso de México, un ejemplo claro es el INEGI (Instituto Nacional de Estadística y Geografía) y, por otro, las privadas (consultorias). De todas ellas las que generan mayor volumen de información son las primeras, es decir, las oficiales o públicas. Estas últimas se pueden clasificar, de acuerdo al ámbito espacial en que desarrollan sus competencias en materia estadística.

LA ESTADÍSTICA EN LA INVESTIGACIÓN

LA ESTADÍSTICA EN LA INVESTIGACIÓN
Método Estadístico
El conjunto de los métodos que se utilizan para medir las características de la información, para resumir los valores individuales, y para analizar los datos a fin de extraerles el máximo de información, es lo que se llama métodos estadísticos. Los métodos de análisis para la información cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
Errores Estadísticos Comunes
Al momento de recopilar los datos que serán procesados es susceptible cometer errores así como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen que ver con la digitación y que no son tan fácilmente identificables.
Algunos de estos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión que a aquellos que la contradicen. Un
caso extremo de sesgo sería la situación donde primero se toma una decisión y después se utiliza el análisis estadístico para justificar la decisión ya tomada. Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables. Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico. Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada.

POBLACIÓN Y MUESTRA

Población: El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes. "Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). "Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).
Una población en estadística es el conjunto de todas las observaciones en las que estamos interesados, o bien, es el conjunto de todos los procesos suceptibles de aparecer en un problema y que interesan a la persona que hace el estudio. Se llama tamaño de la población al número de individuos que la componen, siendo cada posible observación un individuo; así pues, las poblaciones pueden ser finitas e infinitas, en el caso de la segunda cabe mencionar que sólo existe en la teoría, ya que en la práctica no se encuentra la aplicación de elementos infinitos.
Cada observación en una población es un valor de una variable aleatoria X con una función de probabilidad o densidad determinada f(x). Normalmente, se denomina a las poblaciones con el nombre de la distribución de la variable; es decir, hablaremos de poblaciones normales, binomiales, etc.
Para estudiar una población existen dos posibilidades. Una de ellas consiste en estudiar todos sus elementos y sacar conclusiones; la otra consiste en estudiar sólo una parte de ellos, elegidos de tal forma que nos digan algo sobre la totalidad de las observaciones de la población. El mejor método resulta ser el primero, cuando es posible, lo cual sólo ocurre en las poblaciones finitas y razonablemente pequeñas; en el caso de poblaciones muy grandes o infinitas será muy difícil o imposible realizar un estudio total. En este caso necesitaremos tomar una muestra y nos surgirá el problema de cómo hacer para que la muestra nos diga algo sobre el conjunto de la población.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra. Muestra: La muestra es un conjunto o subconjunto representativo, seleccionado de una población, pero para que quede más claro el concepto, a continuación se enuncia el concepto de muestra de diferentes autores: Se llama muestra a una parte de la población a estudiar qué sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
La condición más obvia que se le puede pedir a una muestra es que sea representativa de la población. Está claro que si no conocemos la población no podemos saber si la muestra es representativa o no. La única forma de tener cierta garantía de que esto ocurra es tomar nuestra muestra de forma que cada individuo de la población y cada subgrupo posible de la población tengan igual probabilidad de ser elegidos. A este tipo de muestras se les llama muestras aleatorias o muestras al azar.
Una muestra aleatoria de tamaño n es un conjunto de n individuos tomado de tal manera que cada subconjunto de tamaño n de la población tenga la misma probabilidad de ser elegido como muestra; es decir, si la población tiene tamaño N, cada una de las combinaciones posibles de n elementos debe ser equiprobable. El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último, se aprobó que el examen de una población entera todavía permita la aceptación de elementos
defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población. Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer referencias sobre la población que está representada por la muestra. En consecuencia, muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo.
Los sistemas de muestreo se basan normalmente en la asignación de un número a cada uno de los individuos de la población y la posterior obtención de una muestra de n números aleatorios que se obtendrá por sorteo utilizando bolas numeradas, ordenadores, etc.

ESTIMADORES Y PARÁMETROS

Los dos problemas fundamentales que estudia la inferencia estadística son el “Problema de la estimación” y el “Problema del contraste de hipótesis”. Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto de estudio y sólo tenemos que estimar los parámetros que la determinan, estamos en un problema de inferencia estadística paramétrica; por el contrario, cuando no se conoce la forma funcional de la distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadística no paramétrica. Nosotros nos vamos a limitar a problemas de inferencia estadística paramétrica, donde la variable aleatoria objeto de estudio sigue una distribución normal, y sólo se estimarán los parámetros que la determinan, la media y la desviación típica.
Estadístico: Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.
Parámetro: Son las medidas o datos que se obtienen de la población, es decir, simplemente es el valor poblacional de las características de una población.
Se llama parámetros poblacionales a cantidades que se obtienen a partir de las observaciones de la variable y sus probabilidades y que determinan perfectamente la distribución de esta, así como las características de la población, por ejemplo: La media, μ, la varianza σ2, la proporción de determinados sucesos, P.
Los Parámetros poblacionales son números reales, constantes y únicos.

MUESTREO PROBABILÍSTICO Y NO PROBABILÍSTICO

Muestreo
En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se reproduzca de la mejor manera los rasgos esenciales de dicha población que son importantes para la investigación. Para que una muestra sea representativa, y por lo tanto útil, debe reflejar las similitudes y diferencias encontradas en la población, es decir, ejemplificar las características de ésta.
Los errores más comunes que se pueden cometer son:
1) Hacer conclusiones muy generales a partir de la observación de sólo una parte de la Población, se denomina error de muestreo.
2) Hacer conclusiones hacia una Población mucho más grandes de la que originalmente se tomó la muestra.
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.
I. Muestreo probabilístico.
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables.
II. Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos por lo que puede traer como consecuencia proporcionar información errónea En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa, pero en este tipo de muestreo la selección de la muestra no es aleatoria, sino que se basa en el juicio del entrevistador o del responsables de la investigación, además no se basa en ninguna teoría de probabilidad, por lo tanto no es posible calcular la precisión o bien ocultar los posibles errores cometidos.

Muestreo aleatorio sistemático

Muestreo aleatorio sistemático
Este procedimiento exige, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir, se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo de este tipo de muestreo está en los casos en que se dan periodicidades en la población, ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.
Tamaño de muestra
A la hora de determinar el tamaño que debe alcanzar una muestra, hay que tomar en cuenta varios factores, como son, el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello, antes de presentar algunos casos sencillos de cálculo de tamaño de muestra delimitaremos estos factores.

MUESTREO ALEATORIO SIMPLE

Todos los individuos tienen la misma probabilidad de ser seleccionados. La selección de la muestra puede realizarse a través de cualquier mecanismo probabilístico en el que todos los elementos tengan las mismas opciones de salir. Por ejemplo uno de estos mecanismos es utilizar una tabla de números aleatorios, o también con un ordenador generar números aleatorios, comprendidos entre cero y uno, y multiplicarlos por el tamaño de la población, este es el que vamos a utilizar.
El procedimiento empleado es el siguiente:
1) Se asigna un número a cada individuo de la población.
2) A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generadas con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

MUESTREO ESTRATIFICADO

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad internamente pero externamente con gran heterogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, nivel económico, nivel cultural etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra; y permite obtener la información, sobre las características del estudio más precisas de las estimaciones de la población, arrojando así mejores resultados.
La dificultad de este muestreo es la dificultad de decidir a que estrato se asigna cada uno de los elementos de la población. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...).

MUESTREO POR CONGLOMERADOS

Muestreo aleatorio por conglomerados
Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales.
En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas".

OTROS DISEÑOS Y PROCEDIMIENTOS DE MUESTREO: JUICIO Y CONVENIENCIA

Muestreo de juicio Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida dada, ya que descuerdo a su criterio busca las unidades más representativas. Una muestra de juicio es llamada una muestra probabilística, puesto que este método está basado en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para medir el error de muestreo. Las principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es bajo. Este tipo de muestreo se ocupa cuando el tamaño de la muestra es pequeña.
Muestreo por conveniencia Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población, incluso la muestra se selecciona según el criterio de accesibilidad y comodidad Para obtener una muestra aleatoria simple, cada elemento en la población tiene la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es infinita, por lo tanto, numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemáticos, estratificados y de conglomerados.

ERROR DE MUESTREO Y DE LA MUESTRA

El error de la muestra es la diferencia entre el resultado obtenido de una muestra estadística y el resultado que deberíamos haber obtenido de la población, el error de la muestra es medido por el error estadístico y el error de muestreo es el que aparece cuando usualmente no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población.
Nos encontramos que al momento de recopilar los datos que serán procesados es susceptible cometer errores, así como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen nada que ver con la digitación y que no son tan fácilmente identificables,
Algunos de estos errores son:
Sesgo: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo, cuando el individuo da mayor peso a los datos que apoyan su opinión en comparación de aquellos que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una decisión y después se utiliza el análisis estadístico para justificar la decisión ya tomada. Datos no comparables: el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables. Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico.
Muestreo Incorrecto: en la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada.

ESCALAS DE MEDICIÓN: NOMINAL, ORDINAL, DE INTERVALO Y DE RAZÓN

Para realizar un correcto análisis de los datos es fundamental conocer de antemano el tipo de medida de la variable, ya que para cada una de ellas se utilizan diferentes estadísticos. La clasificación más convencional de las escalas de medida se divide en cuatro grupos denominados Nominal, Ordinal, Intervalo y Razón.
1. Nominal Son variables numéricas cuyos valores representan una categoría distintiva que no implican un orden específico o identifican un grupo de pertenencia Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que nosotros podemos asignarles un valor a los (A) hombres y otro diferente a las mujeres (B) y por más machistas o feministas que seamos no podríamos establecer que uno es mayor que el otro. O Bien se clasificará a una muestra de personas de acuerdo a la religión que profesan: (1) Cristianos, (2) Judíos, (3) Musulmanes, (4) Otros y (5) Sin creencia alguna.

2. Ordinal Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Este tipo de variables
nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra. La medición ordinal permite ordenar los eventos en función de mayor o menor posesión de un atributo o característica. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede establecer que una persona con título de Postgrado tiene un nivel de educación superior al de una persona con título de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no es cuantificable o medible.

3. Intervalo Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala, sobre todo es aplicable a las variables continuas debido a que la multiplicación y la división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

4. Razón Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto de medición, además que determinan la distancia exacta entre los intervalos de una categoría Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida. Debido a la similitud existente entre las escalas de intervalo y de razón, el Stadistic Program Social System (SPSS) las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuación los diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.

TABLAS DE FRECUENCIA PARA VARIABLES DISCRETAS Y CONTINUAS

El principal objetivo de la estadística descriptiva es sintetizar conjuntos de datos mediante tablas o gráficos resumen, con el fin de poder identificar el comportamiento característico de un fenómeno y facilitar su análisis exhaustivo.

Frecuencia
Es el número de veces que se repite, es decir que aparece, el mismo dato estadístico en un conjunto de observaciones de una investigación determinada; la frecuencia se designa como: fi
Distribución de frecuencia: Es una disposición tabular de datos estadísticos ordenados ascendente o descendentemente con la frecuencia (fi) de cada dato.

INTERVALO DE CLASE Y LÍMITES DE CLASE

Rango
El rango de clase, conocido también como amplitud de clase o recorrido de clase, es el límite dentro de los cuales están comprendidos los valores de la serie de datos, en otras palabras, es el número de diferentes valores que toma la variable en un estudio de investigación dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango de una distribución de frecuencia se designa con la letra R.

Límite o frontera de clase
Las clases de una distribución de frecuencia indican las cotas o fronteras de cada clase en la distribución, las clases están formadas por dos números denominados límites aparentes (LA), ejemplo 32 – 37, el primero de estos dos (32) se llama límite inferior aparente (LIA) y el segundo (37) se le denomina límite superior aparente (LSA).

Límites reales
Los límites reales o verdaderos de una clase son aquéllos que se obtienen restándole media unidad de medida al límite aparente inferior de una clase y sumándole media unidad de medida al límite superior aparente de las diferentes clases, es decir, son valores no observables de la variable en estudio, puesto que no lo registra la unidad utilizada. Y se denominarán límite inferior real (LIR) y límite superior real (LSR).

ANCHURA DE INTERVALO DE CLASE

Clase de igual tamaño
Este tipo de clase es el más utilizado en los cálculos estadísticos; cuando todas las clases son del mismo tamaño, los cálculos relacionados con la distribución de frecuencia son simplificados considerablemente. En términos generales, este tipo de distribución es el que se utiliza comúnmente en casi todas las investigaciones.

Clase de igual tamaño
Este tipo de clase es el más utilizado en los cálculos estadísticos; cuando todas las clases son del mismo tamaño, los cálculos relacionados con la distribución de frecuencia son simplificados considerablemente. En términos generales, este tipo de distribución es el que se utiliza comúnmente en casi todas las investigaciones.

Clase abierta
Son aquellas en la que uno de sus dos los límites de clase no está definido numéricamente. Este tipo de clase se utiliza cuando las distribuciones poseen algunos datos u observaciones que son mucho mayores o mucho más pequeños que los demás y se quiere condensar en uno solo. En lo posible se debe tratar de evitar este tipo de clase ya que en estas condiciones no es posible definir el punto medio de la distribución, por lo cual se hace difícil la representación gráfica y en realizar otros cálculos con los datos que se presentan en los cuadros estadísticos. Sin embargo, existen investigaciones en donde la aplicación de las clases abiertas es conveniente, por cuanto, la
existencia de valores de la serie de datos son mucho menores o mucho mayores que el resto de la serie.

MARCA DE CLASE

Marca de clase: Es el punto medio de una clase y se obtiene sumando los
límites inferiores (LIA) y superiores de una clase (LSA) y dividiendo el resultado
entre dos. La marca de clase la denotaremos como MC.

MC=LIA+LSA/2

Donde:
M C = Marca de clase
LIA = Límite inferior aparente
LSA = Límite superior aparente

DISTRIBUCIÓN DE FRECUENCIA RELATIVA Y ACUMULADA PARA VARIABLES DISCRETAS Y CONTINUAS

Como vimos anteriormente, la frecuencia es el número de veces que se presenta cada valor de la variable.
Frecuencia absoluta (fa o fi): Llamaremos así al número de repeticiones que presenta una observación. Se representa por ni.
F1 + F2 + F3 +…………….……FK = N

GRÁFICA PARA DATOS CUALITATIVOS: GRÁFICA DE BARRAS Y DE PASTEL

Gráfica de barras

El tipo de representación gráfica depende en gran medida de la naturaleza del carácter de los elementos de la población con el que se esté trabajando, simplemente se grafican los datos cualitativos que se han resumido en una distribución de frecuencias. Así, si se trata de una variable se recurrirá al diagrama de barras en el caso de que sea discreta y que sus valores no estén agrupados.
Este diagrama se realiza haciendo uso de un sistema cartesiano en el que sobre el eje de abscisas se ponen los valores de la variable y sobre el de ordenadas las frecuencias, tanto absolutas (ni) como relativas (fi). Un ejemplo de este tipo de gráfico es el que se da en la Figura 1, donde se han representado los datos.


Gráfica circular o de pastel, tarta o pay

La gráfica de pastel (también llamado gráfico de sectores) es una gráfica que consiste en representar por medio de una circunferencia los datos de una investigación. Por lo que se dividen los sectores en variables de estudio; en Estadística, las gráficas de pastel se utilizan para la representación de frecuencias relativas o porcentuales.
Esta gráfica se dividirá en tantos sectores como variables tenga la investigación en estudio; la magnitud de cada sector se encontrará en relación directa con la magnitud de la variable a representar con 360°. En general los datos que se representan por medio de esta diagrama son parte componentes de un total.
Para su elaboración se procede de la siguiente forma: se considera la circunferencia como representación total de la investigación de estudio, por tal motivo, se dividirá la superficie en las secciones que tenga la investigación, las superficies serán proporcionales a la magnitud que corresponda a cada una de ellas.

GRÁFICA PARA DATOS CUANTITATIVOS: HISTOGRAMAS, POLÍGONOS DE FRECUENCIA Y OJIVAS

Cuando la naturaleza de la variable sea continua, entonces la representación gráfica más adecuada es el histograma o también conocido como histograma de frecuencias. Este tipo de gráficos podría utilizarse también en los casos de variables discretas con valores agrupados, aunque no resulta aconsejable hacer uso de los histogramas para variables discretas por los problemas que conlleva asimilar una variable discreta a otra de tipo continuo. A diferencia del gráfico de barras no hay separación entre los rectángulos formados por las clases adyacentes.

GRÁFICAS DE LÍNEAS DE SERIES DE TIEMPO

Toda institución, ya sea la familia, la empresa o el gobierno, necesita realizar planes para el futuro si desea sobrevivir o progresar. La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión se suele basar en lo ocurrido en el pasado. La técnica estadística utilizada para hacer inferencias sobre el futuro teniendo en cuenta lo ocurrido en el pasado es el ANÁLISIS DE SERIES TEMPORALES.
SERIES TEMPORALES: Tratamos de hacer predicciones sobre esa magnitud, teniendo en cuenta sus características históricas o del pasado.
Se define una serie temporal (también denominada histórica, cronológica o de tiempo) como un conjunto de datos, correspondientes a un fenómeno económico, ordenados en el tiempo.
Por lo tanto, partiendo de lo anterior, se puede decir que los gráficos de series de tiempo reúnen el conjunto de datos de las observaciones ocurridas en un determinado período de tiempo, por lo que se permite observar más fácilmente el comportamiento de las variables en el tiempo ( si ascienden o descienden). La gráfica es un diagrama en el que el eje vertical (eje de las ordenas) denota el valor de la variable estudiada y el eje horizontal (eje de las abscisas) se observa el tiempo.

DIAGRAMAS DE CAJA

Utilizando un diagrama de tallo y hojas, podemos comparar, mediante estos diagramas, dos distribuciones.

MEDIA ARITMÉTICA

Para tal fin, desde luego, no se usará el valor más elevado ni el valor más pequeño como único representante, ya que solo representan los extremos más bien que valores típicos. Entonces sería más adecuado buscar un valor central. Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual. Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.

La mediana para datos no agrupados

Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana.
La mediana (Me) es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos.

LA MODA

La moda para datos no agrupados
La moda (Mo) es la medida de tendencia central especialmente útil para describir mediciones de tipo ordinal y nominal.
La moda es el valor de la observación que aparece más frecuentemente.



La moda para datos agrupados
Para datos agrupados en una distribución de frecuencia, la moda puede ser estimada por la marca de clase del intervalo que contenga la frecuencia de clase más grande. Si hay dos intervalos continuos con frecuencia máxima la moda será la media aritmética de las dos marcas de clase. Si hay dos o más intervalos no contiguos con frecuencia de clase máxima habrá dos o más modas que serás las marcas de clase de dichos intervalos.

Ejemplo:

LA MEDIA GEOMÉTRICA