Metodos estadisticos: El
método estadístico consiste en una serie de procedimientos para el
manejo de los datos cualitativos y cuantitativos de la investigación.
Dicho manejo de datos tiene por propósito la comprobación, en una parte de la realidad de una o varias consecuencias verticales deducidas de la hipótesis general de la investigación.
Las características que adoptan los procedimientos propios del método estadístico dependen del diseño de investigación seleccionado para la comprobación de la consecuencia verificable en cuestión.
El método estadístico tiene las siguientes etapas:
Tales etapas siempre se encuentran en el orden descrito y cada una de ellas consiste de manera resumida en lo siguiente:
Por lo anterior puede decirse que esta etapa del método estadístico consiste en la medición de las variables.
La recolección o medición puede realizarse de diferentes maneras: a veces ocurre por simple observación y en otras ocasiones requiere de complejos procedimientos de medición; en algunas ocasiones basta con una sola medición y en otras se requiere una serie de ellas a lo largo de amplios periodos de tiempo.
La calidad técnica de esta etapa es fundamental ya que de ella depende que se disponga de datos exactos y confiables en los cuales se fundamenten las conclusiones de toda la investigación.
Es tan grande la importancia de esta etapa que alguna clasificación es de las investigaciones se basan en la forma en que ocurre la medición: por ejemplo si la medición es recogida en una sola ocasión suele decirse que la investigación es transversal; en cambio si la información es recogida a lo largo del tiempo se denomina longitudinal a la investigación.
En ocasiones, la recolección de la información debe ocurrir en grupos tan grandes de individuos que se hace impartidos tratar de abarcar a todos ellos; entonces es cuando se pone en practica procedimientos de muestreo. Tales procedimientos de muestreo están subordinados a la consecuencia verificable que se desea comprobar y al diseño de investigación seleccionado.
A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o palotes; en otras ocasiones se requiere del empleo de tarjetas con los datos y, en investigaciones con mucha información y muchos casos puede requerirse de computadoras y programas especiales para el manejo de base de datos.
En términos generales puede decirse que el recuento consiste en la cuantificación de la frecuencia con que aparecen las diferentes características medidas en los elementos en estudio; por ejemplo el numero de personas de sexo femenino y el de personas de sexo masculino o el numero de niños con peso menor de 3 kilos y el numero de niños con peso igual o mayor a dicha cifra.
En esta etapa del método estadístico se elaboran los cuadros y los gráficos que permiten una inspección precisa y rápida de los datos.
La elaboración de cuadros que también suele llamarse tablas, tiene por propósito acomodar los datos de manera que se pueda efectuar una revisión numérica precisa de los mismos.
La elaboración de gráficos tiene por propósito facilitar la inspección visual rápida de la información.
Casi siempre a cada cuadro con datos le puede corresponder una gráfica pertinente que represente la misma información.
Presentar la misma información tanto en tabla como en u correspondiente gráfico permite obtener una clara idea de la distribución de las frecuencias de las características estudiadas.
En esta etapa la información es resumida en forma de medidas que permiten expresar de manera sintética las principales propiedades numéricas de grandes series o agrupamiento de datos.
La condensación de la información, en forma de medidas llamadas de resumen, tiene por propósito facilitar la comprensión global de las características fundamentales de los agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los interlocutores evocar de una misma esencia de los datos.
Aprendizaje: Es muy compleja la definición del aprendizaje, hay diferentes puntos de vista, tantos como definiciones.
Minería de datos: El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Carga de trabajo en las fases de un proyecto de datamining
Dicho manejo de datos tiene por propósito la comprobación, en una parte de la realidad de una o varias consecuencias verticales deducidas de la hipótesis general de la investigación.
Las características que adoptan los procedimientos propios del método estadístico dependen del diseño de investigación seleccionado para la comprobación de la consecuencia verificable en cuestión.
El método estadístico tiene las siguientes etapas:
- Recolección (medición)
- Recuento (computo)
- Presentación
- Descripción
- Análisis
Tales etapas siempre se encuentran en el orden descrito y cada una de ellas consiste de manera resumida en lo siguiente:
- Recolección (medición)
Por lo anterior puede decirse que esta etapa del método estadístico consiste en la medición de las variables.
La recolección o medición puede realizarse de diferentes maneras: a veces ocurre por simple observación y en otras ocasiones requiere de complejos procedimientos de medición; en algunas ocasiones basta con una sola medición y en otras se requiere una serie de ellas a lo largo de amplios periodos de tiempo.
La calidad técnica de esta etapa es fundamental ya que de ella depende que se disponga de datos exactos y confiables en los cuales se fundamenten las conclusiones de toda la investigación.
Es tan grande la importancia de esta etapa que alguna clasificación es de las investigaciones se basan en la forma en que ocurre la medición: por ejemplo si la medición es recogida en una sola ocasión suele decirse que la investigación es transversal; en cambio si la información es recogida a lo largo del tiempo se denomina longitudinal a la investigación.
En ocasiones, la recolección de la información debe ocurrir en grupos tan grandes de individuos que se hace impartidos tratar de abarcar a todos ellos; entonces es cuando se pone en practica procedimientos de muestreo. Tales procedimientos de muestreo están subordinados a la consecuencia verificable que se desea comprobar y al diseño de investigación seleccionado.
- Recuento (computo)
A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o palotes; en otras ocasiones se requiere del empleo de tarjetas con los datos y, en investigaciones con mucha información y muchos casos puede requerirse de computadoras y programas especiales para el manejo de base de datos.
En términos generales puede decirse que el recuento consiste en la cuantificación de la frecuencia con que aparecen las diferentes características medidas en los elementos en estudio; por ejemplo el numero de personas de sexo femenino y el de personas de sexo masculino o el numero de niños con peso menor de 3 kilos y el numero de niños con peso igual o mayor a dicha cifra.
- Presentación
En esta etapa del método estadístico se elaboran los cuadros y los gráficos que permiten una inspección precisa y rápida de los datos.
La elaboración de cuadros que también suele llamarse tablas, tiene por propósito acomodar los datos de manera que se pueda efectuar una revisión numérica precisa de los mismos.
La elaboración de gráficos tiene por propósito facilitar la inspección visual rápida de la información.
Casi siempre a cada cuadro con datos le puede corresponder una gráfica pertinente que represente la misma información.
Presentar la misma información tanto en tabla como en u correspondiente gráfico permite obtener una clara idea de la distribución de las frecuencias de las características estudiadas.
- Descripción
En esta etapa la información es resumida en forma de medidas que permiten expresar de manera sintética las principales propiedades numéricas de grandes series o agrupamiento de datos.
La condensación de la información, en forma de medidas llamadas de resumen, tiene por propósito facilitar la comprensión global de las características fundamentales de los agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los interlocutores evocar de una misma esencia de los datos.
Aprendizaje: Es muy compleja la definición del aprendizaje, hay diferentes puntos de vista, tantos como definiciones.
- Es un proceso por el cual se adquiere una nueva conducta, se modifica una antigua conducta o se extingue alguna conducta, como resultado siempre de experiencias o prácticas.
- Aprendizaje es la adaptación de los seres vivos a las variaciones ambientales para sobrevivir.
- Madurar es necesario para aprender y adaptarse al ambiente de la manera más adecuada.
- Partes innatas de aprendizaje: instintos, reflejos, impulsos genéticos que hemos ido heredando. Nos hace aprender determinadas cosas. Ha de haber interacción con el medio..
- Por condicionamiento: determinados estímulos provocan determinadas respuestas. Si los estímulos por azar o no se condicionan provocan que esta conducta inicial se refleje y se convierta un hábito.
- Por imitación o modelaje: muchas de las conductas son por imitación de las personas importantes y destacadas para nosotros.
- Por aprendizaje memorístico: aprendizaje académico--> no sabes lo que estás aprendiendo.
- Aprendizaje de memoria clásico, por lo cual al cabo de unas horas ya no lo recuerdas.
- Aprendizaje significativo: parte de cosas importantes para ti. A partir de ahí acumulas lo que ja sabias y lo haces tuyo.
Minería de datos: El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Básicamente, el datamining surge para intentar ayudar a comprender el
contenido de un repositorio de datos. Con este fin, hace uso de
prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda
próximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento
que el usuario les atribuye algún significado especial pasan a
convertirse en información. Cuando los especialistas elaboran o
encuentran un modelo, haciendo que la interpretación que surge entre la
información y ese modelo represente un valor agregado, entonces nos
referimos al conocimiento.
Aunque en datamining cada caso concreto puede ser radicalmente distinto
al anterior, el proceso común a todos ellos se suele componer de
cuatro etapas principales:
- Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente desea bajo la orientación del especialista en data mining.
- Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la transformación de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.
- Determinación del modelo. Se comienza realizando unos análisis estadísticos de los datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.
- Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
Carga de trabajo en las fases de un proyecto de datamining
En resumen, el datamining se presenta como una tecnología emergente,
con varias ventajas: por un lado, resulta un buen punto de encuentro
entre los investigadores y las personas de negocios; por otro, ahorra
grandes cantidades de dinero a una empresa y abre nuevas oportunidades
de negocios. Además, no hay duda de que trabajar con esta tecnología
implica cuidar un sinnúmero de detalles debido a que el producto final
involucra "toma de decisiones".