En esta parte vamos a trabajar con datos de tipo trexto o también llamado datos contenidos en archivos planos.
Los datos no siempre van a ser ingresados desde la consola del R. Es más cómodo ingresar los datos usando otros programas como los editores, el Word, Excel, etc.
Por otro lado, es probable que los datos a ser procesados ya estén guardados como archivos de texto.
Por estas razones vamos a ver cómo se leen los datos desde archivos de texto.
De manera que, luego de leer el archivo hacia un data frame, podemos manipular sus variables en conjunto, una parte ellos o de manera individual como antes lo hemos hecho.
Según esto, >datos$Ahorro Nos mostrará los valores de la variable Ahorro.
De manera que si deseamos algunas estadísticas de Ahorro, podríamos usar: >mean(datos$Ahorro) >var(datos$Ahorro)
Del mismo modo, si quisiéramos algunas estadísticas de resumen, podríamos usar: >summary(datos)
Como vemos, no es práctico el uso de una variable de un dataframe.
Otra forma de disponer de cada una de las variables que conforman un dataframe, es usar el comando o función attach(...)
Pero volvamos a nuestro tema: Lectura de datos
Vamos a leer otro archivo de texto: "agri.txt", de la carpeta "rpage", de la unidad "d", cuyo separador desconocemos y del mismo modo, no sabemos si tiene cabecera (header).
Ensayemos: Supongamos que el separador es ",".
> agr = read.table("d:\\rpage\\agri.txt",sep=",")
Lectura de un archivo csv.
Vamos a leer el archivo llamado "aurea.csv", de la misma carpeta anterior, que tiene cabecera y, siendo "csv", el delimitador es ",".
Insertando cabecera a datos que no lo tienen
Lectura de un archivo del Excel
Vamos a leer una muestra sobre las ventas de un determinado cereal y la publicidad hecha para tal fin en tres medios diferentes. Los datos se encuentran en la primera hoja del archivo "cereales.xlsx".
Lectura de datos desde un archivo creado en spss
En cnsecuencia, volvamos a repetir el comando para cargar en d el contenido del archivo mineros.sav.
>d=read.spss("d:\\rpage\\mineros.sav")
Si ahora deseamos visualizar su contenido, digitamos
>d
El resultadoobtenido es incomprensible; esto sucede porque el comando ingresado no está completo. Se debe ingresar:
> d=read.spss("d:\\rpage\\mineros.sav",use.value.labels=TRUE,max.value.labels=TRUE,to.data.frame=TRUE)
Como en los casos anteriores de datos provenientes de archivos grabados en otro medio, el objeto (variable, vector o matriz) en donde se almacenan los datos, es un dataframe.
Continuaremos en la siguiente sesión