Resumen general de gráficos en R

Ejemplo de repaso

Vamos a usar el archivo plano Herramientas.txt, que tiene cabecera (nombre de variable( y usa el tabulador como separador y que se encuentra en la unidad D y carpeta rpage.

Leemos el archivo:
>datos=read.table("d:\\rpage\\Herramientas.txt",sep="\t",header=T)
Vemos su estructura
>stru(datos) Ahora los primeros datos
>head(d)
Para facilitar su manejo y mantener en reserva los datos originales, definimod la variable d
>d = datos
¿Será un data frame?
>is.data.frame(d)
Veamos cuántas columnas tiene
>length(d)
Es cierto, ya lo habíamos visto con head(...)
Siendo tabla, veamos su dimensión
>dim(d)
Ahora veamos los nombres de columna o variables
>names(d) Como se puede ver, "Estado_Civil" y "Servicio" presentan dificultad en su manejo, por ello deseamos cambiarlos
Definimos un vector de nombres para las 7 columnas
> nd=c("Sexo","Sueldo","Edad","Ecivil","Cond","TServ","Afp")
Ahora, debemos volver a leer los datos del archivo
>datos=read.table("d:\\rpage\\Herramientas.txt",sep="\t",header=T,col.names=nd)
>d = datos
>head(d)
Ahora los nombres de las variables son fáciles de manejarlas
Separemos de la tabla
>attach(d)
Se puede comprobar que las variables se pueden manejar solo con su nombre y precederlas con el del dataframe.
>Sueldo
>Edad
etc.

Ahora veamos algunos estadísticas básicas de la tabla
>summary(d) Presentemos gráficos de estas variables en un solo panel con 9 gráficos

> par(mfrow=c(3,3))
> hist(Edad,col=c(3,2,4,5,6,1,7))
> hist(Sueldo,col=c(3,2,4,5,6,1,7))
> hist(TServ,col=c(3,2,4,5,6,1,7))
> barplot(table(Sexo),col=c(3,2,4,1,5,6))
> barplot(table(Cond),col=c(4,2,3,1,5,6))
> barplot(table(Ecivil),col=c(2,3,4,1,5,6))
> boxplot(Edad, xlab = "Edad",col="green")
> boxplot(TServ, xlab = "Tiempo de servicio",col="blue")
> boxplot(Sueldo, xlab = "Ingreso",col="red")

En la siguiente imagen se muestran estos 9 gráficos.
 

Se desea estudiar la relación entre el Consumo de helados, medido en pintas per capita, y las variables regresoras Precio del helado, en doláres por pinta, el Ingreso familiar por semana y la Temperatura media medida en grados Farenheit. Para ello se obtuvieron datos de 30 meses, desde Marzo de 1951 a Julio de 1953. Estos datos se encuentran en el archivo helados.txt. Analizar estos datos y estudiar un modelo de regresión que se ajuste a los mismos.

Vamos a leer los datos que se encuentran en la carpeta rpage de la unidad D.

Como no sabemos si tiene cabecera o no, vamos a leerlo a dhel, sin tomar en cuenta este argumento.

>dhel = read.table("d:\\rpage\\helados.txt",sep="\t") >dhel
Podemos apreciar que sí tiene cabecera, luego debemos leerlo usando el siguiente comando:
>dhel = read.table("d:\\rpage\\helados.txt",sep="\t",header=T)

>dhel Al trazar el diagrama de dispersión, podemos apreciar que sólo entre Consumo y Temperatura exise cierto grado de relación.

El siguiente comando nos permite visualizar el gráfico usando colores.

La gráfica se muestra en la siguiente imagen

Continuaremos en la siguiente sesión