• Notebook
  • Librerías
  1. Sin nombre todavía
  • Introducción
  • Boxplot
  • Word cloud
  • Diagrama de parlamento
  • Gráfico de dispersión
  • Gatitos e inflacción
  • Gráfico de Gannt
  • Gráfico de Radar o Araña
  • Mapa iteractivo
  • Geovisualización
  • Sin nombre todavía
  • Otros

Sin nombre todavía

Portafolio
Dataviz
Resumen

Una visualización de datos correcta puede expresar de forma resumida y clara gran cantidad de información, ayudando a interpretar y asimilar la información más facilmente.

Datos

El conjunto de datos Used Car Price Prediction Dataset es una colección completa de información extraída de la página web del mercado automovilístico https://www.cars.com. Este dataset comprende 4.009 puntos de datos, cada uno de los cuales representa una lista de vehículos única, e incluye nueve características distintas que brindan información valiosa sobre el mundo de los automóviles.

https://www.kaggle.com/datasets/taeefnajib/used-car-price-prediction-dataset/data

Código
used_cars <- read_csv("../data/used_cars.csv")
Código
used_cars <- used_cars |> select(milage, price) |> mutate(milage =  as.numeric(gsub("[^0-9]", "", milage)),
                                                          price = as.numeric(gsub("[$,]", "", price)))

Librerías específicas.

Código.

Código
used_cars |> 
ggplot(aes(x=milage, y=price)) + 
geom_point()

Código
used_cars |> 
ggplot(aes(x=milage, y=log(price))) + 
geom_point()

Código
used_cars |> 
ggplot(aes(x=as.factor(floor(milage / 10000) * 10000), y=price, fill=cut(milage, breaks = c(0, 29999, 69999, 199999, 999999999), labels = c("Bajo", "Medio", "Alto", "Muy alto")))) + 
  geom_boxplot() + 
  ylim(0, 100000) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_fill_manual(values = c("lightblue", "lightgreen", "lightpink", "orange")) + 
  labs(x="Kilometraje", y="Precio", title= "Relación entre Kilometraje y Precio", fill="Intervalo kilometraje")

Código
used_cars |> 
ggplot(aes(x=as.factor(floor(milage / 10000) * 10000), y=price, fill=ifelse(milage > median(milage), "Above", "Below"))) + 
  geom_boxplot() + 
  ylim(0, 100000) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_fill_manual(values = c("Below" = "lightblue", "Above" = "lightcoral")) +
  labs(x="Kilometraje", y="Precio", title= "Precios por Encima o Debajo de la Mediana", fill="")

Código
used_cars |> 
ggplot(aes(x=as.factor(floor(price / 10000) * 10000), y=milage, fill=ifelse(price > median(price), "Above", "Below"))) + 
  geom_boxplot() + 
  ylim(0, 100000) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_fill_manual(values = c("Below" = "lightblue", "Above" = "lightcoral")) +
  labs(x="Kilometraje", y="Precio", title= "Precios por Encima o Debajo de la Mediana", fill="")

 
  • License