Sesión 3 Lectura de datos
Para leer datos lo más sencillo es utilizar la interfaz de RStudio. En el caso de un archivo de texto plano (.csv, .txt,…) utilizaremos Environment > Import Dataset > From text (readr). Y seleccionamos los datos que queremos importar en la ventana.
Importante: Siempre incluye el código de lectura de datos en tu script!
##
## ── Column specification ───────────────────────────────
## cols(
## state_abbr = col_character(),
## municipio_name = col_character(),
## pop = col_double(),
## pop_male = col_double(),
## pop_female = col_double(),
## afromexican = col_double(),
## indigenous = col_double(),
## metro_area = col_character()
## )
## # A tibble: 2,457 x 8
## state_abbr municipio_name pop pop_male pop_female afromexican indigenous
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 AGS Aguascalientes 877190 425731 451459 532 104125
## 2 AGS Asientos 46464 22745 23719 3 1691
## 3 AGS Calvillo 56048 27298 28750 10 7358
## 4 AGS Cosío 15577 7552 8025 0 2213
## 5 AGS Jesús María 120405 60135 60270 32 8679
## 6 AGS Pabellón de A… 46473 22490 23983 3 6232
## 7 AGS Rincón de Rom… 53866 26693 27173 13 6714
## 8 AGS San José de G… 8896 4276 4620 13 1733
## 9 AGS Tepezalá 20926 10197 10729 4 3468
## 10 AGS El Llano 20245 9982 10263 0 936
## # … with 2,447 more rows, and 1 more variable: metro_area <chr>
Abre el script ejercicios.R y añade código para leer los datos de educación a nivel municipal, ubicados en la carpeta df_edu.csv.
Usando la interfaz de RStudio también podemos importar datos de Excel, SPSS, SAS, o Stata. En Excel podemos especificar la hoja y rango de datos a importar.
library(readxl)
women_school <- read_excel("datos/Years_in_school_women_25_plus.xlsx",
sheet = "Data")
women_school
## # A tibble: 175 x 41
## `Row Labels` `1970.0` `1971.0` `1972.0` `1973.0` `1974.0` `1975.0` `1976.0`
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Afghanistan 0 0.1 0.1 0.1 0.1 0.1 0.1
## 2 Albania 3.9 4 4.1 4.2 4.3 4.5 4.6
## 3 Algeria 0.6 0.6 0.6 0.7 0.7 0.8 0.8
## 4 Angola 0.5 0.5 0.5 0.5 0.6 0.6 0.6
## 5 Antigua and… 7 7.1 7.2 7.4 7.5 7.7 7.8
## 6 Argentina 5.5 5.6 5.7 5.9 6 6.1 6.2
## 7 Armenia 5.9 6 6.2 6.3 6.5 6.6 6.8
## 8 Australia 8.4 8.5 8.6 8.7 8.8 8.9 9
## 9 Austria 7.2 7.3 7.4 7.5 7.6 7.7 7.9
## 10 Azerbaijan 4.5 4.6 4.8 5 5.1 5.3 5.5
## # … with 165 more rows, and 33 more variables: `1977.0` <dbl>, `1978.0` <dbl>,
## # `1979.0` <dbl>, `1980.0` <dbl>, `1981.0` <dbl>, `1982.0` <dbl>,
## # `1983.0` <dbl>, `1984.0` <dbl>, `1985.0` <dbl>, `1986.0` <dbl>,
## # `1987.0` <dbl>, `1988.0` <dbl>, `1989.0` <dbl>, `1990.0` <dbl>,
## # `1991.0` <dbl>, `1992.0` <dbl>, `1993.0` <dbl>, `1994.0` <dbl>,
## # `1995.0` <dbl>, `1996.0` <dbl>, `1997.0` <dbl>, `1998.0` <dbl>,
## # `1999.0` <dbl>, `2000.0` <dbl>, `2001.0` <dbl>, `2002.0` <dbl>,
## # `2003.0` <dbl>, `2004.0` <dbl>, `2005.0` <dbl>, `2006.0` <dbl>,
## # `2007.0` <dbl>, `2008.0` <dbl>, `2009.0` <dbl>