Sesión 3 Lectura de datos

Para leer datos lo más sencillo es utilizar la interfaz de RStudio. En el caso de un archivo de texto plano (.csv, .txt,…) utilizaremos Environment > Import Dataset > From text (readr). Y seleccionamos los datos que queremos importar en la ventana.

Importante: Siempre incluye el código de lectura de datos en tu script!

library(readr)
df_muni <- read_csv("datos/df_municipios.csv")
## 
## ── Column specification ───────────────────────────────
## cols(
##   state_abbr = col_character(),
##   municipio_name = col_character(),
##   pop = col_double(),
##   pop_male = col_double(),
##   pop_female = col_double(),
##   afromexican = col_double(),
##   indigenous = col_double(),
##   metro_area = col_character()
## )
df_muni
## # A tibble: 2,457 x 8
##    state_abbr municipio_name    pop pop_male pop_female afromexican indigenous
##    <chr>      <chr>           <dbl>    <dbl>      <dbl>       <dbl>      <dbl>
##  1 AGS        Aguascalientes 877190   425731     451459         532     104125
##  2 AGS        Asientos        46464    22745      23719           3       1691
##  3 AGS        Calvillo        56048    27298      28750          10       7358
##  4 AGS        Cosío           15577     7552       8025           0       2213
##  5 AGS        Jesús María    120405    60135      60270          32       8679
##  6 AGS        Pabellón de A…  46473    22490      23983           3       6232
##  7 AGS        Rincón de Rom…  53866    26693      27173          13       6714
##  8 AGS        San José de G…   8896     4276       4620          13       1733
##  9 AGS        Tepezalá        20926    10197      10729           4       3468
## 10 AGS        El Llano        20245     9982      10263           0        936
## # … with 2,447 more rows, and 1 more variable: metro_area <chr>

Abre el script ejercicios.R y añade código para leer los datos de educación a nivel municipal, ubicados en la carpeta df_edu.csv.

Usando la interfaz de RStudio también podemos importar datos de Excel, SPSS, SAS, o Stata. En Excel podemos especificar la hoja y rango de datos a importar.

library(readxl)
women_school <- read_excel("datos/Years_in_school_women_25_plus.xlsx", 
                           sheet = "Data")
women_school
## # A tibble: 175 x 41
##    `Row Labels` `1970.0` `1971.0` `1972.0` `1973.0` `1974.0` `1975.0` `1976.0`
##    <chr>           <dbl>    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
##  1 Afghanistan       0        0.1      0.1      0.1      0.1      0.1      0.1
##  2 Albania           3.9      4        4.1      4.2      4.3      4.5      4.6
##  3 Algeria           0.6      0.6      0.6      0.7      0.7      0.8      0.8
##  4 Angola            0.5      0.5      0.5      0.5      0.6      0.6      0.6
##  5 Antigua and…      7        7.1      7.2      7.4      7.5      7.7      7.8
##  6 Argentina         5.5      5.6      5.7      5.9      6        6.1      6.2
##  7 Armenia           5.9      6        6.2      6.3      6.5      6.6      6.8
##  8 Australia         8.4      8.5      8.6      8.7      8.8      8.9      9  
##  9 Austria           7.2      7.3      7.4      7.5      7.6      7.7      7.9
## 10 Azerbaijan        4.5      4.6      4.8      5        5.1      5.3      5.5
## # … with 165 more rows, and 33 more variables: `1977.0` <dbl>, `1978.0` <dbl>,
## #   `1979.0` <dbl>, `1980.0` <dbl>, `1981.0` <dbl>, `1982.0` <dbl>,
## #   `1983.0` <dbl>, `1984.0` <dbl>, `1985.0` <dbl>, `1986.0` <dbl>,
## #   `1987.0` <dbl>, `1988.0` <dbl>, `1989.0` <dbl>, `1990.0` <dbl>,
## #   `1991.0` <dbl>, `1992.0` <dbl>, `1993.0` <dbl>, `1994.0` <dbl>,
## #   `1995.0` <dbl>, `1996.0` <dbl>, `1997.0` <dbl>, `1998.0` <dbl>,
## #   `1999.0` <dbl>, `2000.0` <dbl>, `2001.0` <dbl>, `2002.0` <dbl>,
## #   `2003.0` <dbl>, `2004.0` <dbl>, `2005.0` <dbl>, `2006.0` <dbl>,
## #   `2007.0` <dbl>, `2008.0` <dbl>, `2009.0` <dbl>