1.1 El entorno de trabajo.

Una vez instalado R, lo inicializas ejecutando el icono Rgui.exe (Windows) o escribiendo R (Linux) en la terminal. Esto hará que aparezca la terminal de comandos de R que espera por ti a que ejecutes tus comandos. El punto de entrada de comandos se reconoce por el símbolo >, y es el indicador de que se ha iniciado una nueva sesión de R de forma exitosa.

Una vez iniciado R, este denomina a uno de los directorios en tu disco duro como directorio de trabajo (working directory en ingles), que es donde R busca por cualquier archivo, programa o datos pertenecientes al usuario (¡a ti!) el cual quieras utilizar. Una forma de determinar cual es el directorio de trabajo es usando la función getwd() (ahí dice: obtener directorio de trabajo en ingles).

Por lo general, si vas a usar R para procesar y analizar tus propios datos o guardar resultados (bases de datos procesadas, imágenes o archivos) entonces debes de poder cambiar de directorios1. Para este proceso existe la función setwd("tu/directorio/personal") (ahí dice: establecer directorio de trabajo en ingles), donde “tu/directorio/personal” es la dirección donde se encuentra tu carpeta personal en el disco duro 2. Por ejemplo, supongamos que tienes una o mas bases de datos que quieres procesar en una carpeta llamada “misDatos” que se encuentra en “C:” (el disco duro por omisión en Windows). Para cambiar a este directorio escribirías en R:

    setwd("C:/misDatos")

Los directorios los puedes entender como carpetas dentro de otras carpetas: por ejemplo, los documentos guardados en una carpeta llamada, digamos, “Mi Carpeta Personal” que se encuentra en el escritorio de Windows se encuentran en la dirección "C:/users/Tu Usuario/Desktop/Mi Carpeta Personal". Mi recomendación es que guardes todos tus archivos en una carpeta personal que tenga una estructura clara y bien organizada como la que se muestra en la figura ??. Esa es la forma como estructura mi directorio de trabajo:

Buenas prácticas de programación. Esta es una forma de mantener una estructura consistente y portable de organizar tus archivos y que es usada por otros programadores. Recuerda, es posible que tus programas no solo los termines usando tú, sino que otras personas también.

  • En la carpeta Data se encuentran todas las bases de datos: archivos de Excel (.xlsx), de valores separados por coma (.csv), de datos (.dat), de datos de R (.Rdata), y otros3.
  • En la carpeta ext se encuentran scripts de R (.R) que contienen funciones con funciones especificas que yo mismo escribí o que fueron escritas por alguien más.
  • En output coloco toda la información que quiero guardar como gráficos (.jpeg, .png, .tiff, etc.), archivos PDF o de Word (.docx).
  • En src (esto es abreviado para source code) se encuentran todos mis scripts de R, así como archivos de rmarkdown (.Rmd)4.

Otra forma de mantener estructuras organizadas es por medio de la creación de proyectos en RStudio. Yo no he usado RStudio y por lo tanto no comentare al respecto, pero puedes encontrar un tip interesante en @RTips, y existen otros artículos en Internet que puedes consultar.


  1. Puedes encontrar una explicación acerca de los directorios en aquí↩︎

  2. Las comillas son obligatorias. Mas adelante cuando aprendas sobre la representación y los tipos de datos sabrás porque.↩︎

  3. Las palabras luego del punto que se encuentran entre paréntesis se conocen como extensiones del archivo o formato del archivo. Todos los archivos de Excel finalizan con la extensión .xlsx, y ese es su formato (aunque uno le diga formato de Excel). De igual forma, otras extensiones definen otros formato de datos y cada uno representa el contenido del archivo de una forma particular (puedes pensar en la diferencia en como se representa la data en un archivo PDF y uno de Word).↩︎

  4. Otras personas llaman a esta carpeta R en lugar de src. La razón de porque yo la llamo src es porque tengo en esta carpeta otros programas con otras extensiones diferentes a la de R (.pl, .py, .cpp, .h, .md, .jl, etc.).↩︎