class: center, middle, inverse, title-slide # Uso de R en Latinoamérica: fortalezas, desafíos y debilidades ## Using R in Latin America: the great, the good, the bad, and the ugly ### Virginia A. García Alonso; Paola Corrales; Claudia A. Huaylla; Andrea Gómez Vargas; Joselyn Chávez; Denisse Fierro Arcos --- ## La iniciativa .pull-left[ El entorno de R es globalmente utilizado. ¿Cómo es su uso en Latinoamérica donde * el idioma es distinto, * la infraestructura no está garantizada, * el acceso a recursos es más escaso, * ...? Objetivo: conocer a la comunidad de usuarios y usuarias de R en Latinoamérica. ] .pull-right[ <img src="data:image/png;base64,#fig/iconocontexto.png" title="Imagen ilustrativa de Latinoamérica con el texto ‘Primera encuesta sobre uso de R en Latinoamérica’" alt="Imagen ilustrativa de Latinoamérica con el texto ‘Primera encuesta sobre uso de R en Latinoamérica’" width="100%" /> ] ??? ¡Hola! Mi nombre es Andrea y junto con Paola, Denisse, Virginia, Claudia y Joselyn, vamos a presentar el trabajo realizado sobre el Uso de R en Latinoamérica: fortalezas, desafíos y debilidades. ¿De que se trató esta iniciativa? Sabemos que el entorno de R es utilizado globalmente para diversos fines. Sin embargo, ¿qué tan ampliamente es utilizado en países periféricos como los Latinoamericanos donde el inglés no es el idioma oficial y donde la infraestructura y el acceso a diversos recursos no están garantizados entre otros? En agosto de 2020 un grupo de personas pertenecientes a comunidades de usuarios y usuarias de R en Latinoamérica, nos propusimos generar una encuesta para conocer a las personas que usan R en Latinoamérica, intentando resaltar cuáles son nuestras posibles fortalezas y a qué desafíos nos enfrentamos. --- ## La encuesta .pull-left[ * Anónima * 3 idiomas + Español + Portugués + Inglés * 18 personas colaboraron en su diseño * 31 preguntas opcionales ] .pull-right[ * 5 ejes de interés + Interés en R + Demografía + Educación + R y la comunidad + Uso de R ] <img src="data:image/png;base64,#fig/convocatoria2020.png" title="Flyers usados para difundir la encuesta con el texto ‘ Participa en la primera encuesta Latinoamericana sobre uso de R.‘ en español, inglés y portugués, junto al logo de R-forwards y los logos de las redes de difusión utilizadas: Twitter, Slack y Telegram." alt="Flyers usados para difundir la encuesta con el texto ‘ Participa en la primera encuesta Latinoamericana sobre uso de R.‘ en español, inglés y portugués, junto al logo de R-forwards y los logos de las redes de difusión utilizadas: Twitter, Slack y Telegram." width="75%" style="display: block; margin: auto;" /> ??? Con base en los objetivos propuestos, diseñamos una encuesta de 31 preguntas las cuales abordaban 5 ejes principales: su interés en R, información demográfica, su nivel académico, su relación con la comunidad de R y el área en que usan R. Con la finalidad de fomentar la inclusividad, la encuesta fue confeccionada en tres idiomas español, portugués e inglés para que las personas contestaran en el idioma con el que se sintieran más cómodas. La iniciativa fue difundida en numerosas redes como Twitter, Slack y Telegram de grupos que trabajan con R. Para esta encuesta se invitó a participar a quienes hayan nacido y/o sean residentes en Latinoamérica. Este pequeño proyecto creció gracias al gran trabajo y colaboración de muchas personas que sumaron preguntas, ayudaron a corregir errores y generaron las distintas traducciones para que esté disponible en español, portugués e inglés y tenga en cuenta la diversidad de realidades en la región. Pero además pasó a ser un proyecto de R-Forwards, el grupo de trabajo de la R Foundation que busca mejorar la inclusión y diversidad en el mundo de R. --- class: chapter-slide # ¿Quiénes respondieron la encuesta? --- ## Demografía Más de 900 personas respondieron De 26 países (personas nacidas y residentes en Latinoamérica) + 3% de las personas ahora residen en Norteamérica, Europa y Oceanía .center.middle[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-3-1.svg" title="Mapa del mundo mostrando con gradiente de color el número de personas que respondió según el país nacimiento, desde cero hasta 180. La mayor parte de los encuestados nacieron en Latinoamérica, siendo Argentina, Brasil, Colombia y México los países con mayor número de respuestas. También se muestran resaltados Estados Unidos y algunos países de Europa y Asia donde nacieron algunas de las personas encuestadas que residen actualmente en Latinoamérica." alt="Mapa del mundo mostrando con gradiente de color el número de personas que respondió según el país nacimiento, desde cero hasta 180. La mayor parte de los encuestados nacieron en Latinoamérica, siendo Argentina, Brasil, Colombia y México los países con mayor número de respuestas. También se muestran resaltados Estados Unidos y algunos países de Europa y Asia donde nacieron algunas de las personas encuestadas que residen actualmente en Latinoamérica." style="display: block; margin: auto;" /> ] ??? Las mismas nacieron en 26 países distintos, la mayoría de ellos Latinoamericanos. Una pequeña proporción de quienes respondieron la encuesta, nacieron en países fuera de Latinoamérica pero residen actualmente en esta región. De los Latinoamericanos que contestaron, aproximadamente un 3% reside actualmente fuera de Latinoamérica en distintos países de Norteamérica, Europa y Oceanía. --- ## Edad, género y grado académico .pull-left[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-4-1.svg" title="Gráfica de barras vertical que muestra la edad de los encuestados en el eje ‘x’ y la frecuencia de respuestas en el eje ‘y’. Las barras tienen distintos colores según el género de las personas (masculino, femenino, otro género). Las barras en el eje x abarcan desde los 19 a los 69 años de edad, con las máximas frecuencias cercanas a los 30 años. El número de respuestas es similar para el género masculino y femenino, representando entre ambos casi la totalidad de las respuestas." alt="Gráfica de barras vertical que muestra la edad de los encuestados en el eje ‘x’ y la frecuencia de respuestas en el eje ‘y’. Las barras tienen distintos colores según el género de las personas (masculino, femenino, otro género). Las barras en el eje x abarcan desde los 19 a los 69 años de edad, con las máximas frecuencias cercanas a los 30 años. El número de respuestas es similar para el género masculino y femenino, representando entre ambos casi la totalidad de las respuestas." width="100%" style="display: block; margin: auto;" /> ] .pull-right[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-5-1.svg" title="Gráfica circular que muestra el nivel académico máximo de las personas que respondieron la encuesta. El 35% tiene una maestría, el 33% cuenta con título universitario, el 19% cuenta con doctorado, mientras que el resto de la población cuenta con nivel secundario, terciario o título técnico." alt="Gráfica circular que muestra el nivel académico máximo de las personas que respondieron la encuesta. El 35% tiene una maestría, el 33% cuenta con título universitario, el 19% cuenta con doctorado, mientras que el resto de la población cuenta con nivel secundario, terciario o título técnico." width="85%" style="display: block; margin: auto 0 auto auto;" /> ] ??? La encuesta fue respondida por personas entre 19 y 69 años, en su mayoría menores de 40 años. De las personas que se percibieron con algún género, el porcentaje entre el género femenino y masculino fue muy equitativo, y hubo además un 2% de personas que se identificaron con género diverso, que no se identificaron con ningún género o prefirieron no contestar. A su vez, la mayoría de las personas encuestadas posee algún grado educativo superior. El 87% posee un título de Maestría, Universitario y/o de Doctorado el cual es superior al promedio de personas en la región. Sólo un 13% señaló poseer algún título terciario, técnico o haber completado el secundario. No hubo respuestas de personas con un grado menor al secundario. --- ## ¿Cómo usan R? .pull-left[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-6-1.svg" title="Gráfica de barras horizontal que muestra el sector en el que se desempeñan los usuarios que respondieron la encuesta en el eje ‘y’, el porcentaje sobre el total de respuestas en el eje ‘x’ y las principales actividades en las que usan R en distintos colores. Casi el 60% de los que respondieron la encuesta se dedican a la Investigación o Desarrollo, alrededor del 20% trabajan en el sector educativo, el 12% trabaja en la industria o sector privado, el 10% trabaja en dependencias de gobierno y 2% trabaja en otras áreas. En todos los sectores se observa que entre el 85 y 90% del uso que le dan a R corresponde a análisis y visualización de datos, seguido por su uso para presentación de documentos, desarrollo de páginas web y desarrollo de paquetes." alt="Gráfica de barras horizontal que muestra el sector en el que se desempeñan los usuarios que respondieron la encuesta en el eje ‘y’, el porcentaje sobre el total de respuestas en el eje ‘x’ y las principales actividades en las que usan R en distintos colores. Casi el 60% de los que respondieron la encuesta se dedican a la Investigación o Desarrollo, alrededor del 20% trabajan en el sector educativo, el 12% trabaja en la industria o sector privado, el 10% trabaja en dependencias de gobierno y 2% trabaja en otras áreas. En todos los sectores se observa que entre el 85 y 90% del uso que le dan a R corresponde a análisis y visualización de datos, seguido por su uso para presentación de documentos, desarrollo de páginas web y desarrollo de paquetes." width="100%" /> ] .pull-right[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-7-1.svg" title="Gráfica de barras vertical que muestra en el eje ‘x’ los años de experiencia usando R y en el eje ‘y’ el porcentaje sobre el total de respuestas. El 23% tiene menos de 2 años de experiencia, el 36% entre 2 y 5 años de experiencia. El 27% tiene entre 5 y 10 años de experiencia, el 13% tiene más de 10 años de experiencia y el 1% no respondió." alt="Gráfica de barras vertical que muestra en el eje ‘x’ los años de experiencia usando R y en el eje ‘y’ el porcentaje sobre el total de respuestas. El 23% tiene menos de 2 años de experiencia, el 36% entre 2 y 5 años de experiencia. El 27% tiene entre 5 y 10 años de experiencia, el 13% tiene más de 10 años de experiencia y el 1% no respondió." width="100%" /> ] ??? La mayoría de los encuestados utilizan R principalmente en el ámbito de la investigación y desarrollo, representando casi el 60% de los encuestados, seguidos por su uso para el ámbito educativo. Las demás personas declararon utilizar R para el sector privado de la Industria, para el sector público como entidades gubernamentales y en otros ámbitos que incluyen actividades de variadas disciplinas como el diseño, finanzas y periodismo entre otros. A su vez, analizamos qué aplicación le dan a R las personas encuestadas, encontrando que en todos los ámbitos el análisis de datos era la actividad realizada en mayor proporción, seguida por la visualización de datos. En esta misma línea de preguntas les pedimos a las personas que respondieran hace cuántos años utilizan R. El 40% de las personas declaró usar R hace 5 años o más, lo cual se encuentra en concordancia con el gran porcentaje de personas con altos grados de estudios académicos. Sin embargo, más de la mitad de las personas encuestadas usan R relativamente hace poco, y la quinta parte lo utiliza hace 2 años o menos. --- class: chapter-slide # ¿A qué retos se enfrentan las personas que usan R? ??? Ya conocimos un poco sobre las personas encuestadas y su uso de R, ahora bien, ¿el vivir o haber nacido en Latinoamérica conlleva retos y desafíos? --- ## Lo que sabemos de inglés <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-8-1.svg" title="Gráfica de barras verticales que muestra en el eje ‘x’ el idioma nativo de las personas que respondieron la encuesta y en el eje ‘y’ el porcentaje de respuestas. Cada barra de idioma nativo se encuentra subdividida en colores según el nivel de conocimiento de inglés. El 85% de los encuestados hablan español como primer idioma, casi el 13% habla portugués, un 1% habla otros idiomas como Quechua y Nederlandés y menos del 1% habla inglés como lengua nativa De las personas que hablan español o portugués, alrededor del 80% tiene un nivel de inglés intermedio a avanzado, alrededor del 10% es bilingüe, 9% tiene un nivel básico y menos del 1% no tiene conocimiento de inglés. Mientras que las personas cuyo primer idioma es el inglés tienen un nivel intermedio, avanzado o bilingüe." alt="Gráfica de barras verticales que muestra en el eje ‘x’ el idioma nativo de las personas que respondieron la encuesta y en el eje ‘y’ el porcentaje de respuestas. Cada barra de idioma nativo se encuentra subdividida en colores según el nivel de conocimiento de inglés. El 85% de los encuestados hablan español como primer idioma, casi el 13% habla portugués, un 1% habla otros idiomas como Quechua y Nederlandés y menos del 1% habla inglés como lengua nativa De las personas que hablan español o portugués, alrededor del 80% tiene un nivel de inglés intermedio a avanzado, alrededor del 10% es bilingüe, 9% tiene un nivel básico y menos del 1% no tiene conocimiento de inglés. Mientras que las personas cuyo primer idioma es el inglés tienen un nivel intermedio, avanzado o bilingüe." style="display: block; margin: auto;" /> ??? Debido a que el entorno de R está construido y es utilizado en idioma inglés, nos preguntamos si el idioma sería una de las principales barreras para su uso en Latinoamérica, donde el español y el portugués son los idiomas más utilizados en la región. De hecho el español fue el idioma nativo de aproximadamente el 85% de las personas que completaron la encuesta, seguido por el portugés utilizado por el 13% y en último lugar el inglés. Un 1% de las personas encuestadas hablan Quechua, Nederlandés y otros idiomas oficiales en Latino América. Sin embargo, las personas que hablan español y portugués declararon poseer un alto nivel de inglés en su mayoría, siendo pocos los que se consideran “principiantes” y menos del 1% los que no tienen conocimientos de inglés. Más aún, cuando se les consultó si el inglés había sido una barrera para aprender y resolver errores, menos de un 25% indicó que ese había sido el caso. Debido a la estructura de nuestra encuesta y al grupo de personas que finalmente respondió, no podemos identificar si los encuestados usan R debido a que saben inglés, si los mismos aprendieron el idioma para poder utilizar R o si simplemente las personas encuestadas resultaron tener un alto nivel de inglés debido a su preparación académica. --- ## Participación en conferencias <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-9-1.svg" title="Gráfica de barras horizontal que muestra en el eje ‘y’ algunas barreras que los encuestados enfrentan para asistir a conferencias de R y en el eje ‘x’ el número de personas que respondieron de forma afirmativa a cada tipo de barrera; cada barra se encuentra coloreada con el porcentaje de personas que pudieron asistir o no a dicho evento. Alrededor del 30% de los encuestados encuentra que el costo para asistir a las conferencias es elevado, considerando la cuota de registro y los costos de viaje. Alrededor del 7% considera que el evento demanda demasiado tiempo, el 5% respondió que no se siente cómodo al asistir a los eventos, mientras que menos del 3% encuentra otras dificultades como no sentirse representado en las ponencias o la falta de recursos técnicos para poder seguir el evento. Menos de la mitad de las personas que se enfrentaron a alguna dificultad lograron asistir al evento." alt="Gráfica de barras horizontal que muestra en el eje ‘y’ algunas barreras que los encuestados enfrentan para asistir a conferencias de R y en el eje ‘x’ el número de personas que respondieron de forma afirmativa a cada tipo de barrera; cada barra se encuentra coloreada con el porcentaje de personas que pudieron asistir o no a dicho evento. Alrededor del 30% de los encuestados encuentra que el costo para asistir a las conferencias es elevado, considerando la cuota de registro y los costos de viaje. Alrededor del 7% considera que el evento demanda demasiado tiempo, el 5% respondió que no se siente cómodo al asistir a los eventos, mientras que menos del 3% encuentra otras dificultades como no sentirse representado en las ponencias o la falta de recursos técnicos para poder seguir el evento. Menos de la mitad de las personas que se enfrentaron a alguna dificultad lograron asistir al evento." /> ??? Otro de los posibles desafíos que nos preguntamos si tendrían las personas de Latinoamérica que usan R se relaciona con la participación en conferencias, ya que la mayoría de los eventos internacionales se realizan en Estados Unidos y Europa. En la encuesta preguntamos si conocían o si habían participado de alguno de los 10 eventos internacionales relacionados con R. La mayoría de las personas declaró no conocer los eventos mencionados, menos aún asistir a los mismos en los últimos 5 años. Incluso el congreso de LatinR, el cual esperábamos la mayoría de las personas Latinoamericanas conociera, no fue la excepción. Esta fue la conferencia más popular entre todas las opciones pero sólo es conocida por el 14% de las personas encuestadas. Al preguntar directamente sobre posibles barreras encontradas para participar en un evento, más del 30% de las personas encuestadas indicó que el evento les resultó caro, y de hecho sólo la mitad de esas personas señalaron haber asistido a alguna conferencia. Entre las principales barreras señaladas también se encontraron la alta demanda de tiempo para participar, la falta de comodidad ya sea por el idioma o por una falta de representatividad en el evento y la falta de recursos tanto tecnológicos como personales, entre otros. --- class: chapter-slide # R y las comunidades ??? Quisimos explorar el rol de las comunidades en Latinoamérica. --- ## ¿A qué comunidades pertenecen? El 40% de las personas que respondieron la encuesta, forman parte de alguna comunidad de R. <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-10-1.svg" title="Gráfica de barras horizontal que muestra en el eje ‘y’ el nombre de diversas comunidades de R y en el eje ‘x’ el porcentaje de pertenencia a cada comunidad, tomando como total el número de personas que afirmaron pertenecer a alguna comunidad de R. De las 349 personas que pertenecen a alguna comunidad, más del 40% pertenece a un capítulo local de R-Ladies, casi el 20% pertenece a LatinR, cerca del 15% pertenece al Grupo de usuarios RUG, alrededor del 3% pertenece a ConectaR, el 2% a MiR, el 1% a RainbowR y cerca del 4% pertenece a otras comunidades no mencionadas dentro de las opciones de la encuesta." alt="Gráfica de barras horizontal que muestra en el eje ‘y’ el nombre de diversas comunidades de R y en el eje ‘x’ el porcentaje de pertenencia a cada comunidad, tomando como total el número de personas que afirmaron pertenecer a alguna comunidad de R. De las 349 personas que pertenecen a alguna comunidad, más del 40% pertenece a un capítulo local de R-Ladies, casi el 20% pertenece a LatinR, cerca del 15% pertenece al Grupo de usuarios RUG, alrededor del 3% pertenece a ConectaR, el 2% a MiR, el 1% a RainbowR y cerca del 4% pertenece a otras comunidades no mencionadas dentro de las opciones de la encuesta." style="display: block; margin: auto;" /> ??? Aproximadamente el 40% de los encuestados pertenecen al menos a una comunidad. De ellos, al menos una cuarta parte pertenecen a dos o más comunidades, con algunos incluso formando parte de hasta 5 comunidades. Los capítulos de R-Ladies fueron el grupo mejor representado en nuestra encuesta, ya que alrededor del 43% de las personas que forman parte de alguna comunidad, son miembros de un capítulo. Esta proporción de miembros entre los encuestados es casi la misma que los miembros combinados de LatinR, los R Users Group, y RSpatial_ES. Pero los usuarios latinoamericanos no sólo son miembros de grupos locales, sino que alrededor del 11% de las personas que pertenecen a alguna comunidad, también son parte de grupos internacionales de R. Es importante resaltar que estos resultados son conservadores, ya que algunas personas respondieron que no se consideraban miembros de ninguna comunidad, a pesar de participar en eventos de estas comunidades, simplemente porque no tenían una participación activa en la organización de los mismos. --- ## Comunidades y género .pull-left[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-11-1.svg" title="Gráfica de barras que muestra la proporción de personas que respondieron la encuesta y pertenecen a alguna comunidad de R separadas por el género con el que se identifican. En el eje de las ‘x’ se muestran el género femenino, masculino, y otros géneros diversos agrupados en la clasificación ‘Se autoidentifica’; en el eje ‘y’ se muestra el porcentaje relativo de personas que se identifican dentro de cada género. El 60% de las personas que pertenecen a alguna comunidad de R se identifican con el género femenino, casi el 40% se identifica con el género masculino y alrededor del 2% pertenece a otros géneros." alt="Gráfica de barras que muestra la proporción de personas que respondieron la encuesta y pertenecen a alguna comunidad de R separadas por el género con el que se identifican. En el eje de las ‘x’ se muestran el género femenino, masculino, y otros géneros diversos agrupados en la clasificación ‘Se autoidentifica’; en el eje ‘y’ se muestra el porcentaje relativo de personas que se identifican dentro de cada género. El 60% de las personas que pertenecen a alguna comunidad de R se identifican con el género femenino, casi el 40% se identifica con el género masculino y alrededor del 2% pertenece a otros géneros." width="95%" /> ] .pull-right[ <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-12-1.svg" title="Gráfica de barras que muestra la proporción de personas que respondieron la encuesta separadas por el género con el que se identifican. En el eje de las ‘x’ se muestran el género femenino, masculino, y otros géneros diversos agrupados en la clasificación ‘Se autoidentifica’; en el eje ‘y’ se muestra el porcentaje relativo de personas que se identifican dentro de cada género. Alrededor del 46% de las personas que respondieron la encuesta se identifican con el género femenino, casi el 52% se identifica con el género masculino y alrededor del 3% pertenece a otros géneros." alt="Gráfica de barras que muestra la proporción de personas que respondieron la encuesta separadas por el género con el que se identifican. En el eje de las ‘x’ se muestran el género femenino, masculino, y otros géneros diversos agrupados en la clasificación ‘Se autoidentifica’; en el eje ‘y’ se muestra el porcentaje relativo de personas que se identifican dentro de cada género. Alrededor del 46% de las personas que respondieron la encuesta se identifican con el género femenino, casi el 52% se identifica con el género masculino y alrededor del 3% pertenece a otros géneros." width="95%" /> ] ??? Al enfocarnos en la composición de las comunidades por género, encontramos que las mujeres representaron poco más del 60% de las personas que respondieron ser pertenecientes a comunidades. Esto nos llamó la atención porque representa una proporción mayor al total de mujeres que respondieron la encuesta la cual estaba casi a la par que los hombres, aproximadamente un 48%. Sin embargo, no está claro si esta diferencia se debe a que un importante número de R-Ladies respondieron a la encuesta, ya que muchos capítulos difundieron activamente la iniciativa, o si esto es representativo de la comunidad de usuarias y usuarios de R. Adicionalmente, alrededor del 10% de personas se identificaron como parte de la comunidad LGBTQI+, lo cual es similar a los resultados globales de la encuesta. Estos resultados son alentadores ya que nos sugiere que las comunidades de R están ofreciendo espacios en los que mujeres y otros grupos subrepresentados se sienten seguros para aprender y compartir sus conocimientos con otros miembros de la comunidad. --- ## Redes más usadas <img src="data:image/png;base64,#presentacion_files/figure-html/unnamed-chunk-13-1.svg" title="Gráfica circular que muestra las redes sociales mediante las cuales los usuarios se mantienen al tanto de la comunidad de R. Más del 35% utiliza Twitter, el 15% usa facebook, el 12% usa meetup, el 11% usa slack, el 10% usa instagram, el 8% usa telegram, el 2% usa otras redes y el 4% no usa ninguna red social." alt="Gráfica circular que muestra las redes sociales mediante las cuales los usuarios se mantienen al tanto de la comunidad de R. Más del 35% utiliza Twitter, el 15% usa facebook, el 12% usa meetup, el 11% usa slack, el 10% usa instagram, el 8% usa telegram, el 2% usa otras redes y el 4% no usa ninguna red social." style="display: block; margin: auto;" /> Otros: LinkedIn, R bloggers, Reddit, Stackoverflow, Comunidad RStudio, YouTube, WhatsApp, otras redes locales. ??? Adicionalmente, nos interesaba saber cuál es la red social más utilizada entre las personas que usan R. El 91% de las personas encuestadas respondieron que usan alguna red social para comunicarse con la comunidad de R o mantenerse al tanto de las novedades. La mayoría de las personas, un 70% usan Twitter, siendo la red más popular seguida por Facebook, Meetup y Slack, entre otras. --- class: chapter-slide # Algunas conclusiones ??? Hasta aquí hemos presentado algunos de los resultados de esta primera encuesta Latinoamericana sobre el uso de R, describiendo a las personas que lo utilizan, identificando algunas de las barreras encontradas y reconociendo su participación en las comunidades y en las redes. ¡Estamos muy contentas de que la iniciativa se pudo llevar a cabo y que tuvimos un gran número de respuestas! No queremos dejar de agradecer tanto a las personas que participaron en su construcción como a las que la completaron. ¿Pero qué es lo que queremos destacar? --- ## Lo que aprendimos al hacer la encuesta <br> * La elección de preguntas es compleja + Representar la diversidad de la región. + Reducir el número de preguntas. + Preguntas que direccionen mejor las respuestas. * La limpieza de datos lleva mucho tiempo! + El manejo de datos categóricos representa un reto. * Plantear posibles análisis con anticipación. ??? En primer lugar queríamos compartir qué fue lo que aprendimos al hacer la encuesta. En el proceso de realizarla nos dimos cuenta de algunos aspectos que no consideramos al comienzo de la iniciativa. La selección de preguntas fue muy compleja y es posible que la versión final con 33 preguntas haya sido muy extensa. En el camino aprendimos mucho sobre cómo hacer las preguntas teniendo en cuenta la diversidad de cada país pero estamos seguras que algunas preguntas podrían mejorarse para obtener respuestas mejor direccionadas. La organización y manipulación de datos de una encuesta de esta magnitud lleva mucho tiempo. Esto suele ocurrir con la mayoría de los conjuntos de datos, pero muchas de nosotras nos encontramos por primera vez con el análisis de una gran cantidad de datos categóricos entre otros factores que hicieron de su análisis un procedimiento tardado. También encontramos puntos a mejorar en el diseño de la encuesta que nos podría facilitar la generación de correlaciones y nuevos análisis entre algunas respuestas. Recomendamos dedicar aún más tiempo a plantear los análisis que se desean realizar previo a la confección de la misma. --- ## Lo que aprendimos sobre la comunidad * Importante rol de las comunidades y las redes! + Utilizar las redes es ser parte de una comunidad + Participar en meetups y webinarios es ser parte de una comunidad + Alta participación de mujeres: ¿es realmente una ventaja? * Existen algunos desafíos que debemos atravesar + El inglés es uno de ellos (?) + Recursos e infraestructura - Ayuda para conferencias en #clinicadecharlas del Slack de LatinR - Sistema de revisión de R-Ladies ####¡Aún falta llegar a más personas para detectar posibles barreras y desafíos! ??? ¿Y qué aprendimos sobre las personas encuestadas? Nos impactó (aunque no nos sorprendió) el importante rol de las comunidades y las redes. Más de la mitad de las personas encuestadas indicó pertenecer al menos una comunidad y que esa comunidad les ayudó a resolver problemas! Las redes también juegan un rol clave, incluso actuando como comunidades en sí. En dicho contexto también notamos que muchas personas son parte de algunas de las comunidades mencionadas sin saberlo! Ya que participar en meetups, webinarios y otras actividades también implica ser parte de una comunidad, por lo seguro podemos hacer mayor énfasis en eso Las mujeres representan a la mayoría de las personas que forman parte de comunidades al menos de acuerdo al grupo de personas que respondió la encuesta. A pesar que es positivo que las mujeres estén bien representadas en ellas y que posiblemente estén creando espacios seguros para otras mujeres y minorías como lo hacen los capítulos de R-Ladies, debemos considerar que este trabajo voluntario recae sobre las minorías. Encontramos estudios que muestran que cuando existen proyectos para mejorar la diversidad, el trabajo no remunerado y no reconocido suele recaer en personas que son parte de grupos minoritarios, y este trabajo adicional los puede poner en desventaja porque esto significa que no pueden dedicar el mismo tiempo al desarrollo de sus carreras que personas de grupos mayoritarios. En cuanto a los desafíos que enfrentan las personas encuestadas corroboramos que existen desafíos en términos de recursos e infraestructura que condicionan el uso de R y la participación en conferencias. Es importante emprender y continuar acciones para promover la participación de la comunidad de Latinoamérica en eventos internacionales, por ejemplo permitiendo presentar charlas en otros idiomas que no sea el inglés, como en useR! 2021. Enviar un trabajo o resumen a las conferencias de R puede ser un importante desafío para muchas personas. Por eso sugerimos implementar y promover iniciativas como #clinicadecharlas dentro del slack de LatinR donde las personas pueden compartir ideas sobre sus propuestas o también el sistema de revisión de R-Ladies. Consideramos que aún nos falta información para responder algunas de las preguntas iniciales. A futuro, deseamos poder identificar y encuestar personas que conozcan la existencia de R pero por diversas razones no lo utilizan, para identificar los aspectos a mejorar desde la comunidad de R para mejorar la experiencia de quienes quieren aprender a usar el lenguaje. --- ## Lo que aún nos falta profundizar <br> * ¿Cómo facilitamos la integración de la población faltante? * ¿Qué podemos mejorar para que las minorías se sientan mejor representadas en los eventos y comunidades de R? * ¿Se debería promover la enseñanza de R desde los grados académicos básicos o intermedios? ??? En este mismo contexto, consideramos que aún es necesario profundizar ciertos temas claves. ¿cómo facilitamos la integración de la población faltante al uso de R y sus Comunidades? Para ello debemos primero determinar cuáles son las razones por las que las personas no lo han hecho hasta el momento. Pero creemos que presentar los beneficios de utilizar R y de pertenecer a estas comunidades, resolver problemas, acceder a capacitaciones gratuitas, e incluso oportunidades laborales, pueda ser una buena estrategia para expandir la inclusión. Siguiendo con el objetivo de mejorar la inclusión también nos interesaría profundizar sobre ¿Qué podemos mejorar para que las minorías se sientan mejor representadas en los eventos y las comunidades de R? Queda el desafío de ampliar la participación dentro y fuera de las comunidades de R hacia una composición más heterogénea e inclusiva en la región, que incluya una mayor participación de personas con discapacidades, personas del colectivo LGBTIQ+, personas afrodescendientes, afrolatinoamericanas, del Caribe y de descendencia indigena que tengan interés en R en particular o en la ciencia de datos en general. Un último tema a profundizar se relaciona con el nivel educativo. El 88% de las personas encuestadas tienen un alto grado de educación, promedio que equivale aproximadamente al doble de lo observado en Latinoamérica. Esto nos hizo preguntarnos si se debería promover la enseñanza de R desde los grados académicos básicos o intermedios dado que los resultados sugieren que existen inequidades en las personas que tienen acceso a aprender programación en R (y potencialmente en otros lenguajes). La misma probablemente esté relacionada con la brecha tecnológica en Latinoamérica, en donde en promedio menos del 50% de la población tiene acceso a internet. Puede que incluir a la programación en el currículo de educación básica u ofrecer oportunidades de capacitación presencial ayuden a cerrar esa brecha. --- class: chapter-slide # ¡Muchas gracias! <br> Obrigado! <br> Thank you! <img src="data:image/png;base64,#fig/marmot_user.png" title="La maRmota de useR saludando con la mano" alt="La maRmota de useR saludando con la mano" width="50%" style="display: block; margin: auto 0 auto auto;" /> ??? Aún queda mucho por investigar pero hasta aquí llegamos con nuestra presentación para UseR 2021. Muchas gracias por su atención y estamos a su disposición por cualquier pregunta.