¡Hola!
Mi nombre es Andrea y junto con Paola, Denisse, Virginia, Claudia y Joselyn, vamos a presentar el trabajo realizado sobre el Uso de R en Latinoamérica: fortalezas, desafíos y debilidades.
¿De que se trató esta iniciativa?
Sabemos que el entorno de R es utilizado globalmente para diversos fines. Sin embargo, ¿qué tan ampliamente es utilizado en países periféricos como los Latinoamericanos donde el inglés no es el idioma oficial y donde la infraestructura y el acceso a diversos recursos no están garantizados entre otros?
En agosto de 2020 un grupo de personas pertenecientes a comunidades de usuarios y usuarias de R en Latinoamérica, nos propusimos generar una encuesta para conocer a las personas que usan R en Latinoamérica, intentando resaltar cuáles son nuestras posibles fortalezas y a qué desafíos nos enfrentamos.
El entorno de R es globalmente utilizado.
¿Cómo es su uso en Latinoamérica donde
Objetivo: conocer a la comunidad de usuarios y usuarias de R en Latinoamérica.
¡Hola!
Mi nombre es Andrea y junto con Paola, Denisse, Virginia, Claudia y Joselyn, vamos a presentar el trabajo realizado sobre el Uso de R en Latinoamérica: fortalezas, desafíos y debilidades.
¿De que se trató esta iniciativa?
Sabemos que el entorno de R es utilizado globalmente para diversos fines. Sin embargo, ¿qué tan ampliamente es utilizado en países periféricos como los Latinoamericanos donde el inglés no es el idioma oficial y donde la infraestructura y el acceso a diversos recursos no están garantizados entre otros?
En agosto de 2020 un grupo de personas pertenecientes a comunidades de usuarios y usuarias de R en Latinoamérica, nos propusimos generar una encuesta para conocer a las personas que usan R en Latinoamérica, intentando resaltar cuáles son nuestras posibles fortalezas y a qué desafíos nos enfrentamos.
Con base en los objetivos propuestos, diseñamos una encuesta de 31 preguntas las cuales abordaban 5 ejes principales: su interés en R, información demográfica, su nivel académico, su relación con la comunidad de R y el área en que usan R.
Con la finalidad de fomentar la inclusividad, la encuesta fue confeccionada en tres idiomas español, portugués e inglés para que las personas contestaran en el idioma con el que se sintieran más cómodas.
La iniciativa fue difundida en numerosas redes como Twitter, Slack y Telegram de grupos que trabajan con R. Para esta encuesta se invitó a participar a quienes hayan nacido y/o sean residentes en Latinoamérica.
Este pequeño proyecto creció gracias al gran trabajo y colaboración de muchas personas que sumaron preguntas, ayudaron a corregir errores y generaron las distintas traducciones para que esté disponible en español, portugués e inglés y tenga en cuenta la diversidad de realidades en la región. Pero además pasó a ser un proyecto de R-Forwards, el grupo de trabajo de la R Foundation que busca mejorar la inclusión y diversidad en el mundo de R.
Más de 900 personas respondieron
De 26 países (personas nacidas y residentes en Latinoamérica)
Las mismas nacieron en 26 países distintos, la mayoría de ellos Latinoamericanos. Una pequeña proporción de quienes respondieron la encuesta, nacieron en países fuera de Latinoamérica pero residen actualmente en esta región.
De los Latinoamericanos que contestaron, aproximadamente un 3% reside actualmente fuera de Latinoamérica en distintos países de Norteamérica, Europa y Oceanía.
La encuesta fue respondida por personas entre 19 y 69 años, en su mayoría menores de 40 años. De las personas que se percibieron con algún género, el porcentaje entre el género femenino y masculino fue muy equitativo, y hubo además un 2% de personas que se identificaron con género diverso, que no se identificaron con ningún género o prefirieron no contestar.
A su vez, la mayoría de las personas encuestadas posee algún grado educativo superior. El 87% posee un título de Maestría, Universitario y/o de Doctorado el cual es superior al promedio de personas en la región. Sólo un 13% señaló poseer algún título terciario, técnico o haber completado el secundario. No hubo respuestas de personas con un grado menor al secundario.
La mayoría de los encuestados utilizan R principalmente en el ámbito de la investigación y desarrollo, representando casi el 60% de los encuestados, seguidos por su uso para el ámbito educativo. Las demás personas declararon utilizar R para el sector privado de la Industria, para el sector público como entidades gubernamentales y en otros ámbitos que incluyen actividades de variadas disciplinas como el diseño, finanzas y periodismo entre otros.
A su vez, analizamos qué aplicación le dan a R las personas encuestadas, encontrando que en todos los ámbitos el análisis de datos era la actividad realizada en mayor proporción, seguida por la visualización de datos.
En esta misma línea de preguntas les pedimos a las personas que respondieran hace cuántos años utilizan R. El 40% de las personas declaró usar R hace 5 años o más, lo cual se encuentra en concordancia con el gran porcentaje de personas con altos grados de estudios académicos. Sin embargo, más de la mitad de las personas encuestadas usan R relativamente hace poco, y la quinta parte lo utiliza hace 2 años o menos.
Ya conocimos un poco sobre las personas encuestadas y su uso de R, ahora bien, ¿el vivir o haber nacido en Latinoamérica conlleva retos y desafíos?
Debido a que el entorno de R está construido y es utilizado en idioma inglés, nos preguntamos si el idioma sería una de las principales barreras para su uso en Latinoamérica, donde el español y el portugués son los idiomas más utilizados en la región.
De hecho el español fue el idioma nativo de aproximadamente el 85% de las personas que completaron la encuesta, seguido por el portugés utilizado por el 13% y en último lugar el inglés.
Un 1% de las personas encuestadas hablan Quechua, Nederlandés y otros idiomas oficiales en Latino América. Sin embargo, las personas que hablan español y portugués declararon poseer un alto nivel de inglés en su mayoría, siendo pocos los que se consideran “principiantes” y menos del 1% los que no tienen conocimientos de inglés. Más aún, cuando se les consultó si el inglés había sido una barrera para aprender y resolver errores, menos de un 25% indicó que ese había sido el caso.
Debido a la estructura de nuestra encuesta y al grupo de personas que finalmente respondió, no podemos identificar si los encuestados usan R debido a que saben inglés, si los mismos aprendieron el idioma para poder utilizar R o si simplemente las personas encuestadas resultaron tener un alto nivel de inglés debido a su preparación académica.
Otro de los posibles desafíos que nos preguntamos si tendrían las personas de Latinoamérica que usan R se relaciona con la participación en conferencias, ya que la mayoría de los eventos internacionales se realizan en Estados Unidos y Europa.
En la encuesta preguntamos si conocían o si habían participado de alguno de los 10 eventos internacionales relacionados con R. La mayoría de las personas declaró no conocer los eventos mencionados, menos aún asistir a los mismos en los últimos 5 años. Incluso el congreso de LatinR, el cual esperábamos la mayoría de las personas Latinoamericanas conociera, no fue la excepción. Esta fue la conferencia más popular entre todas las opciones pero sólo es conocida por el 14% de las personas encuestadas.
Al preguntar directamente sobre posibles barreras encontradas para participar en un evento, más del 30% de las personas encuestadas indicó que el evento les resultó caro, y de hecho sólo la mitad de esas personas señalaron haber asistido a alguna conferencia. Entre las principales barreras señaladas también se encontraron la alta demanda de tiempo para participar, la falta de comodidad ya sea por el idioma o por una falta de representatividad en el evento y la falta de recursos tanto tecnológicos como personales, entre otros.
Quisimos explorar el rol de las comunidades en Latinoamérica.
El 40% de las personas que respondieron la encuesta, forman parte de alguna comunidad de R.
Aproximadamente el 40% de los encuestados pertenecen al menos a una comunidad. De ellos, al menos una cuarta parte pertenecen a dos o más comunidades, con algunos incluso formando parte de hasta 5 comunidades.
Los capítulos de R-Ladies fueron el grupo mejor representado en nuestra encuesta, ya que alrededor del 43% de las personas que forman parte de alguna comunidad, son miembros de un capítulo. Esta proporción de miembros entre los encuestados es casi la misma que los miembros combinados de LatinR, los R Users Group, y RSpatial_ES.
Pero los usuarios latinoamericanos no sólo son miembros de grupos locales, sino que alrededor del 11% de las personas que pertenecen a alguna comunidad, también son parte de grupos internacionales de R.
Es importante resaltar que estos resultados son conservadores, ya que algunas personas respondieron que no se consideraban miembros de ninguna comunidad, a pesar de participar en eventos de estas comunidades, simplemente porque no tenían una participación activa en la organización de los mismos.
Al enfocarnos en la composición de las comunidades por género, encontramos que las mujeres representaron poco más del 60% de las personas que respondieron ser pertenecientes a comunidades. Esto nos llamó la atención porque representa una proporción mayor al total de mujeres que respondieron la encuesta la cual estaba casi a la par que los hombres, aproximadamente un 48%. Sin embargo, no está claro si esta diferencia se debe a que un importante número de R-Ladies respondieron a la encuesta, ya que muchos capítulos difundieron activamente la iniciativa, o si esto es representativo de la comunidad de usuarias y usuarios de R.
Adicionalmente, alrededor del 10% de personas se identificaron como parte de la comunidad LGBTQI+, lo cual es similar a los resultados globales de la encuesta.
Estos resultados son alentadores ya que nos sugiere que las comunidades de R están ofreciendo espacios en los que mujeres y otros grupos subrepresentados se sienten seguros para aprender y compartir sus conocimientos con otros miembros de la comunidad.
Otros: LinkedIn, R bloggers, Reddit, Stackoverflow, Comunidad RStudio, YouTube, WhatsApp, otras redes locales.
Adicionalmente, nos interesaba saber cuál es la red social más utilizada entre las personas que usan R.
El 91% de las personas encuestadas respondieron que usan alguna red social para comunicarse con la comunidad de R o mantenerse al tanto de las novedades. La mayoría de las personas, un 70% usan Twitter, siendo la red más popular seguida por Facebook, Meetup y Slack, entre otras.
Hasta aquí hemos presentado algunos de los resultados de esta primera encuesta Latinoamericana sobre el uso de R, describiendo a las personas que lo utilizan, identificando algunas de las barreras encontradas y reconociendo su participación en las comunidades y en las redes.
¡Estamos muy contentas de que la iniciativa se pudo llevar a cabo y que tuvimos un gran número de respuestas! No queremos dejar de agradecer tanto a las personas que participaron en su construcción como a las que la completaron.
¿Pero qué es lo que queremos destacar?
La elección de preguntas es compleja
La limpieza de datos lleva mucho tiempo!
Plantear posibles análisis con anticipación.
En primer lugar queríamos compartir qué fue lo que aprendimos al hacer la encuesta.
En el proceso de realizarla nos dimos cuenta de algunos aspectos que no consideramos al comienzo de la iniciativa. La selección de preguntas fue muy compleja y es posible que la versión final con 33 preguntas haya sido muy extensa. En el camino aprendimos mucho sobre cómo hacer las preguntas teniendo en cuenta la diversidad de cada país pero estamos seguras que algunas preguntas podrían mejorarse para obtener respuestas mejor direccionadas.
La organización y manipulación de datos de una encuesta de esta magnitud lleva mucho tiempo. Esto suele ocurrir con la mayoría de los conjuntos de datos, pero muchas de nosotras nos encontramos por primera vez con el análisis de una gran cantidad de datos categóricos entre otros factores que hicieron de su análisis un procedimiento tardado.
También encontramos puntos a mejorar en el diseño de la encuesta que nos podría facilitar la generación de correlaciones y nuevos análisis entre algunas respuestas. Recomendamos dedicar aún más tiempo a plantear los análisis que se desean realizar previo a la confección de la misma.
Importante rol de las comunidades y las redes!
Existen algunos desafíos que debemos atravesar
¿Y qué aprendimos sobre las personas encuestadas?
Nos impactó (aunque no nos sorprendió) el importante rol de las comunidades y las redes. Más de la mitad de las personas encuestadas indicó pertenecer al menos una comunidad y que esa comunidad les ayudó a resolver problemas! Las redes también juegan un rol clave, incluso actuando como comunidades en sí. En dicho contexto también notamos que muchas personas son parte de algunas de las comunidades mencionadas sin saberlo! Ya que participar en meetups, webinarios y otras actividades también implica ser parte de una comunidad, por lo seguro podemos hacer mayor énfasis en eso
Las mujeres representan a la mayoría de las personas que forman parte de comunidades al menos de acuerdo al grupo de personas que respondió la encuesta. A pesar que es positivo que las mujeres estén bien representadas en ellas y que posiblemente estén creando espacios seguros para otras mujeres y minorías como lo hacen los capítulos de R-Ladies, debemos considerar que este trabajo voluntario recae sobre las minorías. Encontramos estudios que muestran que cuando existen proyectos para mejorar la diversidad, el trabajo no remunerado y no reconocido suele recaer en personas que son parte de grupos minoritarios, y este trabajo adicional los puede poner en desventaja porque esto significa que no pueden dedicar el mismo tiempo al desarrollo de sus carreras que personas de grupos mayoritarios.
En cuanto a los desafíos que enfrentan las personas encuestadas corroboramos que existen desafíos en términos de recursos e infraestructura que condicionan el uso de R y la participación en conferencias. Es importante emprender y continuar acciones para promover la participación de la comunidad de Latinoamérica en eventos internacionales, por ejemplo permitiendo presentar charlas en otros idiomas que no sea el inglés, como en useR! 2021. Enviar un trabajo o resumen a las conferencias de R puede ser un importante desafío para muchas personas. Por eso sugerimos implementar y promover iniciativas como #clinicadecharlas dentro del slack de LatinR donde las personas pueden compartir ideas sobre sus propuestas o también el sistema de revisión de R-Ladies.
Consideramos que aún nos falta información para responder algunas de las preguntas iniciales. A futuro, deseamos poder identificar y encuestar personas que conozcan la existencia de R pero por diversas razones no lo utilizan, para identificar los aspectos a mejorar desde la comunidad de R para mejorar la experiencia de quienes quieren aprender a usar el lenguaje.
¿Cómo facilitamos la integración de la población faltante?
¿Qué podemos mejorar para que las minorías se sientan mejor representadas en los eventos y comunidades de R?
¿Se debería promover la enseñanza de R desde los grados académicos básicos o intermedios?
En este mismo contexto, consideramos que aún es necesario profundizar ciertos temas claves.
¿cómo facilitamos la integración de la población faltante al uso de R y sus Comunidades? Para ello debemos primero determinar cuáles son las razones por las que las personas no lo han hecho hasta el momento. Pero creemos que presentar los beneficios de utilizar R y de pertenecer a estas comunidades, resolver problemas, acceder a capacitaciones gratuitas, e incluso oportunidades laborales, pueda ser una buena estrategia para expandir la inclusión.
Siguiendo con el objetivo de mejorar la inclusión también nos interesaría profundizar sobre ¿Qué podemos mejorar para que las minorías se sientan mejor representadas en los eventos y las comunidades de R? Queda el desafío de ampliar la participación dentro y fuera de las comunidades de R hacia una composición más heterogénea e inclusiva en la región, que incluya una mayor participación de personas con discapacidades, personas del colectivo LGBTIQ+, personas afrodescendientes, afrolatinoamericanas, del Caribe y de descendencia indigena que tengan interés en R en particular o en la ciencia de datos en general.
Un último tema a profundizar se relaciona con el nivel educativo. El 88% de las personas encuestadas tienen un alto grado de educación, promedio que equivale aproximadamente al doble de lo observado en Latinoamérica. Esto nos hizo preguntarnos si se debería promover la enseñanza de R desde los grados académicos básicos o intermedios dado que los resultados sugieren que existen inequidades en las personas que tienen acceso a aprender programación en R (y potencialmente en otros lenguajes). La misma probablemente esté relacionada con la brecha tecnológica en Latinoamérica, en donde en promedio menos del 50% de la población tiene acceso a internet. Puede que incluir a la programación en el currículo de educación básica u ofrecer oportunidades de capacitación presencial ayuden a cerrar esa brecha.
Aún queda mucho por investigar pero hasta aquí llegamos con nuestra presentación para UseR 2021. Muchas gracias por su atención y estamos a su disposición por cualquier pregunta.
El entorno de R es globalmente utilizado.
¿Cómo es su uso en Latinoamérica donde
Objetivo: conocer a la comunidad de usuarios y usuarias de R en Latinoamérica.
¡Hola!
Mi nombre es Andrea y junto con Paola, Denisse, Virginia, Claudia y Joselyn, vamos a presentar el trabajo realizado sobre el Uso de R en Latinoamérica: fortalezas, desafíos y debilidades.
¿De que se trató esta iniciativa?
Sabemos que el entorno de R es utilizado globalmente para diversos fines. Sin embargo, ¿qué tan ampliamente es utilizado en países periféricos como los Latinoamericanos donde el inglés no es el idioma oficial y donde la infraestructura y el acceso a diversos recursos no están garantizados entre otros?
En agosto de 2020 un grupo de personas pertenecientes a comunidades de usuarios y usuarias de R en Latinoamérica, nos propusimos generar una encuesta para conocer a las personas que usan R en Latinoamérica, intentando resaltar cuáles son nuestras posibles fortalezas y a qué desafíos nos enfrentamos.
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |