🔥 El 12 de julio de 2022 se publicaron las primeras imágenes del telescopio espacial James Webb, un hito científico muy esperado. La diferencia de calidad con el Hubble es impresionante, y toda la gente que trabaja en astronomía está muy revolucionada. En la comunidad Python tenemos motivos para sentirnos orgullosos: como recoge este artículo en el blog de GitHub, Astropy y otros paquetes del ecosistema científico se están utilizando activamente para la planificación de las observaciones y el tratamiendo de los datos. ¡Hurra!
📜 Y precisamente esa misma semana se celebraba la 21ª SciPy US en Austin, Texas, el evento de referencia sobre Python científico en los EEUU. Después de asistir a la 1ª SciPy LATAM en 2015 en Posadas, Misiones, Argentina y a la 12ª EuroSciPy en 2019 en Bilbao, España, tenía muchas ganas de ir a este evento, y no decepcionó.
La lista de proyectos que descubrí esta semana se haría demasiado larga, pero tengo buenas noticias: ¡la tienes entera en las actas (proceedings) de la conferencia!
Así que en esta ocasión voy a contar cuáles para mí han sido las claves del evento.
🧑🤝🧑 La comunidad científica alrededor de Python se ha diversificado. Algunas áreas del conocimiento tienen ya sus propios ecosistemas de paquetes, como por ejemplo:
Astronomía: el párrafo que encabeza el noticiero de hoy ya lo dice todo. Astropy empezó como un proyecto pequeño y hoy en día es un ecosistema muy amplio que incluye paquetes como SunPy, astroquery y specutils, además de proyectos afiliados como gammapy o el propio poliastro.
Geociencias: el proyecto Pangeo está jugando un papel fundamental en los avances por entender el cambio climático, y acaban de lanzar Pangeo Forge para automatizar aún más la catalogación de los datos. Hablando con Ryan Abernathey, uno de los creadores, nos dimos cuenta de que podíamos utilizar una filosofía similar para conjuntos de datos abiertos genéricos, no necesariamente sobre ciencia.
Genómica y otros campos de la biología molecular: si bien el lenguaje R ha sido y es la herramienta de referencia en este campo, Python está avanzando con decisión en gran parte gracias a la iniciativa scverse, que incluye proyectos como anndata y scanpy. Tuve la oportunidad de charlar con Isaac Virshup, uno de los desarrolladores del proyecto.
Física de partículas: no sabía que scikit-HEP era mucho más que un solo paquete, sino un ecosistema entero que incluye Awkward Array, Uproot y muchos otros. Además, Henry Schreiner III, uno de los miembros del proyecto, es muy activo en las discusiones sobre paquetería, y ha conseguido financiación para trabajar en scikit-build los próximos 3 años.
💰 La financiación funciona y la profesionalización es buena. El impacto de programas estatales como el ROSES de la NASA o de fundaciones filantrópicas como la Chan Zuckerberg Initiative (sí, ese Zuckerberg) ha sido notable. Muchos proyectos han podido renovar sus sitios web, mejorar notablemente su documentación, incrementar la diversidad de sus comunidades, y muchas otras cuestiones para las que hace falta la clase de trabajo continuado que solo una fuente de ingresos estable puede permitir. Tuve la oportunidad de charlar con Dario Taraborelli sobre cómo CZI permitió a Read the Docs contratarme y el efecto que eso tuvo en la documentación de Sphinx.
Al mismo tiempo, el trabajo de empresas como Quansight o QuantStack, que canalizan sus ingresos por consultoría directamente hacia el ecosistema open source, están teniendo una influencia notable en proyectos como Jupyter, NumPy, SciPy, y conda. Gracias a QuantStack tenemos mamba, el reemplazo ultrarrápido de conda, y otros proyectos como quetz y jupyterlite.
🤔 La ciencia abierta no termina de llegar. En el pequeño microcosmos de la SciPy todo eran sonrisas y buenas intenciones, pero lo cierto es que el mundo académico y el sistema de publicación siguen sumidos en una profunda crisis. La nueva tendencia son las revistas pidiendo que los equipos de investigación hagan disponibles sus datos “bajo petición razonable” (upon reasonable request) y que entre el 50 % y el 95 % de dichas peticiones sean rechazadas o ignoradas.
Las razones de esto son obvias: la estructura de incentivos está toda mal. Si los investigadores son premiados en base al número de publicaciones y a criterios tan espurios como el denostado Factor de Impacto, y a esto le sumamos un clima de precariedad extrema y una brecha gigante entre oferta y demanda, tenemos la tormenta perfecta. Hasta que no cambien las reglas del juego no habrá un cambio sustancial en la forma en la que se produce la ciencia.
💥 La revolución abierta se resiste en la ingeniería. Esta semana le dije a alguien: «trabajar en la industria espacial es lo más cercano a trabajar en el ejército sin ser militar». A pesar de los enormes beneficios que ha tenido el código abierto para acelerar el progreso de la inteligencia artificial y el despliegue de arquitecturas de análisis de datos masivos, nuestros aviones y nuestros satélites se siguen haciendo en gran medida con Excel. Y aunque hay nuevas empresas que piensan de manera diferente, aún ven el código abierto como un recurso gratuito y no como una oportunidad de estandarizar procesos, incorporar talento e ideas del mundo del software, o mejorar su imagen de marca.
(Y por cierto, permitidme que en esto deje las consideraciones éticas al margen, porque mal que nos pese una empresa no es una ONG.)
Hay buenas noticias en el horizonte: la Agencia Espacial Europea ha publicado una convocatoria para crear un simulador satelital de código abierto. ¿Quién ganará la convocatoria? ¿El resultado será exitoso o quedará guardado en un cajón? Veremos qué ocurre.
✨ El futuro no está escrito. Me gustaría cerrar este noticiero un tanto especial con esta reflexión de Matthew Rocklin sobre el futuro de SciPy como comunidad y ecosistema. La última década ha sido tremendamente exitosa, y ahora todos los caminos están abiertos. Depende de nosotros allanar el camino a las nuevas generaciones, crear comunidades más inclusivas, y por supuesto seguir disfrutando de lo que hacemos.
¡Hasta el viernes que viene!
¿Buscas un Platform-as-a-Service (PaaS) alternativo a Heroku? Yo he migrado a Railway (enlace afiliado) y me encanta que las aplicaciones no “duermen” así que el tiempo de respuesta es siempre rápido ⚡