July 22, 2022, 10:20 a.m.

Episodio 41 🐍⚙️🇺🇸 Especial SciPy US

Noticiero Python y Datos

🔥 El 12 de julio de 2022 se publicaron las primeras imágenes del telescopio espacial James Webb, un hito científico muy esperado. La diferencia de calidad con el Hubble es impresionante, y toda la gente que trabaja en astronomía está muy revolucionada. En la comunidad Python tenemos motivos para sentirnos orgullosos: como recoge este artículo en el blog de GitHub, Astropy y otros paquetes del ecosistema científico se están utilizando activamente para la planificación de las observaciones y el tratamiendo de los datos. ¡Hurra!

📜 Y precisamente esa misma semana se celebraba la 21ª SciPy US en Austin, Texas, el evento de referencia sobre Python científico en los EEUU. Después de asistir a la 1ª SciPy LATAM en 2015 en Posadas, Misiones, Argentina y a la 12ª EuroSciPy en 2019 en Bilbao, España, tenía muchas ganas de ir a este evento, y no decepcionó.

La lista de proyectos que descubrí esta semana se haría demasiado larga, pero tengo buenas noticias: ¡la tienes entera en las actas (proceedings) de la conferencia!
Así que en esta ocasión voy a contar cuáles para mí han sido las claves del evento.

🧑‍🤝‍🧑 La comunidad científica alrededor de Python se ha diversificado. Algunas áreas del conocimiento tienen ya sus propios ecosistemas de paquetes, como por ejemplo:

  • Astronomía: el párrafo que encabeza el noticiero de hoy ya lo dice todo. Astropy empezó como un proyecto pequeño y hoy en día es un ecosistema muy amplio que incluye paquetes como SunPy, astroquery y specutils, además de proyectos afiliados como gammapy o el propio poliastro.

Twitter avatar for @astropy
Astropy @astropy
@juanluisback @SciPy_team More specifically, the software engineers 😃 who do much of the critical but unrecognized work
3:21 PM ∙ Jul 13, 2022
3Likes1Retweet
  • Geociencias: el proyecto Pangeo está jugando un papel fundamental en los avances por entender el cambio climático, y acaban de lanzar Pangeo Forge para automatizar aún más la catalogación de los datos. Hablando con Ryan Abernathey, uno de los creadores, nos dimos cuenta de que podíamos utilizar una filosofía similar para conjuntos de datos abiertos genéricos, no necesariamente sobre ciencia.

Twitter avatar for @juanluisback
Juan Luis Cano Rodríguez @juanluisback
@JOSS_TheOJ @rabernat about @pangeo_data: "we want everyone to be able to verify the scientific progress" ❤️ #SciPy2022
Image
3:53 PM ∙ Jul 14, 2022
9Likes1Retweet
  • Genómica y otros campos de la biología molecular: si bien el lenguaje R ha sido y es la herramienta de referencia en este campo, Python está avanzando con decisión en gran parte gracias a la iniciativa scverse, que incluye proyectos como anndata y scanpy. Tuve la oportunidad de charlar con Isaac Virshup, uno de los desarrolladores del proyecto.

Twitter avatar for @rmassonix
Ramon Massoni Badosa @rmassonix
While R developers were fighting to see who published the best end-to-end pipeline, Python peeps started scverse: "a consortium of foundational tools (mostly in Python) for omics data in life sciences. It has been founded to ensure the long-term maintenance of these core tools"
Image
1:18 PM ∙ Jul 21, 2022
  • Física de partículas: no sabía que scikit-HEP era mucho más que un solo paquete, sino un ecosistema entero que incluye Awkward Array, Uproot y muchos otros. Además, Henry Schreiner III, uno de los miembros del proyecto, es muy activo en las discusiones sobre paquetería, y ha conseguido financiación para trabajar en scikit-build los próximos 3 años.

Twitter avatar for @juanluisback
Juan Luis Cano Rodríguez @juanluisback
Learning more about the history of scikit-hep from @HenrySchreiner3 at #SciPy2022
Image
4:38 PM ∙ Jul 14, 2022
13Likes3Retweets

💰 La financiación funciona y la profesionalización es buena. El impacto de programas estatales como el ROSES de la NASA o de fundaciones filantrópicas como la Chan Zuckerberg Initiative (sí, ese Zuckerberg) ha sido notable. Muchos proyectos han podido renovar sus sitios web, mejorar notablemente su documentación, incrementar la diversidad de sus comunidades, y muchas otras cuestiones para las que hace falta la clase de trabajo continuado que solo una fuente de ingresos estable puede permitir. Tuve la oportunidad de charlar con Dario Taraborelli sobre cómo CZI permitió a Read the Docs contratarme y el efecto que eso tuvo en la documentación de Sphinx.

Al mismo tiempo, el trabajo de empresas como Quansight o QuantStack, que canalizan sus ingresos por consultoría directamente hacia el ecosistema open source, están teniendo una influencia notable en proyectos como Jupyter, NumPy, SciPy, y conda. Gracias a QuantStack tenemos mamba, el reemplazo ultrarrápido de conda, y otros proyectos como quetz y jupyterlite.

Twitter avatar for @juanluisback
Juan Luis Cano Rodríguez @juanluisback
Impressive numbers for @condaforge 🤯 @__mvn__ and @wuoulf on stage #SciPy2022
Image
6:08 PM ∙ Jul 15, 2022
16Likes3Retweets

🤔 La ciencia abierta no termina de llegar. En el pequeño microcosmos de la SciPy todo eran sonrisas y buenas intenciones, pero lo cierto es que el mundo académico y el sistema de publicación siguen sumidos en una profunda crisis. La nueva tendencia son las revistas pidiendo que los equipos de investigación hagan disponibles sus datos “bajo petición razonable” (upon reasonable request) y que entre el 50 % y el 95 % de dichas peticiones sean rechazadas o ignoradas.

Twitter avatar for @ceptional
Alex Holcombe @ceptional
"Data available upon request" doesn't work. In case you didn't already know that, there's a new study of Biomed Central papers. 1792 manuscripts indicated authors are willing to share their data. 93% either did not respond or declined to share their data.
9:51 PM ∙ Jun 5, 2022
4,482Likes975Retweets

Las razones de esto son obvias: la estructura de incentivos está toda mal. Si los investigadores son premiados en base al número de publicaciones y a criterios tan espurios como el denostado Factor de Impacto, y a esto le sumamos un clima de precariedad extrema y una brecha gigante entre oferta y demanda, tenemos la tormenta perfecta. Hasta que no cambien las reglas del juego no habrá un cambio sustancial en la forma en la que se produce la ciencia.

Figure 6

💥 La revolución abierta se resiste en la ingeniería. Esta semana le dije a alguien: «trabajar en la industria espacial es lo más cercano a trabajar en el ejército sin ser militar». A pesar de los enormes beneficios que ha tenido el código abierto para acelerar el progreso de la inteligencia artificial y el despliegue de arquitecturas de análisis de datos masivos, nuestros aviones y nuestros satélites se siguen haciendo en gran medida con Excel. Y aunque hay nuevas empresas que piensan de manera diferente, aún ven el código abierto como un recurso gratuito y no como una oportunidad de estandarizar procesos, incorporar talento e ideas del mundo del software, o mejorar su imagen de marca.

(Y por cierto, permitidme que en esto deje las consideraciones éticas al margen, porque mal que nos pese una empresa no es una ONG.)

Hay buenas noticias en el horizonte: la Agencia Espacial Europea ha publicado una convocatoria para crear un simulador satelital de código abierto. ¿Quién ganará la convocatoria? ¿El resultado será exitoso o quedará guardado en un cajón? Veremos qué ocurre.

✨ El futuro no está escrito. Me gustaría cerrar este noticiero un tanto especial con esta reflexión de Matthew Rocklin sobre el futuro de SciPy como comunidad y ecosistema. La última década ha sido tremendamente exitosa, y ahora todos los caminos están abiertos. Depende de nosotros allanar el camino a las nuevas generaciones, crear comunidades más inclusivas, y por supuesto seguir disfrutando de lo que hacemos.

¡Hasta el viernes que viene!

Twitter avatar for @juanluisback
Juan Luis Cano Rodríguez @juanluisback
Waiting for my flight to Madrid 🛫 See you soon Austin! #SciPy2022
Image
4:07 PM ∙ Jul 17, 2022
20Likes1Retweet

¿Buscas un Platform-as-a-Service (PaaS) alternativo a Heroku? Yo he migrado a Railway (enlace afiliado) y me encanta que las aplicaciones no “duermen” así que el tiempo de respuesta es siempre rápido ⚡

You just read issue #31 of Noticiero Python y Datos. You can also browse the full archives of this newsletter.

Share on LinkedIn
GitHub LinkedIn
Powered by Buttondown, the easiest way to start and grow your newsletter.