🚀 ¡Festival de versiones nuevas esta semana! Empezamos:
La gente maja de Ploomber ha sacado JupySQL 7.0, que incluye una API tipo ggplot para visualizaciones sobre tablas, soporte para MySQL y MariaDB, mejores mensajes de error, y mucho más. Además, Eduardo se lió la manta a la cabeza e implementó resaltado de sintaxis SQL en Jupyter, ¡por fin!
Por otro lado, Modin 0.20 trae implementaciones de algunas funciones para Dask que ya estaban disponibles con otros motores, y Prefect 2.10 por su parte trae “workers” (que van a sustituir a los “agents”), proyectos para agrupar flujos con sus dependencias, mejoras en la observabilidad a través de eventos, y mucho más.
Y por último, unos cuantos proyectos aprovecharon para añadir soporte para pandas 2.0: ibis 5.1 y xarray 2023.04.
💡 Esta semana he descubierto DoubleML, una biblioteca Python y R que implementa regresiones parcialmente lineales y otros modelos semi-paramétricos, útiles cuando hay muchos factores de confusión. En este post en LinkedIn uno de los autores cuenta más detalles. Pero vamos, que más que nada me ha hecho recordar lo poco que sé de estadística. El resumen de arXiv ha sido lo que me ha ayudado a entender estos métodos.
En otro orden de cosas, la gente de Prefect ha sacado una biblioteca llamada Marvin que genera funciones solo definidas por sus docstrings, utilizando las APIs de OpenAI. Ojo que es un poco distinto a asistentes de código en el sentido de que el usuario nunca ve la implementación, solamente la respuesta.
📚 Me ha encantado este artículo sobre detección de comunidades en grafos y redes con Python, utilizando varios algoritmos disponibles en NetworkX.
Por otro lado, esta súper guía de matplotlib se publicó hace ya un tiempo, pero me parece excelente.
Y ojo a esto que señala Soledad Galli en su LinkedIn: si estás utilizando la función chi2
de scikit-learn para seleccionar variables, a lo mejor lo estás haciendo mal.
🕸️ Se acaban de anunciar los proyectos de la primera ronda del GitHub Accelerator, y tenemos un viejo conocido: ¡Spyder! A pesar de que no es un IDE de los más utilizados, todavía sigo encontrando gente que lo ama porque es simple y se parece a RStudio (ahora Posit) o MATLAB. ¡Enhorabuena Carlos y equipo!
Se hizo un poco raro echar dos horas de un viernes por la noche para escribir el noticiero hoy, menos mal que fue con buena música de fondo. Si te gustó, recomiéndalo, deja un comentario, dale al corazoncito, o en general haz ver que estas ahí, que me va a hacer ilusión. ¡Buen fin de semana!