🚀 ¡Ha salido JupyterLab 3.3.0! Las novedades incluyen un editor visual para las preferencias (¡por fin!), mejoras tanto en el inspector de variables como en el depurador (¿sabías que JupyterLab tenía estas dos cosas?), personalización de las barras de herramientas, un indicador de progreso, y una nueva funcionalidad para abrir un archivo directamente introduciendo la URL. ¡Hora de actualizar!
💡 Esta semana he descubierto pysentimiento, una biblioteca de ánalisis de sentimiento para el idioma español desarrollado por la Universidad de Buenos Aires (¡gracias Juan Manuel!), y stickyland, una curiosa forma de crear dashboards en Jupyter arrastrando celdas como si fuera unlienzo.
📚 Jaime Buelta escribe en su blog un breve artículo sobre concurrent.futures.ThreadPoolExecutor
para paralelizar tareas. ¡Mucho cuidado con el GIL, eso sí! Recordad que en Python solo puede haber un hilo/hebra/thread haciendo trabajo de CPU a la vez. También está concurrent.futures.ProcessPoolExecutor
pero tiene cierto sobrecoste.
Por otro lado, por mi nuevo trabajo he estado leyendo sobre tuberías/canalizaciones/pipelines de datos y me ha gustado este artículo sobre flujos continuos de datos/streaming y el paradigma dataflow.
🤓 En el Telegram de Python Científico hemos estado hablando de la diferencia de rendimiento entre usar .apply
en pandas y buscar un método “nativo” (spoiler: evitar apply
si es posible) y técnicas para reducir la asimetría estadística en datos astronómicos.
💼 (¿Buscas gente que domine estas tecnologías y quieres publicar aquí una oferta? ¡Escríbeme!)