Noticiero Python y Datos

Archive

Episodio 30 🐍⚙️🏕️

Vuelta de vacaciones de Semana Santa 🏕️ ¡y con las pilas cargadas!

🔥 La empresa Bloomberg ha publicado memray, una nueva herramienta para analizar el consumo de memoria en Python que promete muchísimo. Nuestro querido Pablo Galindo es el committer principal, así que ya solo por eso la voy a estar probando muy pronto.

Twitter avatar for @1st1
Yury Selivanov @1st1
WOW.

Bloomberg finally opensourced memray—a new versatile memory profile for Python. Can’t way to use it.

#20
April 22, 2022
Read more

Episodio 29 🐍⚙️

🚀 Ha salido Modin 0.14 con numerosas mejoras de código y de documentación. Si utilizas pandas y estás buscando una forma rápida de acelerar tu código con pocos cambios, ¡Modin te interesa!

Twitter avatar for @modin_project
Modin Project @modin_project
ICYMI: We released Modin version 0.14 last week! 🎊

Read more about the changes in this release in this post! ponder.io/modin-0-14-rel…

ponder.ioModin 0.14 ReleaseAt Ponder, we continue to invest in contributing to Modin to help data teams seamelssly scale up their Pandas workflows. Today, we’re excited to announce
6:06 PM ∙ Apr 6, 2022

También tenemos Plotly 5.7.0 con numerosas mejoras: facilidades para agregar texto a histogramas y mapas de calor, rellenos con patrones, y ¡diagramas de Smith!

💡 Esta semana ha ido de mapas: he descubierto prettymaps, una biblioteca Python para dibujar mapas con una estética exquisita, y geospatial, una colección de paquetes geoespaciales fácilmente instalables a través de conda/mamba.

📚 La empresa Anaconda ha anunciado una reestructuración de su línea de productos, incluyendo su famosa distribución, que vuelve a llamarse Anaconda Distribution y seguirá siendo gratuita para uso personal.

Twitter avatar for @anacondainc
Anaconda @anacondainc
At Anaconda, our drive to improve the capabilities of our product is matched by our drive to improve the way we offer said product to our community. We are pleased to announce that Anaconda has moved to a tier-based product model! Learn more here: bit.ly/3LJclDT.
bit.lyAnaconda | Anaconda “Editions” Repositioned as Feature-Additive…Here at Anaconda, we’re constantly innovating—and our drive to improve the capabilities of our product is matched by our drive to improve the way we offer said product to our community. As such, we are pleased to announce that Anaconda has moved to a tier-based product model. With this approach,…
2:02 PM ∙ Apr 6, 2022
7Likes2Retweets

En otro orden de cosas, me ha gustado mucho este artículo sobre cómo visualizar grandes nubes de puntos utilizando datashader.

Aunque, como dice aquí Will Geary, ¡ojo con los mapas de calor! Recomendable utilizar la I de Moran, una medida de autocorrelación espacial.

Twitter avatar for @wgeary
Will Geary @wgeary
The problem with heatmaps: they can make patterns visible even when, in reality, there are none.

Spatial statistics can help: Local Moran’s I can be used to test for significant clusters and outliers.

#19
April 8, 2022
Read more

Episodio 28 🐍⚙️

🚀 Esta semana ha salido SfePy 2022.1, una biblioteca Python para resolución de ecuaciones en derivadas parciales por el método de los elementos finitos. Entre las novedades, se elimina la clase State y se introduce un nuevo método para manejar variables de estado.

En su día ayudé a crear las recetas de conda de un proyecto similar llamado FEniCS (ahora FEniCSx), que tiene una comunidad más grande y está más enfocado en tener un buen rendimiento. Aquí una charla que di sobre FEniCS en Lima en 2017.

#18
April 1, 2022
Read more

Episodio 27 🐍⚙️

🚀 ¡Más versiones nuevas esta semana! Entre las novedades tenemos:

Prefect 2.0, un framework para crear flujos de procesado de datos, tira la casa por la ventana e introduce muchísimos cambios: decoradores mucho más sencillos para declarar grafos de tareas, todos los componentes liberados bajo Apache 2.0, y un nuevo motor de orquestación llamado Orion, entre otras.

Twitter avatar for @PrefectIO
Prefect @PrefectIO
We have an official Prefect 2.0 release, and it's graduating to beta!

👩‍💻 Finally, Code as Workflows 👉 Apache 2.0, top to bottom 🤓 Ephemeral API ⛰️ Streaming use cases 💻 Brand new UI, included

#17
March 25, 2022
Read more

Episodio 26 🐍⚙️

🚀 Hace unos días salió PyTorch 1.11, con importantes novedades: TorchData implementa el concepto de “Data Pipes” para acceder a fuentes de datos de manera modular, functorch provee transformaciones inspiradas en JAX compatibles con diferenciación automática, y el entrenamiento distribuido usando DistributedDataParallel ya soporta grafos estáticos, con un rendimiento un 10 % mayor.

Twitter avatar for @PyTorch
PyTorch @PyTorch
Announcing PyTorch 1.11, TorchData, and functorch! Highlights: - TorchData, a new library for common modular data loading primitives - functorch adds composable function transforms - DDP static graph optimizations in stable Learn more👇pytorch.org/blog/pytorch-1…
pytorch.orgPyTorch 1.11, TorchData, and functorch are now availableWe are excited to announce the release of PyTorch 1.11 (release notes). This release is composed of over 3,300 commits since 1.10, made by 434 contributors. Along with 1.11, we are releasing beta versions of TorchData and functorch.
7:38 PM ∙ Mar 10, 2022
571Likes113Retweets

Según este análisis de la comunidad ML Contests, PyTorch es ahora mismo la herramienta de aprendizaje profundo más utilizada.

Twitter avatar for @ml_contests
ML Contests @ml_contests
Our analysis of 83 ML competitions in 2021, in collab with @galieoeni: - 🏆 @kaggle dominant with 1/3 of all competitions and 1/2 of $2.7m total prize money - 🐍Almost all winners used Python - 1 used C++! - 🔦77% of Deep Learning solutions used PyTorch
#16
March 18, 2022
Read more

Episodio 25 🐍⚙️🎉

Edición especial para celebrar los 25 episodios, con extra de enlaces y animaciones. ¡Gracias por apoyar el noticiero! 🥂

📣 Queda un mes para PyCamp España, un evento con muchísima trayectoria en Argentina y que por fin se hace en mi país natal: 4 días, pensión completa en una casa rural maravillosa, diversión, buena compañía, y mucho Python. ¡Anímate!

PyCamp 2019 en Mendoza, Argentina (sin mascarillas, antes de la pandemia)

¡Y más! La semana que viene es el primer hackathon de Procesamiento del Lenguaje Natural en español, impulsado por la gente maja de Hugging Face. Si te interesa participar pero no sabes nada de PLN, echa un vistazo a su curso “NLP de cero a cien”.

#15
March 11, 2022
Read more

Episodio 24 🐍⚙️

🚀 ¡Ha salido JupyterLab 3.3.0! Las novedades incluyen un editor visual para las preferencias (¡por fin!), mejoras tanto en el inspector de variables como en el depurador (¿sabías que JupyterLab tenía estas dos cosas?), personalización de las barras de herramientas, un indicador de progreso, y una nueva funcionalidad para abrir un archivo directamente introduciendo la URL. ¡Hora de actualizar!

💡 Esta semana he descubierto pysentimiento, una biblioteca de ánalisis de sentimiento para el idioma español desarrollado por la Universidad de Buenos Aires (¡gracias Juan Manuel!), y stickyland, una curiosa forma de crear dashboards en Jupyter arrastrando celdas como si fuera unlienzo.

#14
March 4, 2022
Read more

Episodio 23 🐍⚙️

📣 La 14ª escuela de verano de Advanced Scientific Programming in Python será este año en Bilbao. Las solicitudes están abiertas hasta el 1 de mayo. ¡Totalmente recomendable! (Nos avisa Sasha por el Telegram de Python Científico)

🚀 ¡Más versiones nuevas esta semana!

  • Nixtla anuncia statsforecast 0.3.0, que anuncia ser “la implementación Python de auto-ARIMA más rápida” (gracias a Numba).

Twitter avatar for @fede_gr
fede garza @fede_gr
I'm thrilled to announce that we're releasing the fastest #autoarima implementation for #Python today! 😍
#13
February 25, 2022
Read more

Episodio 22 🐍⚙️

🚀 Minutos después del anterior episodio salió Dask 2022.02.0, con algunas mejoras y arreglos: soporte para parámetros de conexión personalizados en dask.dataframe.to_sql (por ejemplo, para forzar SSL), parámetros extra en to_zarr y read_json, y nueva función expand_dims (necesaria para que Dask implemente el estándar para arrays).

Dask es un proyecto ya bastante maduro y no se ven cambios drásticos en las versiones nuevas. Si estás buscando una alternativa a PySpark, ¡estás tardando en instalarlo!

Twitter avatar for @dask_dev
Dask @dask_dev
The Dask team has released version 2022.02.0 today! docs.dask.org/en/stable/chan… It includes contributions from 22 people, including 4 new contributors! Some release highlights 🧵:
docs.dask.orgChangelog — Dask documentation
7:59 PM ∙ Feb 11, 2022
43Likes12Retweets

💡 Esta semana estuve probando PDM para gestionar dependencias en Python y me gusta bastante, lo veo como una evolución de Pipenv y Poetry. Puede instalar paquetes localmente sin necesidad de entornos virtuales, similar a como funciona NPM (como se describe en la PEP 582, que aún sigue en borrador).

#12
February 18, 2022
Read more

Episodio 21 🐍⚙️

🔥 ¡Fiesta de versiones nuevas esta semana! Resumiendo, tenemos:

  • SciPy 1.8.0 con numerosas mejoras (nueva API para matrices dispersas compatible con los arrays de NumPy, cálculo de autovalores en matrices dispersas usando PROPACK, separación más clara de la API pública, y mucho más)

  • asv 0.5 con muchos arreglos y mejoras después de un tiempo de inactividad con el objetivo de usarlo para medir el rendimiento de pandas

  • Zarr 2.11.0 (si estás buscando un formato multidimensional de alto rendimiento como alternativa a HDF5 y NetCDF4, este es tu proyecto)

Twitter avatar for @zarr_dev
zarr_dev @zarr_dev
Hi Zarr Community! 🙋🏻‍♂️

We’ve just released the 2.11.0 version of Zarr Python with some major enhancements, bug fixes, maintenance and documentation updates. 🐍

#11
February 11, 2022
Read more

Episodio 20 🐍⚙️

🔥 Hace unos días se anunció VegaFusion, un software que toma visualizaciones basadas en el formato declarativo Vega y multiplica su rendimiento. Está basada en las ideas de Datashader y se puede probar a través de Altair, la implementación en Python de dicho formato. Detrás del proyecto está Jon Mease, ex Chief Scientist de Plotly, así que ¡veremos cómo evoluciona!

Twitter avatar for @jonmmease
Jon Mease @jonmmease
Really happy to share a new visualization project I've been working on! VegaFusion integrates with @vega_vis and Altair (@jakevdp) to accelerate visualizations by executing intensive calculations in the Python kernel process (with efficient parallelization).
Twitter avatar for @vegafusion_io
VegaFusion @vegafusion_io
Announcing VegaFusion: Server-side Acceleration for the Vega Visualization Grammar https://t.co/vMWOeLhV1C
2:40 PM ∙ Jan 27, 2022
83Likes18Retweets

📣 ¡Está abierto el registro para la SciPy de Estados Unidos! Recordemos que este año, salvo sorpresas, será en persona en Austin, Texas (y que la llamada a propuestas se cierra el viernes que viene). Estoy valorando ir, ¿quién más se apunta?

#10
February 4, 2022
Read more

Episodio 19 🐍⚙️

📣 ¡Vuelve PyData Madrid! Después de unos años de inactividad y tras volver a mi ciudad natal, decidí retomar las reuniones mensuales. De momento vamos a hacer una quedada informal para planificar qué temas cubrir y dónde juntarnos. ¡Síguenos en Meetup y Twitter!

🚀 ¡Tenemos nueva versión de pandas! pandas 1.4 introduce varias mejoras, incluyendo más claridad en los infames famosos SettingWithCopyWarning, nuevas funcionalidades para estilizar un DataFrame, lectura más rápida de CSVs usando pyarrow, más métodos de agrupación, y muchísimo más.

NumFOCUS ha otorgado una beca del programa Small Development Grants para mejorar las comparativas de rendimiento de pandas, así que espero que pronto veamos mejoras en ese sentido.

💡 Esta semana he descubierto river, una biblioteca Python para aprendizaje automático continuo/en streaming (la fusión de creme y scikit-multiflow, ahora obsoletos), y human-learn, un interesante proyecto que ayuda a diseñar modelos de aprendizaje automático con entradas humanas. Más fácil verlo que explicarlo:

#9
January 28, 2022
Read more

Episodio 18 🐍⚙️

🚀 ¡Ha salido numba 0.55 por fin! Como siempre hay varias mejoras en el soporte para Python y NumPy, pero lo mejor es que ya trae soporte para Python 3.10, NumPy 1.21, y permite usar flotantes de media precisión al compilar para GPU con CUDA.

Numba es un compilador Just-in-Time para código Python: agregas un decorador, y el rendimiento se multiplica por 10 o 1000. Se usa para cosas muy chulas, como por ejemplo este explorador del conjunto de Mandelbrot en tiempo real, el estudio térmico de las supernovas, visualización de conjuntos de datos masivos, y por supuesto astrodinámica (por si no se notaba, ¡soy muy fan!).

Por otra parte, grayskull 1.0, una herramienta muy útil para crear paquetes conda a partir de paquetes Python, trae numerosas mejoras, y concretamente ya convierte recursivamente las dependencias para una mayor comodidad.

#8
January 21, 2022
Read more

Episodio 17 🐍⚙️

🔥 ¡Se ha terminado de traducir al 100% la documentación oficial de Python al español! Gracias a las aproximadamente 200 personas que contribuyeron a este hito. Ahora toca mantenerla, ¿te apuntas?

🚀 ¡Ha salido IPython 8.0! La larga espera ha merecido la pena y la versión nueva nos trae mejoras sustanciales en las trazas de error, mejores sugerencias en la interfaz de terminal, mejoras en la autorecarga del código, y mucho más. Además, estas mejoras se trasladan automáticamente a Jupyter también. ¡Gracias Matthias por seguir al pie del cañón!

Twitter avatar for @Mbussonn
Matthias​ ​Bussonnier @Mbussonn
@quansightai In particular you'll see a number of improvements in tracebacks, and #fishshell like suggestions:
Image
Image
1:49 PM ∙ Jan 12, 2022
30Likes4Retweets

También tenemos versiones nuevas de más paquetes: Anita Graser ha publicado MovingPandas 0.9 con suavizado de trayectorias usando filtros de Kalman, y Pyodide 0.19 ha conseguido compilar Scipy 1.7.3 a WebAssembly (❗)

#7
January 14, 2022
Read more

Episodio 16 🐍⚙️

¡Feliz 2022! 🎉

🚀 ¡NumPy 1.22 está disponible! Las novedades incluyen anotación de tipos completa (útil para que los editores den mejores ayudas de código), una implementación experimental de la API estándar de Python para arrays (que esperemos que proyectos como JAX, CuPy y otros acaben adoptando) en numpy.array_api, ocho nuevos algoritmos para calcular percentiles, y mucho más.

📣 ¡La llamada a propuestas para la SciPy US 2022 está abierta hasta el 11 de febrero! El evento vuelve en julio a Austin, Texas, EEUU (feliz de que vuelvan los eventos presenciales, pero naturalmente se complica la logística para asistir).

💡 Estas vacaciones redescubrí scikit-criteria, una biblioteca Python para problemas de decisión multicriterio inspirada en scikit-learn (Juan Bautista, uno de los autores, lo explica bien en este vídeo - ¡gracias Juan!) y he estado leyendo sobre JAX a raíz de este vídeo sobre cómo implementar el método de Lattice Boltzmann en Python.

#6
January 7, 2022
Read more

Episodio 15 🐍⚙️🎄 (¡Y feliz 2022!)

🌎 El fin de semana pasado se celebró la SciPy Latin America, organizada este año por un equipo brasileño, ¡y ya están los vídeos en su canal de YouTube!

Aún no se ha anunciado oficialmente la sede de 2022, pero te cuento en primicia que será en el norte de Argentina 🇦🇷

🚀 La gente que nos trajo Python Tutor ha creado Pandas Tutor, una web para visualizar de manera interactiva código pandas paso a paso.

Twitter avatar for @samlau95
sam lau @samlau95
hello world! we're launching pandas tutor! it visualizes Python pandas code step-by-step: pandastutor.com (developed with my advisor philip guo)
side-by-side dataframes with arrows and coloring to illustrate pandas operations
5:49 PM ∙ Dec 4, 2021
3,757Likes842Retweets
#5
December 17, 2021
Read more

Episodio 14 🐍⚙️🚀 (Edición especial OSCW)

Noticias sobre Python Científico de la semana, episodio 14 🐍⚙️🚀

🔥 Otra semana intensa de versiones nuevas (te hago un resumen porque si no, nos eternizamos): tenemos scikit-image 0.19.0 que incluye el algoritmo scale-invariant feature transform (SIFT), CuPy 10.0.0 (NumPy y SciPy para GPUs) con soporte para indexado avanzado entre otras muchas mejoras, y Voilà 0.3.0 (que permite crear dashboards web a partir de notebooks de Jupyter) con soporte para kernels precargados entre otras cosas.

Ya he utilizado Voilà para varios proyectos con clientes, el último un simulador de constelaciones satelitales, y lo recomiendo totalmente.

#4
December 10, 2021
Read more

Episodio 13 🐍⚙️

Noticias sobre Python Científico de la semana, episodio 13 🐍⚙️

🔥 ¡Fiesta de versiones nuevas esta semana! JupyterHub 2.0 trae por fin autenticación basada en roles (RBAC) y usa JupyterLab en vez del notebook clásico como interfaz por defecto, Vaex 4.6.0 (similar a pandas pero ultrarrápido) aprovecha la GPU en los MacBook usando Metal entre otras mejoras, y mi querido Astropy 5.0 (la biblioteca base para hacer astronomía con Python) trae numerosas mejoras en la lectura/escritura de archivos FITS, Parquet, y MRT así como soporte para arrays de Dask en astropy.table.

Twitter avatar for @vaex_io
vaex @vaex_io
Vaex 4.6.0 brings a cool feature: GPU support for your @Apple MacBooks using Metal! On this Macbook with an @AMD @Radeon GPU, you can get a 5x speedup when evaluating complex expressions.

Just “pip install vaex” and rock on!

7:13 PM ∙ Nov 30, 2021
43Likes11Retweets

(Después de ostentar el título de core developer de astropy.coordinates un tiempo, me di oficialmente de baja hace unas semanas para poder concentrarme en otros proyectos)

📣 ¡Está abierta la llamada a charlas de la PyCon Alemania + PyData Berlin 2022! Si nuevas pandemias no lo impiden, el evento será en persona en abril del año que viene (¡feliz de que vuelvan los eventos presenciales, ya he tenido suficientes horas de videoconferencia estos dos años!)

💡 Esta semana he descubierto qibo, un framework de simulación y control de ordenadores cuánticos (gracias a Albert Solana de Qilimanjaro Tech por la referencia), ploomber, una extensión de Jupyter para crear pipelines gráficamente usando grafos, y Colorcet, una colección de mapas de color perceptualmente uniformes (es decir: que no uses jet nunca más).

Twitter avatar for @HoloViz_org
HoloViz @HoloViz_org
Announcing Colorcet 3.0! Thanks to Peter Kovesi and Randy Pittman, colorcet.holoviz.org now has 23 new perceptually uniform colormaps for Python, including Rainbow4 (a drop-in replacement for Jet), Gouldian (a better Parula), 15 new cyclic maps, and 5 new colorblind-safe maps.
Image
2:18 PM ∙ Nov 29, 2021
351Likes81Retweets

💼 (¿Tu empresa busca gente y quieres compartir una oferta aquí, con banda salarial? ¡Contéstame a este correo!)

#3
December 3, 2021
Read more

Episodio 12 🐍⚙️

Noticias sobre Python Científico de la semana, episodio 12 🐍⚙️

🚀 ¡Tenemos Anaconda Individual Edition 2021.11! Incluye numerosas actualizaciones de paquetes y mejoras en Anaconda Navigator.

Además, también tenemos mamba 0.18.1 - si no conoces este reemplazo ultrarrápido de conda, ¡ya estás tardando!

💡 Esta semana he descubierto dirty_cat, una biblioteca Python para manejar variables categóricas con errores tipográficos o alta cardinalidad, y klio, una herramienta de Spotify para crear pipelines de procesamiento de audio por encima de Apache Beam.

#2
November 26, 2021
Read more

¡Arrancamos pronto!

Pronto arranca el Noticiero Python Científico, tu boletín semanal sobre Python para ciencia y análisis de datos, cada viernes en tu bandeja de entrada. Puedes leer las ediciones anteriores en mi perfil de LinkedIn.

¡Suscríbete para no perderte la próxima edición!

Subscribe now

#1
November 24, 2021
Read more
  Newer archives
 
GitHub LinkedIn
Powered by Buttondown, the easiest way to start and grow your newsletter.