🔥 ¡Tenemos scikit-learn 1.1.0! La mejora más esperada de todas es que el método get_feature_names_out
está disponible ya en todos los transformers, lo que significa que si usamos objetos Pipeline
, ColumnTransformer
, OneHotEncoder
, etc. con dataframes de pandas, ¡no se pierden los nombres de las columnas! Para mí este era uno de los puntos más dolorosos de scikit-learn y estoy entusiasmado de que ya lo hayan resuelto. En las notas de versión tienes una relación completa de los cambios.
pip install -U scikit-learn
or
conda install -c conda-forge scikit-learn
#sklearn #ML #Datascience #opensource #Python
🚀 También ha salido SunPy 4.0, una biblioteca Python para física solar. Entre las novedades están la posibilidad de visualizar coordenadas Carrington, mejoras en las transformaciones afines, y varios módulos que se han declarado obsoletos.
No podemos dejar pasar Anaconda Distribution 2022.05, con soporte nativo para los procesadores M1 de Apple (aunque sin Anaconda Navigator ni Spyder, ojo) y varios paquetes actualizados.
Y por último tenemos Plotly 5.8.0, con mejoras en el autocompletado y soporte para rejillas menores (por cierto, Celia López dará una charla sobre Plotly el jueves que viene en PyData Madrid, ¡no te la pierdas!)
¡Nos vemos el jueves 19 de mayo a las 19:00 en @kairos_ds! El registro se abre el 12 📣
💡 Esta semana he descubierto ipyvizzu, una biblioteca Python para crear animaciones en Jupyter, y feature-engine, un conjunto de herramientas para ingeniería de características bastante completa escrita por la doctora Soledad Galli.
📚 Me ha encantado este análisis de los hospitales más caros de EEUU usando Polars (en lugar de pandas) para el tratamiento de los datos y Altair para la visualización.
Con perdón por el autobombo, escribí este artículo sobre Vaex y sus diferencias con pandas, y precisamente estoy trabajando en otro sobre Polars.
Y por último, me he topado con estos recursos para análisis de datos climáticos y geofísicos que me parecen espectaculares:
“Python is slow”, lol: no.
📣 ¡Se acaba de anunciar la EuroSciPy 2022, que hará su retorno triunfal en Basilea, Suiza! Posiblemente la conferencia de Python mejor organizada y más divertida a la que he ido, espero poder asistir de nuevo este año.
💼 En Kairós DS, una empresa molona que además va a alojar la reunión de PyData Madrid la semana que viene, buscan Senior Data Engineer (45-60 k€).
¿Buscas un hosting bueno, bonito, y barato? Yo llevo muchos años con Dinahosting (enlace afiliado) y no me cambio por nada, el soporte 24 horas es 🔝, y son de Galicia 🇪🇸