March 25, 2022, 10:45 a.m.

Episodio 27 🐍⚙️

Noticiero Python y Datos

🚀 ¡Más versiones nuevas esta semana! Entre las novedades tenemos:

Prefect 2.0, un framework para crear flujos de procesado de datos, tira la casa por la ventana e introduce muchísimos cambios: decoradores mucho más sencillos para declarar grafos de tareas, todos los componentes liberados bajo Apache 2.0, y un nuevo motor de orquestación llamado Orion, entre otras.

Twitter avatar for @PrefectIO
Prefect @PrefectIO
We have an official Prefect 2.0 release, and it's graduating to beta!

👩‍💻 Finally, Code as Workflows 👉 Apache 2.0, top to bottom 🤓 Ephemeral API ⛰️ Streaming use cases 💻 Brand new UI, included

More on how Prefect 2.0 helps you orchestrate your stack: prefect.io/blog/introduci…

prefect.ioIntroducing Prefect 2.0Love your workflows again.
6:59 PM ∙ Mar 15, 2022
64Likes19Retweets

Streamlit 1.8.0, con algunas mejoras de rendimiento introducidas después de la adquisición por parte de la empresa Snowflake. Streamlit es una solución para dashboards interactivos muy fácil de usar.

Stumpy 1.11.0, una biblioteca Python para análisis de series temporales utilizando una técnica llamada el perfil matricial (matrix profile), que trae una implementación de la distancia de Minkowski entre otras mejoras.

Twitter avatar for @stumpy_dev
stumpy @stumpy_dev
🎉 We’re happy to announce the release of STUMPY v1.11.0! This version includes the oft requested Minkowski (p-norm) Distance, support for Multi-dimensional Motif Discovery, new Annotation vector tutorials, and enhancements for Pan Matrix Profiles! #PyData github.com/TDAmeritrade/s…
github.comstumpy/CHANGELOG.md at main · TDAmeritrade/stumpySTUMPY is a powerful and scalable Python library for modern time series analysis - stumpy/CHANGELOG.md at main · TDAmeritrade/stumpy
1:05 PM ∙ Mar 22, 2022
26Likes4Retweets

Y por último, primera versión pública de sarsen, una biblioteca Python para procesar imágenes de radar de apertura sintética (SAR). La ventaja distintiva del SAR es que atraviesa las nubes, cosa que los satélites de observación óptica no pueden hacer.

Twitter avatar for @alexamici
Alessandro Amici @alexamici
I’m thrilled to announce the first public release of Sarsen, Open Source algorithms to process SAR satellite data in Python by @bopensolutions. It supports geocoding and gamma flattening Sentinel-1 data on any DEM, partly sponsored by @Microsoft github.com/bopen/sarsen 🧵 1/4
Image
11:00 PM ∙ Mar 21, 2022
689Likes160Retweets

💡 Si en el episodio anterior hablábamos de SHAP, esta semana LinkedIn ha liberado FastTreeSHAP, una implementación de los mismos algoritmos de una manera mucho más eficiente.

También he descubierto en el Journal of Open Source Software una biblioteca llamada PyNumDiff, para diferenciación de series de tiempo ruidosas.

Y por último, si quieres aplicar reformateadores de código a tus notebooks tipo black e isort, ¡echa un vistazo a nbqa!

Twitter avatar for @marlene_zw
Marlene Mhangami @marlene_zw
If you’re using a Jupyter Notebook and want to automatically format, check or upgrade the code in your notebook you can do this using a #Python package called nbqa 🐍✨

#nbqa supports black, flake8, isort, mdformat and others! Run pip install nbqa 💕

Image
12:00 PM ∙ Mar 22, 2022
217Likes38Retweets

📚 En este artículo los creadores de Modin dan los detalles matemáticos de cómo paralelizaron más de 600 funciones de pandas, mejorando su rendimiento notablemente. ¡Con muchas ganas de probarlo!

Por otro lado, este artículo interactivo explica con todo lujo de detalles las diferencias entre precisión y exhaustividad (recall).

Twitter avatar for @jdwlbr
Jared Wilber @jdwlbr
New article on Precision, Recall, and the F1-score in #MachineLearning, built with @sveltejs and @d3js_org!

mlu-explain.github.io/precision-reca…

#Datavisualization #rstats #scicomm

5:21 PM ∙ Mar 21, 2022
398Likes86Retweets

🤔 Cuando pides los datos de una publicación científica a veces te llevas respuestas bastante cuestionables, ¡incluso cuando la revista obliga! Mucho trabajo por hacer.

Twitter avatar for @sTeamTraen
Nick Brown @sTeamTraen
When you ask the authors of articles in Science® to share their data, which the journal told you was mandatory when you submitted your article, the response very often boils down to GFY. doi.org/10.1073/pnas.1…
Image
Image
10:43 PM ∙ Mar 15, 2022
4,079Likes966Retweets

¿Tendrá algo que ver con que el valor p de corte que casi siempre se usa, 0.05, es totalmente arbitrario y tiene un origen más bien prosaico?

Twitter avatar for @emollick
Ethan Mollick @emollick
😱Why do we use p<.05 as a statistical cut-off for whether a scientific result is significant?

Because a statistician writing in a textbook in the 1920s was prevented by copyright restrictions from using continuous p-values, so he just came up with the cut-off to sell books!

Twitter avatar for @brentdg2
(((Brent Goldfarb))) @brentdg2
Actually, there IS a reason.

https://t.co/jxAB4TCYPf https://t.co/4r5HJoRQup https://t.co/JfLqm30Szm

5:32 PM ∙ Mar 13, 2022
3,208Likes1,044Retweets

Y tú, ¿te has encontrado algún estudio justificando lo imposible con un valor p cerquísima de 0.05? ¡Cuéntanoslo en un comentario!

Leave a comment

You just read issue #17 of Noticiero Python y Datos. You can also browse the full archives of this newsletter.

Share on LinkedIn
GitHub LinkedIn
Powered by Buttondown, the easiest way to start and grow your newsletter.