Jan. 13, 2023, 9:19 a.m.

Episodio 61 🐍⚙️

Noticiero Python y Datos

Estamos en el segundo noticiero del año y ya tengo exceso de enlaces, he tenido que comprimir y sintetizar bastante. ¡Vamos allá!

🚀 Ha salido Ibis 4.0, con varios nuevos backends incluyendo Polars y Snowflake, nuevos métodos read_csv y read_parquet para lectura de datos más sencilla, mayor granularidad para extraer elementos de campos JSON, y mucho más. Si estás buscando una capa de abstracción en Python sobre SQL, no te pierdas este proyecto.

También tenemos Fugue 0.8, y me gusta mucho cómo Kevin ha contado en LinkedIn la forma en la que han escuchado a los usuarios para hacer el proyecto más fácil de usar. Incluye varias funciones nuevas para lectura y escritura de datos y varias pequeñas mejoras de usabilidad.

No alternative text description for this image

💡 Esta semana he descubierto bastionlab, un framework para mantener la privacidad de los datos al hacer análisis exploratorios.

Y Toni Almagro me comenta por LinkedIn (¡gracias!) sobre snorkel, un proyecto (tristemente abandonado en octubre del año pasado) para generar datos de entrenamiento con supervisión débil.

📚 Martxelo nos comparte en el grupo de Telegram de Python Científico cómo ha utilizado la nueva funcionalidad de scikit-learn 1.2 de mantener los nombres de las columnas.

Me ha explotado la cabeza con este análisis de retención de cohortes de Juan Orduz utilizando PyMC. Si trabajas en una startup de producto, esto es lectura obligada: te ayudará a entender si estás encontrando product market fit o no de una forma rigurosa.

Como a lo mejor ya sabrás, me encanta todo lo que tiene que ver con la paquetería en Python, y he dado algunas charlas sobre ello. Una de las personas que más ha empujado para mejorar la experiencia de desarrollo en este área es Ralf Gommers, histórico mantenedor de NumPy y SciPy. En este artículo desgrana con mucho acierto cuál es el futuro de la paquetería en Python, enlaza algunas conversaciones muy relevantes que están teniendo lugar ahora mismo, y expone con precisión los problemas a los que se ha enfrentado la comunidad científica en este aspecto. Por cierto, si quieres empaquetar una biblioteca Python que también incluya código compilado con C++, Rust o similares, no te pierdas esta guía del mismo autor.

A diagram of a workflow tool named pyp. The diagram has three swim
lanes, with the first one showing the pyp commands, the second one showing
the underlying tool it wraps (e.g., pip or pytest), and the third one
shows alternative tools that can perform the same job as the default tool
(e.g., mamba or spack instead of pip).

Y por último, me ha encantado este resumen del crecimiento de Python en el ámbito geoespacial.

No alternative text description for this image

📣 ¡El jueves que viene tenemos reunión de PyData Madrid con la gente maja de KSchool! Hablaremos de drones conectados y de interpretabilidad. ¿Te veo allí?

Y por si fuera poco, ¡se acaba de anunciar la primera reunión de PyData Granada! Si vives por la zona, tienes una cita el 1 de febrero.

Twitter avatar for @PyDataGRX
PyData Granada @PyDataGRX
¡Empezamos! ¡Nuestro primer meetup contará con dos pedazo de ponentes! @mrcabellom Cómo sacar el máximo partido a tus nubes de puntos utilizando IA @andreamorgar ¿Cómo procesar datos textuales? 📅 1 Febrero. 19:00 🗺️ Cámara de Comercio +info e inscripción meetup.com/pydatagrx/even…
Cartel con información del evento y foto de ponentes. La información está en el texto del twitt.
4:13 PM ∙ Jan 10, 2023
20Likes13Retweets

🤡 Parece que algunos equipos académicos excesivamente sinceros están añadiendo ChatGPT a la lista de autores de sus artículos… Más allá de lo divertido del asunto, pregunta provocadora: ¿no es ChatGPT una herramienta al mismo nivel que matplotlib o ggplot2 para las gráficas por ejemplo? ¿Qué opinas?

Twitter avatar for @rasbt
Sebastian Raschka @rasbt
Here we go. I guess that ship has sailed. Researchers started adding ChatGPT as co-author on their papers 🫣

PS: Dear researchers, you forgot the version number!

medrxiv.org/content/10.110…

(thx @3scorciav for sharing this!)

Image
Twitter avatar for @rasbt
Sebastian Raschka @rasbt
Re: ChatGPT and authorship.

If a person creates or contributes results for a paper, this person is a coauthor. But this naturally doesn’t extend to models or algorithms.

Imagine AlphaFold were an author on the AlphaFold paper.

So, why would/should it be different for ChatGPT?!

9:41 PM ∙ Jan 12, 2023
264Likes51Retweets

¿Buscas proveedor de dominios y hosting bueno, bonito y barato para tu próximo proyecto? Llevo años con Dinahosting (enlace afiliado) y no me cambio por nada, el soporte 24 horas es 🔝, y son de Galicia 🇪🇸

You just read issue #52 of Noticiero Python y Datos. You can also browse the full archives of this newsletter.

Share on LinkedIn
GitHub LinkedIn
Powered by Buttondown, the easiest way to start and grow your newsletter.