🐻❄️ Ya se terminó la PyData de NYC, y estoy contento de humildemente haber contribuido al que creo que fue uno de los temas clave del evento: ¿qué hay más allá de pandas? Mi charla sobre Polars (la primera dada por alguien que no es su autor, Ritchie Vink) estaba hasta la bandera, la charla Gil Forsyth (Voltron) sobre Ibis fue impecable, y Jeff Reback, mantenedor de pandas desde hace casi una década, explicó con todo lujo de detalles la actual situación del proyecto y el futuro que le espera.
Para resumir: ¡no tienes que preocuparte del futuro de pandas! El proyecto sigue adelante y la idea es ir haciendo mejoras incrementales. Mientras tanto, hay un esfuerzo coordinado por promocionar Ibis como una capa de abstracción por encima de pandas, que al mismo tiempo pueda comunicarse con diferentes backends. Esta es la diapositiva clave:
No obstante, el diagrama está incompleto: Ibis tiene montones de backends, y el punto fuerte del proyecto es que es capaz de traducir código Python a consultas SQL.
En mi opinión, y a falta de probar Ibis en profundidad (¡lo voy a hacer la semana que viene!), mi sensación es que para manipulación de datos “de última milla” y operaciones difíciles de expresar en SQL, pandas va a seguir siendo ampliamente utilizado y Polars va a ganar cada vez más terreno.
🔥 GitHub Codespaces acaba de lanzar soporte para JupyterLab, con 60 horas gratuitas de uso al mes, e incluso van a ofrecer GPUs. Teniendo en cuenta el auge de demanda de GPUs en la nube por la proliferación de modelos generativos, los cambios en la estructura de precios de Google Colab, y que Colab siempre fue un fork ligeramente incompatible de Jupyter, esto puede traer consecuencias muy interesantes.
Codespaces for everyone - up to 60hrs free/month - 1-click deploy from repo (.devcontainer file) - Templates = preview without forking, faster explore - Editor = VS Code, IntelliJ, Jupyter🎉
💡 En la charla de Jeff descubrí que hay unas cuantas extensiones de pandas. Las que me han parecido más interesantes son moneypandas, pandas-genomics, pandas-path, y Pint-Pandas.
Y siguiendo con pandas, he descubierto Pynk, una herramienta que reescribe tu código para usar métodos encadenados en vez de una secuencia de sentencias.
#Python #pandas
cc: @pandas_dev @mharrison
Y por último, también he descubierto sklearn-evaluation, una biblioteca con utilidades para evaluar y comparar modelos de scikit-learn.
💸 La Chan Zuckerberg Initiative, establecida por el creador de Facebook y su esposa Priscilla Chan, anunció diversas becas otorgadas a proyectos del ecosistema Python. Entre los proyectos agraciados están SciPy, Bokeh, CuPy, Spyder, y muchos más. Además, la organización Scientific Python, que coordina tareas comunes entre proyectos, ha recibido una financiación especial por dos años que irá destinada a mejorar el aspecto y la accesibilidad de la documentación, agregar interactividad, traducir ciertas páginas clave, y más.
💼 La gente de 2i2c, organización que opera entornos JupyterHub para comunidades educativas y de investigación, busca Open Source Infrastructure Engineer, preferiblemente para trabajar en la zona horaria de US/Pacific, $120 000 - $130 000.
🏎️ En el Telegram de Python Científico ayudamos a un usuario a reducir el volumen de sus datos un 85 % y arreglar varios problemas de serialización pasando de CSV a Parquet. ¡La satisfacción del trabajo bien hecho!
Twitter se está yendo un poco al garete así que lo estoy apostando todo al Fediverso. ¡Sígueme en https://social.juanlu.space/@astrojuanlu!