Cristian Cardellino
Notes of a Computer Scientist
Featured
Spanish Billion Words Corpus and Embeddings
So, a year and a half since my last post. Even if I kind of update my page to be a blog from the root, shame on me.
This blog post however is not something related to what I did in the previous ones. I promise someday I will continue with my Python to Scala tutorials, but for now you’ll have to settle with this.
Since I am a PhD Student in Natural Language Processing and a native speaker of the Spanish language, I like to do my research in this language. The problem is that Spanish, unlike English, doesn’t...
Regular
Contra la mil cabezas de la Hidra: ¿Cómo llevar registro de experimentos con ayuda de MLFlow y Hydra?
En esta charla para la primera Data Sessions de la comunidad DataAr doy una introducción a dos herramientas fundamentales para mi: MLFlow y Hydra y explico mi framework de experimentación alrededor de estas herramientas para mi trabajo de investigación.
La charla cuenta de un repositorio con el notebook y el código de la charla y un video.
Aprendizaje automático sin saber programación
En este artículo intentaré introducir algunos conceptos de aprendizaje automático, conocido en inglés como machine learning (literalmente aprendizaje de máquina), de manera que no requiera tener conocimientos de programación para entenderlo.
Esto no quiere decir que quienes estén dentro de la informática no puedan beneficiarse de lo que explicaré aquí, pero no me adentraré en detalles sobre programación de algoritmos de aprendizaje automático.
La idea principal de este artículo es explicar el aprendizaje automático de una manera didáctica y que sea entendible para quién le interese saber algo más del asunto, desmitificando un poco todo aquello que hay alrededor.
Buscaré explicar en dos niveles, al principio iré por algo más general, explicando conceptos como regresión y clasificación desde un punto de vista puramente coloquial. Pero además, para quién quiera entender un poco más, buscaré dar una explicación un tanto más técnica, tratando de utilizar conceptos matemáticos que deberían verse durante la escuela secundaria (el equivalente argentino a la preparatoria o el bachillerato).
Embeddings 101: ¿Cómo representamos las entidades en machine learning?
En esta charla que di para el nerdear.la 2021, doy una introducción a los embeddings, herramientas fundamentales en el machine learning, y explico un poco cómo surgen y para que se utilizan.
Desmitificando PLN
Otra charla online, esta vez para el Google Developer Group de Córdoba, donde me extiendo un poco más en el detalle de que son los modelos de lenguaje, los embeddings y finalmente que es GPT-3.
Charlando con máquinas
Les dejo una charla que di online para el Instituto María Justa Moyano de Ezpeleta, donde hablo un poco de qué es el Procesamiento de Lenguaje Natural, y cómo lo utilizamos en el día a día aunque no nos demos cuenta de ello.