Cristian Cardellino

Procesando Datos con Spark (y IV) - Corriendo una aplicación con PySpark

^{_{(Post original en
Medium.
Esto es para archivo.)}}

Finalizando (al menos por ahora) esta entrega de artículos de introducción a Spark, haré muestra de cómo podemos hacer para crear (y correr) una aplicación con PySpark y Python.

March 15, 2019

Procesando Datos con Spark (II) - Análisis y visualización

^{_{(Post original en
Medium.
Esto es para archivo.)}}

Siguiendo con esta serie de artículos sobre como trabajar con Spark, luego de haber cargado y limpiado los datos, procedemos a hacer algo de análisis sencillo de datos y visualización de los mismos utilizando las herramientas provistas por Apache Zeppelin.

January 14, 2019

Procesando Datos con Spark (II) - Carga y limpieza de datos

^{_{(Post original en
Medium.
Esto es para archivo.)}}

Siguiendo con esta serie de artículos de divulgación sobre ciencia de datos, ya pudimos instalar y configurar nuestro entorno para Apache Zeppelin. El siguiente paso será hacer algo de análisis de datos “real” con Spark y Zeppelin. Para ello, vamos a arrancar con lo básico para hacer análisis de datos: veremos el código básica para cargar los datos y limpiarlos (también conocido como ETL o “extract, transform and load” en la jerga).

December 21, 2018

Procesando Datos con Spark (I) - Configurando Apache Spark y Apache Zeppelin

^{_{(Post original en
Medium.
Esto es para archivo.)}}

Hola a todos y gracias por tomarse un tiempo para leer mi artículo. A diferencia de todo lo anterior que he publicado (que está relacionado a mi trabajo), este será el primero de una serie de recursos para aprender ciencia de datos en español.

December 19, 2018

Python with ggplot

Jupyter Notebooks combining Python and R

^{_{(Original post available at
Medium.
This is for archiving.)}}

Disclaimer: This post assumes you have some familiarity with ggplot2 (and, of course, Python, R, and Jupyter). If you need a quick catch up with the ggplot2 library I recommend ZevRoss cheatsheet.

December 04, 2018

Cristian Cardellino

Notes of a Computer Scientist

Procesando Datos con Spark (y IV) - Corriendo una aplicación con PySpark

Procesando Datos con Spark (II) - Análisis y visualización

Procesando Datos con Spark (II) - Carga y limpieza de datos

Procesando Datos con Spark (I) - Configurando Apache Spark y Apache Zeppelin

Python with ggplot

Jupyter Notebooks combining Python and R

Cristian Cardellino

Notes of a Computer Scientist