Es posible que ya sepas qué es snowflake , pero aún no has puesto manos a la obra con esta herramienta, es por eso que hoy vamos a analizar cómo preparar los datos con Snowflake .

Mostraremos cómo se puede utilizar esta plataforma para preparar sus datos y qué sintaxis utilizar para obtener la salida deseada. Este post se centrará en los pasos realizados para preparar datos dentro de Snowflake.

Saber qué preguntas hacer es clave

En este análisis, los datos de referencia pertenecen a una agencia editorial ficticia en la que, a través de una Base de Datos compuesta por varias tablas, se catalogan todos los libros vendidos. Nuestro objetivo será comprobar si los libros que han sido premiados son también los más vendidos y los que tienen mejores críticas.

¿Cómo preparar los datos?

Para preparar los datos con Snowflake, en primer lugar, tras iniciar sesión, asegúrese de que ha seleccionado el Almacén, la Base de Datos y el Esquema que desea consultar: encontrará el menú resumen en la esquina superior derecha, debajo de su nombre de usuario. Si no, puede indicarlo en la propia consulta.

Utilizando el menú de la izquierda, podemos ir al diagrama donde se encuentran las tablas y, seleccionando la que nos interese, podremos ver sus detalles en la parte inferior izquierda y la vista previa pulsando en «Preview Data». De esta forma podremos hacernos una idea de las claves de unión necesarias para unir las distintas informaciones.

Tras una breve vista previa de las tablas que necesitaremos, podemos empezar a escribir nuestra consulta: usando SELECT llamaremos a las columnas que nos interesen desde la tabla_esquema.tabla_nombre, y, como en el caso de abajo, si queremos hacer una agregación (como la media de las reseñas) tendremos que llamar a la fórmula usando un AVG() con una fórmula adicional dentro que convierta el campo originalmente STRING a NUMERIC, reasignándole posteriormente un alias usando la fórmula AS.

A continuación, tendremos que decirle al software de dónde obtener los datos, y a través de FROM citaremos la primera tabla de origen que luego, a través de JOIN, fusionaremos con las otras 4 afectadas: BOOK, AWARD, RATINGS y CHECKOUTS

Por último, podemos filtrar nuestra consulta mediante WHERE solicitando ver sólo aquellas filas en las que el número de ejemplares vendidos supere los 20.000 y cuyas reseñas sean superiores a 3,5.

Terminamos agrupando por todas las columnas que nos interesan y ordenando por el número de ejemplares vendidos.

Los datos, una vez ejecutada la consulta, serán visibles en el panel de resultados de la parte inferior, junto con más información relativa a la consulta y la posibilidad de descargar la tabla.

Si tiene más preguntas sobre Snowflake, póngase en contacto con nosotros en info@theinformationlab.es

Esperamos que este artículo le haya intrigado y le haya ayudado a comprender cómo preparar datos con Snowflake.

Esperamos volver a verle para compartir más consejos.

Algunos otros links que pueden llamar su atención sobre snowflake:

¿Qué estás buscando?

¿Quién trata tus datos?

The Information Lab Spain, S.L.
(en adelante, “Titular“)

¿Por qué tratamos los datos que te pedimos?

Se tratan tus datos para poder prestarte los servicios solicitados. + info

¿Cuál es la legitimación para este tratamiento de tus datos?

Estos datos son necesarios para llevar a cabo la resolución de consultas que puedas plantearnos o para la prestación de los servicios que se hayan solicitado a través del Sitio Web. + info

¿Se van a hacer cesiones o transferencias con tus datos?

Tus datos no serán cedidos a terceras empresas. + info

¿Cuáles son mis derechos?

El interesado tiene derecho a ejercitar su derecho de:
Acceso, rectificación, supresión, oposición, portabilidad de los Datos, limitación del Tratamiento y a no ser objeto de decisiones automatizadas individualizadas. + info

¿Tienes dudas?

Tanto si tienes alguna o sugerencia como si quieres darte de baja ponte en contacto con nosotros enviando un email a la siguiente dirección: info@theinformationlab.es