Blog

Overview Azure Purview

synapse
Azure Purview

Overview Azure Purview

Problema:

¿Cómo realizar un data governance de tus datos en Azure?

Solución:

Hace poco se ha liberado el servicio Azure Purview, este servicio vendría a ser la evolución de Azure Data Catalog, y el cual nos brinda la posibilidad de tener un servicio robusto para todo lo relacionado a Data Governance. Para experimentar con este servicio nos vamos al portal de Azure y crearemos el servicio de Azure Purview:

En la siguiente ventana, podremos visualizar las características de configuración del servicio. Algunas de estas configuraciones están deshabilitadas porque este servicio está en preview:

Una vez dentro del servicio nos dirigimos a la opción de Register, esta opción nos permite registrar un nueva origen para realizar el gobierno del mismo:

En la ventana que nos aparecerá nos mostrar todos los orígenes de datos que están disponibles para realizar el governance, veremos inclusive orígenes que no son nativos de Azure, tales como S3 o Teradata:

En mi caso por ejemplo seleccionaré un Azure SQL Database, el cual me pide que lo asocie a una colección. Una colección es un grupo lógico el cual me permite agrupar algunos de estos orígenes que quisieramos escanear:

Una vez configurado nuestro origen de datos, nos dirigimos a la opción de New scan:

En esta opción tendremos que elegir la base de datos, y tambien indicar las credenciales hacia él. Algo importante aquí es que te exige la creación de Azure Key Vault para el manejo de credenciales:

Una vez ya configurado la base de datos, podremos seleccionar que tablas quisieramos escanear, esto es interesante ya que talvez podríamos indicarle no todas las tablas:

También tenemos la posibilidad de crear scan rule set, el cual me permite configurar algunas reglas (las cuales ya vienen configuradas en el servicio) para que pueda identificar tipo de datos dentro de nuestro dataset:

Finalmente, tendremos la posibilidad de indicarle una programación para realizar el escaneo, esto si nuestro servicio tiene de oirgen constantemente está cambiando y quisieramos tener siempre un glosario actualizado:

Si nos dirigimos a la página de inicio del Purview y colocamos por ejemplo un nombre de alguna tabla de nuestra bd, podremos tener una visualización como la que se muestra en la figura, en donde podremos ver el esquema de nuestra base de datos de las tablas que quisieramos visualizar:

Como hemos podido observar, este servicio nos brinda la posibilidad de escanear orígenes de datos y cuando tenerlos en un glosario para realizar más fácil sus búsqueda, así mismo tiene otras características que iremos explorando en futuros post como el tema de linaje de datos.

Espero que les haya gustado este post y nos vemos en otra ocasión.

Leave your thought here

Your email address will not be published. Required fields are marked *

Select the fields to be shown. Others will be hidden. Drag and drop to rearrange the order.
  • Image
  • SKU
  • Rating
  • Price
  • Stock
  • Availability
  • Add to cart
  • Description
  • Content
  • Weight
  • Dimensions
  • Additional information
  • Attributes
  • Custom attributes
  • Custom fields
Compare
Wishlist 0
Open wishlist page Continue shopping