Accéder aux documents contenus dans une bibliothèque SharePoint comme source de données pour Azure Data Factory – Partie 1

Dans cette série d’articles, nous verrons comment accéder aux documents contenus dans une bibliothèque SharePoint comme source de données pour Azure Data Factory. Azure Data Factory permet en standard de charger les données issues des listes SharePoint. Mais ici, je vais détailler comment lire les données de fichiers Excel et/ou CSV contenus dans une bibliothèque SharePoint car la procédure n’est pas aisée.

Comme cette procédure n’est pas en standard dans Azure Data Factory, les étapes à réaliser sont nombreuses et il est important de les suivre attentivement.

Voici les différentes étapes à réaliser

  1. Enregistrer une application dans Azure Active Directory (cet article)
  2. Enregistrer les éléments de l’application enregistrée dans un Azure Key Vault
  3. Créer un environnement Azure Data Factory
  4. Donner les droits d’accès dans le site SharePoint
  5. Créer le pipeline pour récupérer les informations contenues dans un document
  6. Bonus : accéder à une série de documents dans la bibliothèque SharePoint (article à venir)

Dans un premier temps, il est nécessaire de créer une inscription d’application. Cette inscription sert de lien par rapport aux droits entre SharePoint et Azure Data Factory. Plus précisément, nous déclarerons les droits d’accès dans SharePoint et l’identité à prendre dans Azure Data Factory.

Cette inscription se fait dans Azure Active Directory (AAD). Pour cela, soit l’inscription d’application est possible pour tous les utilisateurs, soit il faut disposer à minima des rôles sur AAD (à ne pas confondre avec les droits sur les abonnements et/ou groupes de ressources Azure) « Application Developer », « Cloud Application Administrator » ou « Application Administrator ».

Depuis Azure Active Directory, il faut sélectionner l’option « Inscription d’applications » et ensuite cliquer sur « Nouvelle inscription ».

Accès à l'inscription de l'application
Accès à l’inscription de l’application

Il est nécessaire de choisir le nom de l’application inscrite.

Définition de l'application inscrite
Définition de l’application inscrite

Une fois l’inscription de l’application réalisée, il est nécessaire de noter les trois éléments suivants :

  • Le nom de l’annuaire (disponible sur la première page de l’AAD)
  • L’ID de l’annuaire ou « Tenant ID » (disponible sur la première page de l’AAD mais aussi repris sur la première page de l’inscription de l’application)
  • L’ID d’application ou client
Recopier les identifiants nécessaires pour la suite
Recopier les identifiants nécessaires pour la suite

L’étape suivante est de créer un Secret client.

Création d'un secret
Création d’un secret

A cette étape, il faut définir la description du secret ainsi que sa durée.

Définition du secret
Définition du secret

Une fois, le secret créé, il faut noter la valeur du secret.

Recopie de la valeur du secret
Recopie de la valeur du secret

A l’issue de l’inscription de l’application, nous avons noté quatre valeurs dont nous aurons besoin plus tard.

Les 4 valeurs à conserver
Les 4 valeurs à conserver

Bien à vous.

Rechercher

A propos de l’auteur

Spécialiste certifié Microsoft BI (SQL Server et Azure), Philippe Geiger accompagne aussi bien les professionnels en infrastructure que les développeurs BI. Maîtrisant tous les aspects de la plateforme Data de Microsoft, il assure également, en sa qualité de formateur certifié, les formations officielles de Microsoft. Par ailleurs, il est Directeur des Activités Grand-Est chez Metsys, société « Pure Player » Microsoft.

Les derniers tweets

Certifications

Microsoft Certified: Power BI Data Analyst Associate
Microsoft Certified: Azure AI Engineer Associate
Microsoft Certified: Azure Fundamentals
Microsoft Certified: Azure Data Fundamentals
MCSE: Data Management and Analytics — Certified 2018
MCSA: SQL 2016 Database Administration - Certified 2016
MCSA: SQL Server 2012/2014 - Certified 2016
Microsoft Certified: Azure Data Engineer Associate
Microsoft Certified: Azure Database Administrator Associate
Microsoft Certified: Power Platform Fundamentals
Microsoft Certified Trainer 2022-2023
MCSE: Data Management and Analytics — Certified 2016
MCSA: SQL 2016 Database Development - Certified 2016
MTA: Database Fundamentals - Certified 2016
Microsoft Certified: Azure Data Scientist Associate
Microsoft 365 Certified: Fundamentals
Microsoft Certified: Azure AI Fundamentals
Exam 473: Designing and Implementing Cloud Data Platform Solutions
MCSA: SQL 2016 Business Intelligence Development - Certified 2016
MCSA: BI Reporting - Certified 2018

Archives