Feedback

Faculté des Sciences appliquées
Faculté des Sciences appliquées
Mémoire
VIEW 78 | DOWNLOAD 162

Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts

Télécharger
Duchateau, Jakub ULiège
Promoteur(s) : Debruyne, Christophe ULiège ; Duquenne, Frédéric
Date de soutenance : 26-jui-2023/27-jui-2023 • URL permanente : http://hdl.handle.net/2268.2/17649
Détails
Titre : Master thesis : On the Design and Implementation of an ETL Configuration DSL for Non-programming Experts
Auteur : Duchateau, Jakub ULiège
Date de soutenance  : 26-jui-2023/27-jui-2023
Promoteur(s) : Debruyne, Christophe ULiège
Duquenne, Frédéric 
Membre(s) du jury : Fontaine, Pascal ULiège
Boigelot, Bernard ULiège
Langue : Anglais
Mots-clés : [en] ETL
[en] Extract-Transform-Load
[en] Domain Specific Language
[en] DSL
[en] Design
[en] Usability
Discipline(s) : Ingénierie, informatique & technologie > Sciences informatiques
Organisme(s) subsidiant(s) : FundProcess
URL complémentaire : https://gitlab.uliege.be/etlang/etlang
https://etlang.gitlabpages.uliege.be/etlang/
Institution(s) : Université de Liège, Liège, Belgique
Diplôme : Master en sciences informatiques, à finalité spécialisée en "computer systems security"
Faculté : Mémoires de la Faculté des Sciences appliquées

Résumé

[en] Extract-transform-load (ETL) tools are used in the business to ingest external data into their operational database. The design of an ETL process can be achieved through either code and libraries or a graphical tool featuring a graph of operations. However, the former is only accessible to programmers, while the latter lacks extensibility.
This thesis proposes an approach to ETL configuration, based on a projectional domain-specific language (DSL), implemented with JetBrains MPS, and targeting ETL.NET.
The ETL process is designed using a language that represents data as tables manipulated through sequences of operations. A prototype implementation is evaluated with a small user study, which shows that the DSL is accessible to non-programmers, and programmers prefer it over a tool based on graphs.

[fr] Les outils Extract-Transform-Load (ETL) sont utilisés dans les entreprises pour importer des données externes dans leur base de données opérationnelle. La conception de processus ETL, se fait principalement avec du code textuel et des bibliothèques logicielles ou avec des interfaces graphiques présentant un graphe d'opérations. La première convient bien aux programmeurs tandis que la seconde est plus difficile à étendre en fonctionnalité.
Nous proposons ici une méthode intermédiaire basée sur un langage de programmation spécifique (DSL) projectionnel, implémenté avec JetBrains MPS, et intégré à ETL.NET.
Le processus ETL est exprimé dans un langage qui modélise les données sous forme de tableaux qui sont transformés avec des séquences d'opérations. Le prototype est évalué avec une petite étude utilisateur, qui montre que le DSL est accessible aux non-programmeurs, et que les programmeurs le préfèrent à une interface basée sur des graphes.


Fichier(s)

Document(s)

File
Access ETLang_Jakub_Duchateau_thesis.pdf
Description:
Taille: 1.45 MB
Format: Adobe PDF
File
Access ETLang_Jakub_Duchateau_abstract.pdf
Description:
Taille: 38.31 kB
Format: Adobe PDF

Auteur

  • Duchateau, Jakub ULiège Université de Liège > Master sc. informatiques, à fin.

Promoteur(s)

Membre(s) du jury

  • Fontaine, Pascal ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes informatiques distribués
    ORBi Voir ses publications sur ORBi
  • Boigelot, Bernard ULiège Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Informatique
    ORBi Voir ses publications sur ORBi
  • Nombre total de vues 78
  • Nombre total de téléchargements 162










Tous les documents disponibles sur MatheO sont protégés par le droit d'auteur et soumis aux règles habituelles de bon usage.
L'Université de Liège ne garantit pas la qualité scientifique de ces travaux d'étudiants ni l'exactitude de l'ensemble des informations qu'ils contiennent.