Talend est un outil ETL (Extract, Transform, Load) openSource, qui permet, à partir de sources de données diverses, d'alimenter des bases de données ou de générer des fichiers d'export. Il est particulièrement riche et puissant, et peut supporter les opérations sur des composants géographiques avec un module d'extension.
Si une formation est quasi-indispensable pour commencer à travailler avec ce produit, il n'est pas superflu d'avoir sous la main le nom des principaux composants utilisables. Cette liste est donc alimentée au fur et à mesure des besoins...
tMap
: composant de base, qui permet de gérer les entrées et les sortiestSampleRow
: permet de limiter la sortie à quelques enregistrements (utile pour les tests)tPostgresSqlRow
: exécute une commande SQL, sans gestion du retourtPosgresSqlInput
: module permettant de lire une table, mais également d'exécuter une commande SQL, en récupérant les données fournies (à l'inverse du module précédent)tFilterRow
: trie des enregistrementstUniqueRow
: supprime les lignes redondantes, par exemple avant un inserttNormalize
: éclate un champ en n lignes, en prenant comme séparateur le caractère spécifiétMsgBox
: affiche un message à l'utilisateur. Permet notamment d'interagir avec celui-ci, par exemple pour lui faire saisir une informationAttention : deux catégories de modules sont définis :
geoOperation
: permet de manipuler les objets géographiquesgeometryOperation
: crée de nouveaux objets géographiquesQuelques modules :
sDissolver
: permet de fusionner des polygones, en indiquant le champ utilisé pour la fusiontAggregateRow
: module non spécifiquement géographique, mais qui permet de regrouper des objets, par exemple pour appliquer ensuite un calcul de tampon (rechercher tous les bâtiments situés à moins de 10 mètres d'une rivière, par exemple)sBufferCalculator
: calcule un buffer, c'est à dire une zone située de part et d'autre d'un objet géographique (notion de recherche de proximité)Complétion automatique des objets : ctrl + espace
Le tableau d'origine est de la forme :
| attribut | cle1 | cle2 | cle3 |
| A1 | 1 | 2 | 3 |
| A2 | 4 | 5 | 6 |
| A3 | 7 | 8 | 9 |
| A4 | 10 | 11 | 12 |
et il faut obtenir des enregistrements de la forme :
cle1 - A1 - 1
cle1 - A2 - 4
cle2 - A1 - 2
cle2 - A2 - 5
etc.
Méthode utilisée :
La commande substring permet d'extraire la valeur de part et d'autre du signe =