Resources / Ressources
Tunisian TreeBank TTB
TTB est composé de 2.000 arbres syntaxiques:
928 phrases de la constitution tunisienne ,
1072 phrases du corpus STAC.
Cette version de la constitution tunisienne est bien segmentée et normalisée suivant la convention orthographique CODA-TUN.
Le système Stanford-TUN
Le modèle peut être utilisé en l'intégrant dans l'analyseur syntaxique Stanford.
Référence:
Asma Mekki, Inès Zribi, Mariem Ellouze et Lamia Hadrich Belguith, « Treebank creation and parser generation for Tunisian Social Media text », The 17th ACS/IEEE International Conference on Computer Systems and Applications (AICCSA 2020), Antalya, Turkey, 2020.