Proiectul: DarkWebIdentity
Identificarea autorului, coreland texte provenind din Web și DarkWeb, cu scopul asigurarea securității cibernetice
Identificarea autorului, coreland texte provenind din Web și DarkWeb, cu scopul asigurarea securității cibernetice
În această etapă a proiectului ne-am concentrat pe a treia și a patra activitate, care au presupus cercetarea și
construirea de modele pentru sarcinile de verificare, identificare și profilare a autorului. Experimentele au fost
de succes și am reușit să transferăm informații din seturi de date clasice către cele specifice Darkweb.
Am publicat o lucrare la o conferință de rang A, cu rezultate de ultimă generație (diseminarea pe scară largă a
metoda prezentată în secțiunea 2). Am pregătit, de asemenea, o a doua lucrare care este în curs de revizuire (B) și
se lucrează în prezent la a treia abordare (C).
Lucrăm, de asemenea, la îmbunătățirea actualei metode de distilare a funcțiilor kernel pentru profilarea autorului.
Activitatea 2.1 Colectare corpus din PAN@CLEF.
Status implementare: 100%
Rezultat: Aggregated datasets, with new splits proposed
for eliminating biases
https://github.com/fbrad/darwin
____________________________________________________________
Activitatea 2.2 Construire corpus din platforme de socializare/forumuri
Status implementare: 100%
Rezultat: Extracted from reddit
https://github.com/fbrad/darwin
____________________________________________________________
Activitatea 2.3 Construire corpus din DarkWeb
Status implementare: 100%
Rezultat: Extragere corpus din forumuri DarkWeb
____________________________________________________________
Activitatea 3.1 Distilare funcții kernel în rețele
siameze
Status implementare: 50%
Rezultat: Testing the distillation for authorship profiling task.
____________________________________________________________
Activitatea 3.2 Căutare în spațiul rețelelor
siameze (și a altor arhitecturi)
Status implementare: 90%
Rezultat: Working to improve the performance for the kernel distillation models.
____________________________________________________________
Activitatea 4.1 Implementare modele pentru verificarea autorului
Status implementare: 100%
Rezultat: Paper B, C from Section 2 proposes direct methods for this purpose. We also tested the model proposed in A for this task with lower than state-of-the-art results.
____________________________________________________________
Activitatea 4.2 Implementare modele pentru identificarea autorului
Status implementare: 100%
Rezultat: We applied the model proposed in paper A and B for identifying authors on the Koppel dataset (https://www.jmlr.org/papers/v8/koppel07a.html).
____________________________________________________________
Activitatea 4.3 Implementare modele pentru
profilarea autorului
Status implementare: 50%
Rezultat: We currently test the siamese kernel distillation for this task.
____________________________________________________________
Activitatea 7.1 Diseminarea rezultatelor
Status implementare: 70%
Rezultat:
- 2 polished papers (one accepted and one
under review at rank A venues)
- 2 best paper/poster awards
- Work presented at Workshop at A*
venue, Summer school, reading groups,
scientific communication session, deep
learning meetup.
____________________________________________________________