A composite Kernel to Extract Relations between Entities with both flat and structured features Zhang, M. et al. [2006] [25] [PDF] Muy bueno. Dicen que son los primeros que usan convolution kernels para extraer relaciones. La idea es combinar dos kernels, uno de features relacionadas con la entidad, y otro un convolution parse tree kernel para modelar las relaciones. Evalúan en el ACE corpus, y le ganan a todo el mundo. La idea es que puede extenderse, porque se pueden seguir combinando. El related-work está bueno, porque habla de técnicas por reglas, feature-based, kernel-based. Y lo sdiscuten interesante. Por ejemplo para los feature-base, critican que son flat, y que las features hay que elegirlas con couidado. Luego vienen los kernel based, y los tree. El problema que le ven a los presentados hasta el momento es que tienen bajo recall, y creen que es porque requieren que los dos paths, al comparar, tengan el mismo largo. Ellos levantan la restruicción. Definen dos kernels: un entity kernel que cuenta las features comparando entidad1 de la r1 con entidad 2 de la r2, entidad 1 de la r1 con entidad1 de la r2, etc. Y sumando las features. Las features son : entity headword, entity type y subtype, mention type. El otro es un convolution parse tree kernel (el de collins y duffy), que cuenta el número de subárboles comunes como similutd sintáctida entre dos relaciones. Los combinan en dos formas: lineal y por expansión polinomial (que busca explorar las features de birgramas, especialmente las features combinadas de las primeras y segundas entidades.): Muestran que sigue esto siendo un kernel (Collins and Duffy). Para los espacios de instancias de relaciones definen: el minimum complete tree, path-enclosed tree, y context-sensitive path tree y sus versiones achatada. Curiosamente, los mejors resultados lo logra el path-enclosed tree. Parece que los otros agregan ruido. Usan una estrategia one vs others, usan SVM y se quedan con el de mayor margen.Los parámetros de entrenamiento son elegidos usando cross validation. Resultados: 61.9 F para el path-enclosed tree, sólo con el tree kernel. Con los composite kernels esto se dispara a 70.9 sobre el ACE 2003, y 72.1 sobre el ACE 2004. Le ganan a los otros (usar para comparar). Hacen un análisis muy interesante de por qué son mejores. Leer bien. Sugieren mejorar. Este es el mejor paper que he leído. |