Pasar al contenido principal

Main navigation

  • Sobre El ITEFI
  • Investigación
  • Formación y empleo
  • OpenLab
  • Servicios científico técnicos
  • Directorio

Improving LSTMs' under-performance in authorship attribution for short texts

authorship attribution
LSTM
Stylometry
Oliva. Christian; Palmero Muñoz, Santiago; Lago-Fernández, Luis F.; Arroyo Guardeño, David
Proceedings of the 2022 European Interdisciplinary Cybersecurity Conference
http://hdl.handle.net/10261/268091

We present a novel approach for conducting authorship attribution over tweets using Long-Short Term Memory networks (LSTMs). Vanilla LSTMs use the last hidden state for prediction. Our strategy introduces a mechanism based on Max Pooling to process all the hidden states simultaneously, which helps the model to better detect authors’ stylometry. We obtain a 4% accuracy improvement with respect to vanilla LSTMs.

ACKNOWLEDGEMENTS

This project has received funding from the European Union’s Hori zon 2020 Research and Innovation Programme under grant agreement No. 872855 (TRESCA project), as well as from Comunidad de Madrid (Spain) under the project CYNAMON (no. P2018/TCS- 4566), cofunded with FSE and FEDER EU funds, Spanish Government under project MINECO/FEDER PID2020-114867RB-I0, and Grant PLEC2021-007681 (project XAI-DisInfodemics) funded by MCIN/AEI/ 10.13039/501100011033 and by European Union NextGeneration EU/PRTR.

GiCSI

proyecto/s relacionado/s

  • IA explicable para desinformación y detección de conspiración durante infodemias. XAIDisInfodemics
    Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020, Programa Estatal de I+D+i Orientada a los Retos de la Sociedad (AEI)
  • Trustworthy, Reliable and Engaging Scientific Communication Approaches. TRESCA
    Programa HORIZONTE'2020 (UE)
  • Cybersecurity, Network Analysis and Monitoring for the Next Generation Internet. CYNAMON
    Plan Regional de Investigación Científica e Innovación Tecnológica (Comunidad de Madrid), Fondos Feder, Fondo Social Europeo
Departamento de Acústica y Evaluación No Destructiva (DAEND)
  • GAA: Grupo de Acústica ambiental
  • G CARMA: Grupo de Caracterización de materiales mediante evaluación no destructiva
  • ULAB: Ultrasonidos para el análisis de líquidos y bioingeniería
Departamento de Tecnologías de la Información y Las Comunicaciones (DTIC)
  • GiCP: Grupo de investigación en Ciberseguridad y Protección de la Privacidad
  • GICSI: Grupo de investigación en Criptología y Seguridad de la Información
    • LCQE: Laboratorio de Comunicaciones Cuánticas
  • PSUM: Grupo de Procesamiento de Señal en sistemas Ultrasónicos Multicanal
Departamento de Sensores y Sistemas Ultrasónicos (DSSU)
  • GSTU: Grupo de Sistemas y tecnologías ultrasónicas
  • NoySI: Grupo de Nanosensores y Sistemas Inteligentes
  • RESULT: Resonadores ultrasónicos para cavitación y micromanipulación
  • SENSAVAN: Grupo de Tecnología de Sensores Avanzados
  • QE: Electrónica Cuántica
Laboratorios
  • Laboratorio de Acústica
  • Laboratorio de Metrología Ultrasónica Médica (LMUM)
  • Laboratorio de Comunicaciones Cuánticas
  • Laboratory for International Collaboration in Advanced Biophotonics Imaging

Instituto de Tecnologías Físicas y de la Información Leonardo Torres Quevedo  - ITEFI
C/ Serrano, 144. 28006 - Madrid • Tel.: (+34) 91 561 88 06  Contacto  •  Intranet
EDIFICIO PARCIALMENTE ACCESIBLE POR PERSONAS CON MOVILIDAD REDUCIDA