Adaptación del modelo Signformer para el dataset LSA-T (Lengua de Señas Argentina).
Más detalle sobre esta adaptación en el siguiente link: https://drive.google.com/file/d/19bHvYNZaxtXRSftqhzxeh7DgqvL4ZGz3/view?usp=sharing
Descargar los siguientes archivos desde este link de Google Drive:
lsa_t.trainlsa_t.devlsa_t.test
Ubicarlos en: data/LSA-T/
Importante: Este proyecto requiere Python 3.10.3
Primero instalar las dependencias generales:
pip install -r requirements.txtLuego instalar PyTorch con soporte CUDA:
pip install torch==2.4.1+cu124 torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124Finalmente instalar el optimizador Sophia:
pip install Sophia-OptimizerNota: El import de Sophia ya está correctamente configurado en este repo como from sophia.sophia import SophiaG.
Para iniciar el entrenamiento:
./run_in_tmux.sh --fullEste script:
- Activa el entorno virtual
- Inicia el entrenamiento usando la configuración en
configs/lsa_t_config.yaml - Ejecuta todo dentro de una sesión tmux llamada
signformer_lsa
./run_in_tmux.sh --test # Solo verificar que todo esté configurado
./run_in_tmux.sh --train # Solo entrenar (sin verificaciones)
./run_in_tmux.sh --shell # Abrir shell interactiva con venvLos resultados y checkpoints se guardan en lsa_t_model/:
best.ckpt- Mejor modelo guardadotrain.log- Log del entrenamientovalidations.txt- Resultados de validacióntest_predictions.*.txt- Predicciones en el conjunto de pruebatensorboard/- Logs de tensorboard
El archivo de configuración principal está en configs/lsa_t_config.yaml.
Modificar los paths y parámetros según tu setup.
Paper original de Signformer: Signformer is all you need: Towards Edge AI for Sign Language
Repositorio del modelo original: https://github.com/EtaEnding/Signformer
Dataset LSA-T: https://github.com/midusi/LSA-T