Primeros pasos

Instalación

Requisitos previos\

Uso de Git LFS

Esta herramienta usa Git LFS para manejar archivos grandes. Antes de usarla necesita instalar y configurar Git LFS en su máquina local. Vea https://git-lfs.com/ para instrucciones de instalación.

Después de configurar Git LFS, siga estos pasos para clonar el repositorio:

git clone https://github.com/tabiya-tech/tabiya-livelihoods-classifier.git

Si ya clonó el repositorio sin Git LFS, ejecute:

git lfs pull

Instalar las dependencias

Configurar virtualenv

En el directorio raíz del proyecto backend (es decir, el mismo directorio que este archivo README), ejecute los siguientes comandos:

Nota: Instale las dependencias para el entrenamiento usando:

Nota: Antes de ejecutar cualquier tarea, active el entorno virtual para que las dependencias instaladas estén disponibles:

Para desactivar el entorno virtual, ejecute:

Active Python y descargue el paquete de puntuación de NLTK para usar el tokenizador de oraciones. Solo necesita descargar punkt una vez.

Variable de entorno y configuración

La herramienta usa la siguiente variable de entorno:

  • HF_TOKEN: Para usar el proyecto, necesita acceso al modelo de extracción de entidades de HuggingFace 🤗. Contacte a los administradores a través de [[email protected]]. A partir de ahí, debe crear un token de acceso de lectura para usar el modelo. Encuentre o cree su token de acceso de lectura aquíarrow-up-right. El backend admite el uso de un .env archivo para establecer la variable de entorno. Cree un .env archivo en el directorio raíz del proyecto backend y establezca las variables de entorno de la siguiente manera:

ATENCIÓN: El archivo .env debe mantenerse seguro y no compartirse con otros ya que contiene información sensible.

Guía de inicio rápido

Canal de inferencia

La canalización de inferencia extrae ocupaciones y habilidades de una descripción de trabajo y las empareja con las entidades más similares en la taxonomía ESCO.

Uso

Primero, active el entorno virtual como se explicó aquí.

Luego, inicie el intérprete de Python en el directorio raíz y ejecute los siguientes comandos:

Cargue la clase EntityLinker y cree una instancia de la clase, luego realice la inferencia sobre cualquier texto con el siguiente código:

Después de ejecutar los comandos anteriores, debería ver la siguiente salida:

Versión francesa

Puede usar la versión francesa del Entity Linker con el siguiente código:

Debería ver la siguiente salida:

Ejecución de las pruebas de evaluación

Cargue la Evaluador clase y mostrar los resultados:

Esta clase hereda de la clase EntityLinker, con la principal diferencia siendo la bandera 'entity_type' si desea ejecutar evaluaciones en conjuntos de datos personalizados, necesitará hacer modificaciones a la

circle-exclamation

4 GB de RAM CPU/GPU

  • El código se ejecuta en GPU si está disponible. Asegúrese de que su máquina tenga CUDA instalado si se ejecuta en GPU.

El código se ejecuta en GPU si está disponible. Asegúrese de que su máquina tenga CUDA instalado si se ejecuta en GPU.

Última actualización