Lecciones aprendidas
Extender la taxonomía ESCO incluyendo la economía invisible, mientras adaptamos nuestra metodología a los desafíos encontrados, nos dejó valiosas lecciones.
ESCO vs O*Net
En revisión
Elección del nivel ICATUS
Como se discutió aquí, la taxonomía ICATUS comprende tres niveles que representan diferentes grados de desagregación, a saber: nivel de división principal, división y grupo. Para el procedimiento de emparejamiento de Tabiya, las actividades a nivel de grupo relacionadas con la economía no observada se emparejan con las ocupaciones de ESCO. En total hay 60 actividades a nivel de grupo de ICATUS que conforman la entrada ICATUS del Marco. Se eligió el nivel de grupo, en lugar del nivel de división principal o división, principalmente debido a que el nivel de grupo alcanza el mayor grado de precisión en la taxonomía ICATUS. Por lo tanto, podemos obtener el mayor detalle al emparejar desde este nivel, en comparación con los niveles de división principal y división.
El desafío, sin embargo, ha sido emparejar actividades a nivel de grupo con ocupaciones de ESCO que ocasionalmente definen actividades y ocupaciones en niveles de granularidad diferentes. En particular, encontramos que hay algunos casos donde una ocupación de ESCO comprende más de un nivel de grupo de ICATUS. Por ejemplo, las actividades a nivel de grupo de ICATUS “Limpieza después de la preparación de alimentos/comidas/aperitivos” y “Preparación de comidas/aperitivos” se emparejan cada una con la ocupación ESCO “ayudante de cocina” (definida como “Los ayudantes de cocina ayudan en la preparación de alimentos y en la limpieza del área de la cocina.”). Claramente, la ocupación “ayudante de cocina” está compuesta por estas dos actividades a nivel de grupo de ICATUS. Teóricamente, una forma de evitar esto sería emparejar las actividades de ICATUS a nivel de división, en lugar de al nivel de grupo. Sin embargo, este método se considera en última instancia demasiado costoso en términos de información, ya que en el nivel de división la probabilidad de omitir ocupaciones ESCO relativamente raras pero relevantes (y, a su vez, habilidades) del emparejamiento ICATUS a ESCO es muy alta. Esto perjudica al usuario final porque limita la lista eventual de habilidades disponibles para representar el trabajo que realiza. Tras la discusión entre el equipo de investigación y el equipo de Harambee, acordamos mutuamente que la mejor forma de no perjudicar en este caso es emparejar las actividades de ICATUS con las ocupaciones de ESCO a nivel de grupo.
Ocupaciones ESCO como subpaso hacia las habilidades (NLP, Word2Vec, etc.)
La razón por la que las actividades de ICATUS se emparejan con ocupaciones ESCO, y luego con habilidades en lugar de hacer un emparejamiento directo de las actividades de ICATUS a las habilidades requiere un resumen de la hoja de ruta conceptual seguida para llegar a esta decisión. Inicialmente, dado que el objetivo es asignar habilidades a las actividades, la acción más intuitiva parecía ser emparejar directamente las actividades de ICATUS con las habilidades de ESCO. Para ello se adoptaron técnicas de Procesamiento de Lenguaje Natural (NLP). En particular, para comparar las actividades de ICATUS con las habilidades de ESCO se adoptó una técnica llamada Word2Vec. Word2Vec es un algoritmo usado en NLP que emplea incrustaciones de palabras para asignar valores numéricos a una palabra dada en relación con el contexto circundante de esa palabra, informado por la relación que esa palabra tiene con otras palabras en un diccionario utilizado para entrenar el algoritmo (Mikolov et al., 2013). Tras varios intentos de emparejar directamente las habilidades de ESCO con las actividades de ICATUS, las técnicas de NLP fallaron debido a la incompatibilidad en la naturaleza entre ICATUS/ESCO como entradas y la entrada requerida para que el algoritmo funcione de forma óptima. Dado que ICATUS comprende frases cortas referentes a actividades en lugar de palabras sueltas como hace la taxonomía ESCO para las habilidades, Word2Vec no pudo conciliar de manera óptima estas taxonomías para producir un emparejamiento significativo de habilidades. De esto surgió un compromiso entre precisión y reproducibilidad. Por una parte, los métodos de NLP permiten una reproducibilidad casi perfecta pero obtienen una puntuación baja en la escala de precisión en este contexto. Se tomó la decisión de priorizar la precisión durante la conceptualización del Marco Tabiya. Así, la metodología predominante que usa ocupaciones ESCO como puente hacia las habilidades resultó equilibrar de forma óptima la escala de precisión-reproducibilidad para nuestros propósitos. Es decir, la asignación manual de ocupaciones ESCO a actividades ICATUS para derivar las habilidades asociadas con la economía no observada demostró obtener una puntuación alta en la escala de precisión y lo suficientemente alta en la escala de reproducibilidad, ya que este trabajo fue verificado de forma independiente. Por tanto, el procedimiento de emparejamiento manual prevaleció en la creación del Marco Tabiya.
Última actualización