Senior NLP Data Science

Barcelona - Data Science - Full time

45.000€
Última actualización: July 14, 2020

Sobre la posición

El trabajo consiste esencialmente en diseñar, implementar y entrenar algoritmos que extraigan información del texto clínico, así como colaborar en el desarrollo y mantenimiento de los principales productos de nuestra empresa. No trazamos una línea dura entre nuestros equipos de investigación e ingeniería: ambos investigan y desarrollan software de calidad de mercado, poniendo en práctica la investigación previa. Principalmente trabajamos en Python, utilizando nuestras propias bibliotecas de NLP y otras open-source.

Sobre ti

Debes tener habilidades en text mining u otras tareas no triviales de NLP, y sentirte cómodo programando de manera seria (debes tener competencias en Git, experiencia con bibliotecas como pandas, scikit, tensorflow/pytorch/keras y saber cómo crear código reutilizable y extensible).

Buscamos a alguien que le guste trabajar en equipo, enseñar y aprender de otros, y hablar sobre aquello en lo que se está trabajando, tanto con miembros del equipo técnico como no técnico. Además, podrás preparar comunicaciones científicas acerca del trabajo que has realizado.

Tareas

Es importante que te sientas cómodo adaptándote, dando apoyo al resto del equipo y, definitivamente, puedes esperar:

  • Creación y testeo de modelos de NLP orientados al procesamiento de texto médico. Las tareas son, entre otras:

    • Named Entity Recognition
    • Named Entity Linking
    • Word-sense disambiguation
    • Language Modelling
    • Text Classification
    • Relation Extraction
  • Adaptación de los modelos a nuevos idiomas.

  • Adaptación de los modelos a entornos de producción.

  • Colaborar en la escritura de papers y posters.

Qué buscamos

  • Conocimiento de Python y librerías útiles para data science (pandas, numpy, sklearn, etc.)
  • Conocimiento general de Machine Learning.
  • Experiencia implementando redes neuronales (NN) y creando nuevos modelos de NN, ajuste de hiperparámetros, etc.
  • Experiencia con alguna librería de NN (PyTorch/Keras/Tensorflow/theano/otras).
  • Experiencia implementando modelos de deep learning.
  • Un mínimo de tres años de experiencia profesional trabajando como data scientist o data engineering.
  • Al menos dos años de experiencia profesional en Natural Language Processing.

Qué ofrecemos

  • Salario negociable
  • Contrato indefinido jornada completa.
  • Programa de participación en los beneficios de la empresa.
  • Horario flexible, con posibilidad de un día remoto a la semana.
  • Un equipo cálido, transparente y solidario, que mantiene el equilibrio entre la vida laboral y personal.
  • La mayoría de los días, almuerzo juntos en nuestra terraza soleada.

Acerca de IOMED

IOMED es una empresa tecnológica de nueva creación puntera en el campo de la extracción y el procesamiento masivo de datos médicos. Lo compone un equipo pequeño, unido, joven, dinámico y flexible, que, tras varios años de trabajo en conjunto, se caracteriza por su agilidad, disfrute del trabajo y compenetración. Acorde, buscamos candidatos con ganas de innovar, lanzar un proyecto relevante y crecer con él, siempre disfrutando cada día del trabajo en equipo y de los retos, que son muchos. Nuestro “dream team” está formado por estadísticos, bioinformáticos, gente del mundo de los negocios y la medicina.

En IOMED los modelos que desarrolles analizarán cientos de millones de textos hospitalarios, ayudando a extraer variables que acelerarán la investigación clínica.

Como empleador, ofrecemos igualdad de oportunidades. Todavía somos un equipo pequeño y estamos comprometidos a crecer de manera inclusiva. Queremos aumentar nuestro equipo con personas talentosas y dinámicas, independientemente de su raza, color, religión, nacionalidad, sexo, discapacidad física o edad.

Lo que hacemos

Hoy en día, alrededor del 50% de los ensayos clínicos se retrasan debido al reclutamiento de pacientes, ya que la recopilación de datos de pacientes se realiza de forma manual. Como resultado, la investigación clínica es altamente ineficiente tanto en tiempo como en costo, por lo que lleva años y miles de millones de dólares desarrollar un nuevo medicamento.

Este problema podría resolverse a través de datos del mundo real, es decir, aquellos contenidos en las historias clínicas electrónicas (HCE). Pero desafortunadamente, hasta el 85% de los datos clínicos existentes no están estructurados, es decir, en texto plano.

IOMED ha encontrado la solución a esta situación, haciendo posible aprovechar al máximo el valor de los datos clínicos del mundo real. Desarrollamos una herramienta que extrae los datos necesarios de los textos clínicos, lo que da como resultado una base de datos estructurada, estandarizada e interoperable que contiene la información clínica completa de los hospitales.

De este modo, la información no reutilizable se transforma en datos disponibles para la Investigación clínica, lo que permite incrementar la cantidad de pacientes que cumplen con los criterios, así como reducir el tiempo total y el trabajo manual dedicado a esta tarea.