Diseño de un sistema CAD en colonoscopia basado en aprendizaje automático
UNIVERSAL IDENTIFIER: http://hdl.handle.net/11093/7312
UNESCO SUBJECT: 1203.04 Inteligencia Artificial ; 3305.20 Construcciones Ligeras ; 3201 Ciencias Clínicas
DOCUMENT TYPE: doctoralThesis
ABSTRACT
El cáncer colorrectal es el cáncer con mayor incidencia en España, con 44.294 nuevos casos estimados en el año 2024 y con 15.198 muertes en 2022. Esta patología se suele iniciar a partir de lesiones neoplásicas, conocidas como pólipos, con distinto grado de malignidad, cuyo diagnóstico y manejo se basa fundamentalmente en la detección, localización y, en ciertos casos, la resección de la lesión durante la exploración de colonoscopia, seguido de un diagnóstico histológico del tejido extirpado, lo que constituye el gold-standard en el proceso diagnóstico. Un diagnóstico óptico y en tiempo real suficientemente preciso permitiría evitar la extirpación y el análisis histológico de las lesiones diminutas, reducir los costes asociados al diagnóstico histológico, reducir los riesgos para el paciente asociados a la resección endoscópica o reducir la mortalidad derivada de pólipos no detectados, como consecuencia de la mejora de la tasa de detección de adenomas.
El objetivo principal de esta tesis es el modelado del proceso de desarrollo de un sistema CAD (Computer-Aided Diagnosis) en tiempo real de pólipos colorrectales a partir de imagen endoscópica, que permita la detección y clasificación de estas lesiones, llegando a disponer de un prototipo funcional para el ámbito clínico. Los tres objetivos secundarios identificados han sido: (i) modelado del proceso de creación de un repositorio de vídeos e imágenes anotados de exploraciones de colonoscopia, (ii) modelado del proceso de creación de un sistema CAD basado en técnicas de DL (Deep Learning) para su uso en el entorno clínico y (iii) modelado del proceso de integración del sistema CAD con el equipamiento de adquisición de imagen instalado en las salas de exploración endoscópica de un centro sanitario.
En esta tesis doctoral se ha hecho un análisis del estado del arte de los distintos ámbitos relacionados con el desarrollo del sistema CAD, en base al cual se ha modelado un proceso de desarrollo empleando la notación BPMN (Business Process Model and Notation). El modelo de referencia desarrollado, diseñado para ser extensible y generalizado a otros ámbitos, ha sido validado en el marco del proyecto PolyDeep, dando lugar a un sistema CAD que ha sido sometido a un riguroso proceso de validación clínica y a la elaboración de un plan de acceso al mercado en el marco del proyecto PolyDeepAdvance. A presente tese de doutoramento enmárcase dentro do proxecto “POLYDEEP: Sistema inteligente de detección y clasificación en tiempo real de lesiones colorrectales mediante deep learning” (DPI2017-87494-R) que o grupo de acollida do candidato está a desenvolver en colaboración co Complexo Hospitalario de Ourense (CHUO). Neste proxecto proponse un método para o desenvolvemento dun sistema de diagnose asistida por computador (CAD, Computer-Aided Diagnosis) en tempo real de pólipos colorrectais a partir de imaxe endoscópica. Este sistema permitirá a detección e clasificación destas lesións, chegando a dispoñer dun prototipo funcional para o ámbito clínico. Para isto, empregaranse técnicas de Deep Learning (DL) sobre imaxes de pólipos colorrectais, que estarán dispoñibles nun repositorio ou banco de imaxes de nova creación que se aloxará no Instituto de Investigación Sanitaria Galicia-Sur (IISGS). O uso deste sistema CAD facilitará o traballo do endoscopista, que contará en tempo real cunha segunda opinión, sendo de especial utilidade para endoscopistas noveles. A maiores, espérase que con este sistema se mellore tanto a identificación de pólipos colorrectais, evitando reseccións, análises histolóxicos ou costes innecesarios, como a planificación do tratamento máis axeitado (endoscópico ou cirúrxico) no caso dos adenocarcinomas. Neste contexto, identifícanse como obxetivos fundamentais deste plan de investigación (i) o modelado do proceso de creación dun repositorio de vídeos anotados de exploracións de colonoscopia, (ii) o modelado do proceso de creación dun sistema CAD e (iii) o modelado do proceso de integración do sistema CAD co equipamento de adquisición de imaxe instalado nas salas de exploración endoscópica dun centro sanitario. O enfoque metodolóxico que se propón para o desenvolvemento desta tese adaptase en gran medida ó que se coñece como Investigación Científica baseada no Deseño (DSR, Design Science Research), metodoloxía de investigación máis estendida en Sistemas de Información. Para a consecucion deste plan, identifícanse 8 tarefas chave nas que se levarán a cabo (i) o estudo do estado da arte no ámbito de sistemas CAD, (ii) o estudo do estado da arte das técnicas de colonoscopia, (iii) o estudo e caracterización de repositorios de datos para aprendizaxe automático, (iv) o modelado dun repositorio de vídeos de exploracións de colonoscopia para aprendizaxe automático, (v) o modelado do proceso de deseño do sistema CAD, (vi) o modelado do procedemento de colonoscopia asistido por CAD, (vii) o modelado do hardware, software e integracións do sistema CAD proposto e por último (viii) avaliaranse os resultado e estraeranse conclusións. The present doctoral thesis is part of the project "POLYDEEP: Sistema inteligente de detección y clasificación en tiempo real de lesiones colorrectales mediante deep learning" (DPI2017-87494-R) that the host group of the candidate is developing in collaboration with the Complexo Hospitalario Universitario de Ourense (CHUO). In this project we propose a method for the development of a real time computer-aided diagnosis system (CAD) of colorectal polyps from endoscopic image. This system will enable the detection and classification of these lesions, allowing the development of a functional prototype for the clinical field. To do this, Deep Learning (DL) techniques will be used on images of colorectal polyps, which will be available in a newly created repository or image bank that will be housed in the Galician-South Health Research Institute (IISGS). The use of this CAD system will facilitate the work of the endoscopist, who will count with a second opinion in real time, being of special utility for novel endoscopists. Additionally, it is expected that with this system will improve the identification of colorectal polyps, avoiding resections, histological analysis or unnecessary costs, as well as the planning of the most appropriate treatment (endoscopic or surgical) in the case of adenocarcinomas. In this context, the following key objectives are identified in this research plan: (i) modeling the process of creating a repository of annotated videos of colonoscopy explorations, (ii) modeling the process of creating a CAD system, and (iii) the modeling of the integration process of the CAD system with the image acquisition equipment installed in the endoscopic examination rooms of a health center. The methodological approach proposed for the development of this thesis is largely adapted to what is known as Design Science Research (DSR), the most widespread research methodology in Information Systems. To achieve this plan 8 main tasks are identified: (i) study of the state of the art in the field of CAD systems, (ii) study of the state of the art of colonoscopy techniques, (iii) study and characterization of data repositories for machine learning, (iv) modeling of a video repository of colonoscopy explorations for machine learning, (v) modeling of the CAD system design process, (vi) modeling of the CAD-assisted colonoscopy procedure, (vii) modeling of the hardware, software and CAD system integrations proposed, and, finally, (viii) results will be evaluated and conclusions drawn.