UNIVERSAL IDENTIFIER: http://hdl.handle.net/11093/4825
UNESCO SUBJECT: 1203.11 Logicales de Ordenadores ; 1203.04 Inteligencia Artificial ; 1203.17 Informática
DOCUMENT TYPE: doctoralThesis
ABSTRACT
La producción de conocimiento científico y técnico ha aumentado exponencialmente en las últimas décadas. Incluso en dominios especializados, la abrumadora producción de conocimiento hace difícil que los humanos sigan los avances del conocimiento. En un dominio específico como la optimización multicriterio, se producen documentos, tesis, informes, marcos de software, etc., en la escala de miles por año. Esto hace que la tarea de gestión del conocimiento por parte de expertos científicos y comunidades de resolución de problemas de ingeniería no se pueda realizar por medios humanos exclusivos. La ontología de OWL (Lenguaje web ontológico) ha sido estudiada en la comunidad de ciencias de la computación como técnicas prometedoras para compartir la comprensión común de la información entre personas o agentes de software, hacer suposiciones de dominio explícitas, separar el conocimiento de dominio del conocimiento operacional, analizar conocimiento de dominio y realizar razonamiento basado en computadora, mediante la adopción de estándares legibles por máquina de representación de conocimiento. El crecimiento de la producción de conocimiento documentada en fuentes clásicas (por ejemplo, documentos de texto en lenguaje natural), avances recientes en el procesamiento del lenguaje natural y el aumento de ontologías para formalizar la representación del conocimiento por medios computacionales, hizo el aprendizaje ontológico (semi) automático del texto de un área de suma importancia. Se deben abordar varios desafíos de investigación en el estudio del aprendizaje de la ontología (semi) automática a partir del texto, pero en el trabajo de investigación actualmente propuesto, el proceso de optimización multicriterio de las ontologías adaptativas debe abordarse con especial interés. Dado que el aprendizaje de ontología automática a partir de texto puede producir ontologías no óptimas con respecto al contenido y la estructura, se deben considerar varios problemas de optimización multicriterios dentro del proceso global de aprendizaje de ontología del texto. Los criterios como la velocidad de procesamiento, la consistencia y la integridad se encuentran entre los criterios que se optimizarán en la construcción de ontologías. La necesidad real de procesar y analizar el conocimiento representado en forma de ontologías (OWL), derivadas del texto en lenguaje natural presente en un documento o en una colección de documentos, es hoy ampliamente aceptado en la comunidad de investigación en ciencias de la computación. En consecuencia, se espera que la investigación sobre los enfoques de optimización multicriterios aplicados a la estructura de la ontología y la optimización del contenido produzca mejoras importantes (específicas y generales) en el aprendizaje de la ontología (semi) automática a partir del proceso de texto. A produción de coñecementos científicos e técnicos aumentou de xeito exponencial nas últimas décadas. Incluso en dominios especializados, a produtiva produción de coñecemento dificulta que os humanos sigan os avances do coñecemento. Nun dominio específico como a optimización de multicriterios, papeis, tese, informes, marcos de software, etc., prodúcense na escala de miles ao ano. Isto converte a tarefa de xestión do coñecemento por parte dos expertos científicos e as comunidades de resolución de problemas de enxeñaría imposibles de realizar por medios humanos exclusivos. A representación do coñecemento a través da OWL (Ontology Web Language) ontoloxías foron estudadas na comunidade informática como técnicas prometedoras para compartir coñecemento común de información entre persoas ou axentes de software, facer as suposicións de dominio explícito, separar o coñecemento de dominio do coñecemento operativo, analizar coñecemento de dominio e realización de razonamientos por computadora, mediante a adopción de normas de lectura de máquinas de representación de coñecemento. O crecemento da produción de coñecemento documentado en fontes de tipo clásico (por exemplo, documentos de texto en lingua natural), avances recentes no procesamento de linguas naturais e aumento de ontoloxías para formalizar a representación do coñecemento por medios computacionais, a ontoloxía semi- de suma importancia. Varios retos de investigación deben ser abordados no estudo da aprendizaxe (semi) automática da ontoloxía a partir do texto, pero no traballo de investigación actualmente proposto, o proceso de optimización multicriterio das ontoloxías adaptativas debe ser abordado con especial interese. Dado que a aprendizaxe de ontoloxía automática pode producir ontoloxías non óptimas con respecto ao contido e á estrutura, hai que considerar varios problemas de optimización multicriterios dentro da aprendizaxe global do proceso de texto. Criterios como a velocidade de procesamento, consistencia e integridade están entre os criterios que se optimizarán na construción da ontoloxía. A verdadeira necesidade de procesar e analizar coñecementos representados en forma de ontologías (OWL), derivadas do texto de linguaxe natural presente nun documento ou nunha colección de documentos, hoxe en día é amplamente aceptado na comunidade de investigación informática. Hai unha investigación sobre enfoques de optimización multicriterios aplicados á estrutura de ontoloxía e optimización de contidos que se espera que produzan melloras importantes (específicas e globais) na aprendizaxe (semi-) automática da aprendizaxe a partir do proceso de texto. Scientific and technical knowledge production has increased exponentially in the last decades. Even in specialized domains, the overwhelming production of knowledge makes difficult for humans to follow the knowledge advances. In a specific domain such as multicriteria optimization, papers, thesis, reports, software frameworks, etc., are produced in the scale of thousands per year. This turns the task of knowledge management by scientific experts and engineering problem solving communities infeasible to be performed by exclusive human means. Knowledge representation by the means of OWL (Ontology Web Language) ontologies have been studied in the computer science community as promising techniques to share common understanding of information among people or software agents, make domain assumptions explicit, separate domain knowledge from the operational knowledge, analyze domain knowledge and perform computer based reasoning, by the adoption of knowledge representation machine readable standards. The growth of knowledge production documented in classic type of sources (e.g. natural language text documents), recent advances in natural language processing and the raise of ontologies to formalize knowledge representation by computational means, made (semi-)automatic ontology learning from text an area of utmost importance. Several research challenges need to be addressed in the study of (semi-)automatic ontology learning from text, but in the currently proposed research work, the process of multicriteria optimization of adaptive ontologies is to be addressed with particular interest. Since automatic ontology learning from text can produce non-optimal ontologies with respect to content and structure, several multicriteria optimization problems must be considered within the overall ontology learning from text process. Criteria such as processing speed, consistency and completeness are among the criteria to be optimized in ontology construction. The actual need to process and analyze knowledge represented in the form of (OWL) ontologies, derived from natural language text present in a document or a collection of documents, is nowadays widely accepted in the computer science research community. Therefeore, research on multicriteria optimization approaches applied to ontology structure and content optimization is expected to produce important (specific and overall) improvements, in the (semi-)automatic ontology learning from text process.