DE LA WEB 1.0 A LA WEB SEMÁNTICA - Entrega 2
Por: Lucy Medina Velandia. Dando continuación a la primera parte del artículo que lleva el mismo nombre que éste, trataré aquí lo que es la Web Semántica.
La Web Semántica es llamada también Web 3.0 o Web extendida.
Para describir lo que es la Web Semántica, procederé a dividir las dos palabras para poder definirlas por separado y luego volver a juntarlas con el sentido adecuado.
La Web es definida por el Diccionario de la Real Academia de la Lengua Española como una red, malla, telaraña o red informática y la Semántica como “Perteneciente o relativo a la significación de las palabras”; también indica que es el “Estudio del significado de los signos lingüísticos y de sus combinaciones, desde un punto de vista sincrónico o diacrónico”.
Teniendo como premisas las anteriores definiciones, se podría resumir que la Semántica no es otra cosa que el sentido o interpretación que se le da a cualquier expresión humana, que permite la descripción o admite la correspondencia con un símbolo, palabra, expresión, representación formal o elemento.
La Web 3.0 fue ideada por Tim Berners Lee. Esta Web es la transformación de la Web 2.0, y en ella el usuario también puede crear, organizar y enriquecer el contenido. Con esta red el ocio y las comunicaciones se potencian.
¿Entonces qué es la Web Semántica?
La W3C (Semantic Web Activity, 2009), define la Web Semántica como aquella que “provee un marco común que permite que los datos sean compartidos y reutilizados a través de la aplicación, la empresa, y los límites de la comunidad”. Esto indica que los contenidos de la Web serán dotados de semántica para que las máquinas los puedan procesar; es decir, que sean capaces de reconocer los caracteres que intercambian y como la red es una malla de información relacionada, la Web Semántica intenta procesarla, entenderla y presentarla por medio de los navegadores, a partir de unas bases de datos globalmente relacionadas.
Como el crecimiento de la red ha sido tan amplio, ha creado también problemas como la sobrecarga y heterogeneidad de la información, que conlleva a la no interoperabilidad. La Web Semántica nace para ayudar a resolver dichos problemas, poniendo en manos del software la solución, pues deberá estar en capacidad de procesar el contenido, razonar con él, combinarlo y hacer deducciones lógicas para resolver problemas de forma automática.
Lo anterior se refiere a que las páginas contenidas en la Web dejarán de ser simples cadenas de caracteres para las máquinas y se convertirán en textos con sentido, con semántica, de tal forma que entiendan esos caracteres como lo hacen los humanos.
Un ejemplo muy preciso es el siguiente: si se tienen las siguientes instrucciones escritas en HTML:
WEB SEMÁNTICA
Es una Web extendida, dotada de mayor significado, en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla, gracias a una información mejor definida.
El computador interpreta a través del navegador las anteriores órdenes como un texto que se encuentra en dos líneas, que su título está en un tamaño diferente de los del resto del texto, que se encuentra en cursiva y negrita, que el resto del texto también está en negrita, y así lo presentará por medio del browser:
WEB SEMÁNTICA
Es una Web extendida, dotada de mayor significado, en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla, gracias a una información mejor definida.
Lo escrito en las dos líneas anteriores es todo lo que la máquina puede hacer, aparte de construir índices con las palabras que aparecen en las páginas, de tal manera que cuando un usuario haga cierto requerimiento en un motor de búsqueda, compare las palabras que se escribieron en la pregunta con las que se encuentran en sus índices, las traiga y las presente. Si un usuario desea conseguir las palabras “gatos” o “mujeres”, el browser no le mostrará nada sobre gatas u hombres. Es ahí, precisamente, en donde la Web Semántica cumplirá con su objetivo a través de algoritmos inteligentes, que sepan entender e interpretar los documentos y toman la decisión de traducir las necesidades del usuario. Si, por ejemplo, un usuario hace la siguiente consulta: ¿Es posible adelgazar?, puede referenciar de forma semántica como si se preguntara también por: ¿Es posible engordar?
Lo que se espera de la Web Semántica es que pueda realizar tareas que al usuario le llevarían tiempo. Por ejemplo, si ese usuario imaginario está buscando el libro Cien años de soledad, del autor colombiano Gabriel García Márquez para comprarlo, la Web se encarga de buscar la mejor oferta, el mejor sitio para la compra y presentar las opciones. Esto indica que los computadores podrán desarrollar tareas de gestión, que necesitan interpretar información, tomar decisiones y adaptarlas al contexto. Pero, ¿cómo se realizará todo esto? Se tendrá que programar un asistente personal que conozca los gustos y preferencias del usuario y tome las decisiones pertinentes.
Lo descrito en el párrafo anterior indica que serán los procesadores los protagonistas de la Web, por cuanto deberán entender la lógica descriptiva para que las computadoras, a la hora de procesar la información que está en la Web, trabajen para las personas.
Pero, para realizar todas las tareas indicadas, deberán añadirse metadatos semánticos a la Web. Esto quiere decir que se describirá el contenido, el significado y la relación de los datos, con el objeto de que la computadora pueda evaluar automáticamente la información.
Cuando se habla de metadatos, se debe también hablar de las ontologías, utilizadas para estructurar la información, término que será descrito más adelante.
Refiriéndose a los metadatos, Berners Lee y el Worl Wide Web Consortion – W3C precisan: “Los metadatos son información inteligible para el ordenador sobre recursos Web u otras cosas” (Berners L., 1997).
Una definición sobre metadatos que para la autora de este documento es más fácil de adoptar, es la que escribe María Jesús Lamarca Lapuente (Maria J., 2009): “Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismo para etiquetar, catalogar, describir y clasificar los recursos presentes en la World Wide Web, con el fin de facilitar la posterior búsqueda y recuperación de la información. Este mecanismo lo constituyen los llamados metadatos”.
Para entender en palabras más sencillas, los metadatos pueden compararse a las fichas catalográficas (Gestión y desarrollo de bibliotecas escolares, 2007) que se emplean en las bibliotecas; se toman unas fichas de tamaño universal de 7,5 X 12,5 cm. y en ellas se anotan los datos de los autores: la signatura topográfica, es decir el número con que se diferenciará cierto libro de otro, el apellido y los nombres del autor, el título de la obra, la edición, el lugar de la publicación, la editorial, el año de publicación, el número de páginas, el tamaño del libro y algunos otros datos para localizar el libro, bien sea por materia o título.
Los metadatos se asemejan a los índices que se colocan en los archivos para localizar objetos y luego realizar su búsqueda. ¿Para qué sirven esos metadatos? Precisamente, para explicar la naturaleza de otros datos y refinar las consultas de los usuarios en los buscadores, los cuales podrán filtrarlas a través de información adicional, que lleva a que ésta sea precisa y se ahorre tiempo al no tener que examinar los sitios de forma manual; de ahí que la representación del conocimiento utilice los metadatos con el fin de categorizar la información, facilitar el flujo de trabajo, que convierte los datos representados en el metadato de un formato a otro. Por ello, el metadato que se utilice para la Web deberá describir el contenido y las estructuras de datos. Cuando se tenga un metadato que describa los detalles importantes, el software puede escoger la forma de representación adecuada. Qué no decir si se utiliza la Inteligencia Artificial; ella, a través de sus algoritmos, realizará las deducciones y conclusiones de forma automática, lo que redundará en beneficio del usuario.
Los metadatos contienen información sobre un recurso existente en el que se establece un vocabulario común para que los miembros de la comunidad puedan compartir, fusionar, comunicar conocimiento; será visible siempre y cuando los usuarios interactúen, creen procesos, capturen, recuperen, importen y utilicen el conocimiento.
Retomando el tema de la Web Semántica, se enfatiza en que ésta se basa en dos conceptos básicos: la descripción del significado de los contenidos en la Web y la manipulación automática de esos significados. Por lo tanto, para describir esos significados se requiere de la semántica, los metadatos y las ontologías. Ya hemos abarcado los temas de semántica y metadatos. En el siguiente aparte, nos dedicaremos a las ontologías.
Es lógico pensar que si se quiere una Web inteligente debe realizarse una manipulación automática de los contenidos y ésta se hará a través de la lógica matemática, que establece las reglas que tratarán el contenido semántico; también de los motores de inferencia, que serán los encargados de combinar los conocimientos conocidos para elaborar unos nuevos. Pero estos dos elementos no son otra cosa que conceptos, que hacen parte de la representación del conocimiento, lo que comúnmente se denomina Knowledge Representation.
Para completar el panorama descrito, se requiere también de un lenguaje que produzca reglas; para ello se utilizan tecnologías como el XML (W3C, 2009), RDF (W3C,2009), OWL(W3C, 2009) y los Agentes (Michael W., 2000).
XML. Extensible Markup Language: Lenguaje Etiquetado Extensible, según la W3C, es un lenguaje sencillo, similar a HTML; sirve para estructurar, almacenar información, orientada a intercambio de datos, y describirlos; no los muestra, sino que los guarda en un formato para permitir su lectura a través de otras aplicaciones.
RDF. Resource Description Framework: Infraestructura o Marco de Descripción de Recursos. Creado por la W3C (Word Wide Web Consortium), que lo define como un framework para metadatos en la World Wide Web. Además, es la base para procesar metadatos, proporcionar interoperabilidad entre las aplicaciones que intercambien información en la Web; es decir, facilita y habilita el procesamiento automatizado de recursos Web. Su objetivo es definir un mecanismo para describir los recursos de un dominio de aplicación particular y no definir a priori la semántica de ningún dominio de aplicación.
OWL. Web Ontology Language: Lenguaje de ontología de la Web. Lenguaje de marcado para describir datos, combinarlos y describir de forma explícita los recursos de la Web, como por ejemplo las etiquetas de un documento o las bases de datos. OWL es un lenguaje de ontologías Web; fue definido para ser compatible con la arquitectura Web y la Web Semántica en particular; proporciona las facilidades para utilizar la conexión que brinda el RDF para añadir capacidades a las ontologías, como: tiene capacidad para distribuir las ontologías entre varios sistemas; es escalable a las necesidades de la Web, es compatible con los estándares Web; de acceso e internacionalización. Y por ultimo, es extensible y abierto.
Agentes. Según Michael Wooldridge (Michael W., 2000), un agente es un sistema de software capaz de actuar autónoma y flexiblemente en un entorno cambiante. Para Gerhard Weiss (Gerard W, 1999), un agente es una entidad computacional que percibe y actúa autónomamente en su entorno. Los dos coinciden en que los agentes gozan de cierta libertad de actuación en su entorno; es decir, no se limitan a efectuar ciertas tareas siempre de la misma forma, sino que tienen sus propias ideas sobre cómo alcanzar sus objetivos.
Cuando se explota la Web Semántica deberá hacerse en su totalidad; para ello, como se indicó en párrafos anteriores, se requiere de un lenguaje que tenga capacidad de razonar y representar la semántica de las ontologías; ese lenguaje es el OWL, definido en formato RDF; además se colocará en la Web, para que una vez consultada la ontología se pueda determinar el significado contextual de una palabra. Por ello se requiere del agente inteligente, para que, de forma autónoma, rastree la Web y pueda localizar únicamente las páginas que se refieran a la palabra que se busca, pero con el concepto preciso con el que el usuario interpreta el término. Por lo anterior, se puede afirmar que los agentes inteligentes son entidades de software capaces de recoger, filtrar, procesar información presente en la Web, para hacer las respectivas inferencias e interactuar con el entorno de forma autónoma.
Los agentes tendrán la capacidad de entender lo que se le pide, comprender el contenido de los sitios y validar si lo que encontró corresponde a lo que el usuario solicitó; además deducirá la nueva información sobre la que ya obtuvo.
Concluyendo este aparte sobre Web Semántica, hay que aclarar que ésta persigue establecer la representación de relaciones entre datos y entre éstos y su significado, de tal forma que un sistema automático siga la estructura de las relaciones, genere sus propias conclusiones sobre lo que está buscando y presente dicha información. Para lograrlo, deberá utilizar la Web, la semántica y cada una de las tecnologías descritas a través de este numeral. También se puede afirmar que la Web Semántica sirve para realizar una excelente construcción de consultas, evitar ambigüedades por la pluralidad de significados de una palabra o signo lingüístico; disminuye la cantidad de resultados presentados al usuario, soluciona problemas de interoperabilidad, estandariza un conjunto de formatos en los que almacena conocimiento básico, como por ejemplo, la información de contacto de una persona, una cita, opinión o relación en una red social, etc.