jueves, 20 de septiembre de 2012

BASES DE DATOS MULTIMEDIA


BASES DE DATOS MULTIMEDIA
Este tipo de bases de datos tienen mucha relación con los SGBD (Sistema de Gestión de bases de Datos) objetos relacionales (SGBDOR) y los orientados a objetos (SGBDOO) ya que pueden almacenar tipos de datos multimedia.


Podemos distinguir dos tipos de bases de datos multimedia fundamentales:



Bases de datos referenciales: son bancos de datos sobre material como películas, series de televisión o música. En la mayoría de los casos, la información que se almacena hace referencia a cuestiones descriptivas (autor, título, duración, productor, etc.) o a cuestiones técnicas (formato, duración, etc.).

Bases de datos descriptivas: se trata de sistemas de análisis de contenido que, más allá de los datos técnicos o generales que contiene la mayoría de bases de datos referenciales, aportan información específica sobre el contenido.

VENTAJAS E INCONVENIENTES DE UNA BASE DE DATOS MULTIMEDIA

Ventajas

La posibilidad de integrar en un único sistema una gran diversidad de formatos (imágenes, texto, video, sonido, etc).
Ofrecen mayor variedad a la hora de representar la información.
Un gran, y creciente, mercado potencial que augura que se siga investigando activamente en el futuro.

Inconvenientes

Necesita grandes espacios para almacenar toda la información que queremos.
Este tipo de bases de datos necesitan grandes anchos de banda para obtener un rendimiento óptimo.
Complejidad en cuanto a programar operaciones, o incluso la interfaz, debido a la alta cantidad de formatos que hay que manejar, lo que puede repercutir en su rendimiento.



INTEGRACIÓN MULTIMEDIA EN LAS BASES DE DATOS

Las bases de datos multimedia están en un marco que además de los datos se le incluye la nueva característica de que pueden tener variabilidad espacial y temporal. Por lo tanto, un documento introducido en una base de datos multimedia es una composición temporal, en la cual hay que introducir los diferentes tipos de datos, 
Bases de datos multimedia




1.- Introducción
El nacimiento de la multimedia ha renovado por completo la idea de base de datos. Si bien desde siempre se han visto como almacenes de información (textual y numérica), regidos por un conjunto de normas que le aportaban semántica. Con la llegada de la Multimedia el abanico de posibilidades complementa la representación de los objetos que se desean almacenar. Este tipo de bases de datos tienen mucha relación con los SGBD objetos relacionales (SGBDOR) y los orientados a objetos (SGBDOO) ya que pueden almacenar tipos de datos multimedia.

Las bases de datos multimedia están en un contexto que además de los datos se le incluye la nueva característica de la que se pueden tener variabilidad espacial y temporal. Por lo tanto, un documento introducido en una base de datos multimedia es una composición temporal, en la cual hay que introducir los diferentes tipos de datos, tanto como las relaciones de configuración y temporales existentes entre ellos. Los datos deben estar sincronizados, controlando tanto su estado como su comportamiento.
Todos los factores que condicionan las Bases de Datos Multimedia les obligan a tener dos características principales:

·         La disponibilidad de bases de datos avanzadas, en un entorno de fácil utilización por parte del usuario.
·         El establecimiento de redes de telecomunicaciones de alta velocidad.



2.- Tipos de BBDD Multimedia
Existen dos tipos fundamentales de bases de datos multimedia, que son las bases de datos referenciales, y las descriptivas.


BBDD Referenciales
Son bases de datos que se encargan de almacenar datos concernientes a información sobre archivos multimedia, como video o música. Esta información almacenada podría tratarse de datos tales como el autor y título, el formato, la duración, etc.

Una base de datos referencial, por ejemplo podría ser la de una biblioteca, imaginad que queréis ver un video, o leer un libro, o ver una foto, y sólo sabéis el nombre, o el autor, o su identificador. Entonces, accedeis a esta base de datos referencial biblioteca, y buscais el archivo, y os dirá dónde lo puedes localizar, en que sección de la web de la biblioteca, o en que parte de la misma biblioteca, es decir, que la base de datos referencial sirve para saber donde está lo que buscas, con los pocos parámetros que se tiene sobre ello, como su nombre, autor, editorial…


BBDD Descriptivas
Estas bases de datos no son tan comunes como las referenciales, y todavía se encuentran en proceso de desarrollo e investigación, puesto que su función es la de analizar el contenido que almacenan, con el fin de poder aportar información sobre él. Por eso, en el ámbito multimedia no es una tarea sencilla desarrollar este tipo de sistemas, puesto que analizar tanto imágenes como sonido, no es trivial.

Una base de datos descriptiva analiza los datos, por lo que aparte de permitir la búsqueda de dichos archivos como antes, también permitirá buscarlo por el contenido, por ejemplo si buscas información sobre el lenguaje UML, lo introduces y aparecerán todos lo archivos relacionados con ello, ya sea texto, foto, video, audio… El problema de estas bases de datos reside en la dificultad para analizar una foto o un video. Imaginad que estáis buscando un documental sobre el lince ibérico pero no sabéis cómo se titulaba, o quien lo hizo o dónde se encuentra, y que aunque tengais estos datos no guarda relación con lo que se ve en el video, por ejemplo que se que se han equivocado al nombrarlo y lo han llamado construcciones romanas. La base de datos descriptiva te permitiría encontrarlo, debido a que ya ha analizado el video y sabe cuál es su contenido, esto hablando teóricamente, ya que aun no están completamente desarrolladas este tipo de bases de datos.


3.- Tipos de datos
En la siguiente imagen podemos observar los diferentes tipos de datos que podemos tener en una base de datos multimedia:



Vamos a enumerarlos y describirlos brevemente:
  • Texto


Puede ser estructurado o sin estructurar.
  • Gráficos


Se trata de dibujos e ilustraciones codificados según un estándar de descripción de archivos.
  • Imágenes


Son elementos gráficos codificados según algún tipo de formato estándar.
  • Animaciones


Representan secuencias temporales de imágenes o datos.
  • Vídeo


Definen secuencias temporales de imágenes o datos a una determinada velocidad (fps o tasa de frames por segundo), codificados siguiendo un estándar.
  • Audio


Dentro de esta categoría encontramos dos tipologías distintas: el audio estructurado, que representa una secuencia de sonidos identificados según nota, duración, tono, etc... y el audio digitalque define una secuencia de sonidos digitales.

También destaca la existencia de datos multimedia compuestos, los cuales añaden metadatos (información extra sobre los datos). 




4.- Arquitecturas






La arquitectura de un sistema de base de datos se basa en 3 niveles distintos:

·         Nivel físico
Es el nivel más bajo de abstracción y el nivel real de los datos almacenados. Este nivel define cómo se almacenan los datos en el soporte físico, ya sea en registros o de cualquier otra forma, así como los métodos de acceso. Este nivel lleva asociada una representación de los datos, que es lo que denominamos Esquema Físico.

·         Nivel conceptual
Es el correspondiente a una visión de la base de datos desde el punto de visto del mundo real. Es decir se trata con la entidad u objeto representado, sin importar como está representado o almacenado éste. Es la representación de los datos realizada por la organización, que recoge los datos parciales de los requerimientos de los diferentes usuarios y aplicaciones parciales. Incluye la definición de los datos y las relaciones entre ellos. Este nivel lleva asociado un Esquema Conceptual.

Son partes del esquema conceptual. El nivel conceptual presenta toda la base de datos, mientras que los usuarios, por lo general, sólo tienen acceso a pequeñas parcelas de ésta. El nivel visión es el encargado de dividir estas parcelas. Un ejemplo sería el caso del empleado de una organización que tiene acceso a la visión de su nómina, pero no a la de sus compañeros. El esquema asociado a éste nivel es el Esquema de Visión.
Otros autores utilizan la denominación de nivel interno, nivel conceptual y nivel externo, para referirse a estos mismos niveles:

·         Nivel de visión


A continuación veremos diferentes modelos arquitecturales usados en bases de datos multimedia.


4.1.- Acoplamiento Débil frente a Acoplamiento Fuerte


En el enfoque de un acoplamiento débil el DBMS utiliza sólo la gestión de los metadatos, y un gestor de archivos multimedia se utiliza para gestionar los datos multimedia. Luego está la integración de un módulo para el DBMS y el gestor de archivos multimedia. El MM-DBMS consiste de tres módulos: el DBMS, el Metadato, el Gestor de Archivos Multimedia y el módulo de integración de ambos. La ventaja de la pérdida de acoplamiento es que uno puede utilizar los diversos sistemas de archivos multimedia para gestionar los datos multimedia.








Hay que tener en cuenta que con el enfoque de acoplamiento débil, a menos que el administrador de archivos realice las funciones del DBMS, el DBMS sólo gestiona los metadatos de los datos multimedia.





4.2.- Arquitectura de Esquema


Esta arquitectura puede ser descrita de diversas maneras con respecto a las distintas características. En este esquema los metadatos son los que describen los datos multimedia. En este caso, el esquema externo definirá las vistas que tienen los usuarios de la base de datos, tal como el video o vista de audio. El esquema lógico se basa en el modelo de datos para la base de datos multimedia. El esquema interno son las estructuras de datos internas, por ejemplo, la variación de Árboles B (estructura de datos B Tree) para bases de datos multimedia.

También se puede ver el esquema desde otro punto de vista. En lugar de datos multimedia, asumir que los tipos de datos se almacenan en bases de datos separadas.








4.3.- Esquema Funcional



Las funciones de un sistema de base de datos multimedia incluyen la representación de datos, distribución, procesos de consulta/actualización, la navegación y la edición, la calidad de los servicios de procesamiento en tiempo real, programación, gestión de metadatos, gestión de almacenamiento y la gestión de seguridad/integridad.



En la capa de presentación se muestran diversos tipos de medios para el usuario, y administrador de consultas realiza procesos de consultas. El gestor de almacenamiento da acceso a la base de datos multimedia, y el gestor de metadatos y administra los metadatos.









Hay que tener en cuenta que esta es una ligera variación de la arquitectura funcional y que también existen otros módulos, como el gestor de transacciones y el gestor de seguridad / integridad.


4.4.- Arquitectura de Sistema


Hay también otros aspectos de las arquitecturas. Por ejemplo, una base de datos multimedia podría utilizar un sistema de bases de datos comerciales, tales como un DBMS orientado a objetos (OO-DBMS) para la gestión de objetos multimedia.
Sin embargo, las relaciones entre los objetos y la representación de relaciones temporales puede suponer la ampliación de la base de datos del sistema de gestión. Es decir, un BDMS mas una capa adicional proporcionan un soporte completo para la gestión de datos multimedia. En el otro caso, tanto las extensiones de la base de datos y funciones de gestión estan integrados de manera que exista un sistema de gestión de bases de datos para la gestión de objetos multimedia, así como las relaciones entre los objetos.


















4.5.- Arquitectura Distribuida


Un MM-DBMS distribuido es esencialmente una colección de MM-DBMSs conectados a través de una red. El módulo del procesador multimedia distribuido es el responsable para el manejo de la distribución de datos, así como de consultas distribuidas, transacciones, los metadatos, y la seguridad y la integridad de gestión.

4.6.- Arquitectura de Interoperabilidad


Debemos tener en cuenta que un MM-DBMS también pueden basarse en un enfoque cliente-servidor. Si este es el caso, entonces una gestión de objetos distribuidos (DOM) como el sistema basado en un Common Object Request Broker Arquitectura (CORBA) se puede utilizar para integrar los diversos componentes.

Las arquitecturas de tres niveles también son populares para la gestión de datos e información. En este enfoque, el cliente tiene el nivel de presentación módulos. Los objetos de negocio comprenden el nivel medio, y el servidor de nivel de base de datos lleva a cabo las funciones. Tal arquitectura también se esté convirtiendo en popular para las aplicaciones multimedia.

4.7.- Arquitectura Hipermedia


Mientras que un MM-DBMS gestiona base de datos multimedia, un hipermedia no sólo es un DBMS que gestiona una base de datos multimedia, sino que también proporciona apoyo para la navegación por la base de datos siguiendo enlaces. Es decir, un hipermedia incluye un DBMS y un MM-DBMS.

Una hipermedia DBMS incluye una MM-DBMS y un enlazador. El enlazador brinda apoyo para la navegación por la base de datos multimedia siguiendo enlaces.

Esencialmente, los datos multimedia en la Web están relativamente ligados a la tecnología hipermedia, donde los sistemas de base de datos multimedia se complementan con los navegadores.


5.- ¿Por qué incorporamos la multimedia a las bases de datos?



Los tipos de datos que se podían definir en los SGBD relacionales de los años ochenta y noventa eran muy limitados. La incorporación de tecnologías multimedia –imagen y sonido– en los sistemas de información (SI) hace necesario que los SGBD relacionales acepten atributos de estos tipos.
Sin embargo, algunas aplicaciones no tienen suficiente con la incorporación de tipos especializados en multimedia. Necesitan tipos complejos que el desarrollador pueda definir a medida de la aplicación. En definitiva, se necesitan tipos abstractos de datos: TAD. Los SGBD más recientes ya incorporaban esta posibilidad, y abren un amplio mercado de TAD redefinidos o librerías de clases.
Esto nos lleva a la orientación a objetos (OO). El éxito de la OO al final de los años ochenta, en el desarrollo de software básico, en las aplicaciones de ingeniería industrial y en la construcción de interfaces gráficas con los usuarios, ha hecho que durante la década de los noventa se extendiese en prácticamente todos los campos de la informática.

En los SI se inicia también la adopción, tímida de momento, de la OO. La utilización de lenguajes como C++ o Java requiere que los SGBD relacionales se adapten a ellos con interfaces adecuadas.

La rápida adopción de la web a los SI hace que los SGBD incorporen recursos para ser servidores de páginas web, como por ejemplo la inclusión de SQL en guiones HTML, SQL incorporado en Java, etc. Notad que en el mundo de la web son habituales los datos multimedia y la OO.

Hoy día, los SGBD relacionales están en plena transformación para adaptarse a tres tecnologías de éxito reciente, fuertemente relacionadas: la multimedia, la de orientación a objetos (OO) e Internet y la web.

6.- Características deseables


Existen ciertas características deseables que un sistema gestor de bases de datos multimedia debería poder ofrecer. Primero, debería poder ofrecer cierta libertad en cuanto al diseño y descripción, facilitando para ello lenguajes apropiados, y permitiendo el diseño de estructuras de datos al gusto del usuario. Además, debe ser capaz de ofrecer sistemas eficientes de búsqueda y recuperación de datos, así como mecanismos de manipulación, ordenación y organización de dichos datos. Como resultado de la unión de todas estas características deseables, el usuario debería poder manejar y operar con todos los tipos de datos ofrecidos por una base de datos multimedia, con una sensación de libertad traducida en gran variedad de posibilidades en cuanto a formato, tamaño, diseño, etc, de estos mismos datos.

Por lo que se puede concluir que los requisitos que se le pueden pedir a un sistema gestor de bases de datos multimedia son los siguientes:

  • Búsqueda eficiente de información multimedia

facilitando el acceso a todos los ficheros, y ofreciendo además técnicas adecuadas de compresión y descompresión adecuadas.
  • Facilitar la conexión entre documentos o grupos de datos

según su contenido informativo, de tal forma que se le pueda ofrecer al usuario contenidos relacionados con los datos que busca.
  • Facilitar la utilización al usuario

de tal forma que el entorno le resulte familiar y sencillo de manejar, a la vez que se le ofrece gran variedad de recursos para que el mismo pueda operar a su gusto
  • Facilitar la disponibilidad de bases de datos avanzadas

así como el establecimiento de redes de telecomunicaciones de alta velocidad.






7.- Operaciones



A la hora de tratar con bases de datos multimedia, hay algunos aspectos que debemos de discutir:


Modelado


Dado que se va a trabajar con objetos complejos, que van desde simples textos hasta videos, pasando por imágenes y sonido, el objetivo es encontrar un modelo que permita describir la estructura de los objetos, y sobre el que pueda definirse lenguajes de acceso especializados.
Si queremos almacenar datos de texto, la mejor opción es una Base de Datos Relacional, pero para almacenar objetos de video, por ejemplo, una mejor opción sería una base de Datos Orientada a Objetos. Elegir una u otra a sabiendas de que habrá ambos tipos de datos es algo sobre lo que se debe seguir investigando.


Indexación de Imágenes


A la hora de indexar la información de una imagen, la cuestión es optar por técnicas de reconocimiento y procesamiento de imágenes o bien por la asignación manual de frases y términos.
La primera de estas técnicas sufre un problema de escalabilidad, ya que no es capaz de manejar el crecimiento continuo de trabajo, debido en gran parte a que es una técnica a la que le queda mucho por avanzar.
La asignación manual de términos está actualmente más acogida por su sencillez de adaptación, aunque resolver sus problemas de
ambigüedad de términos requiere técnicas más complejas.


Recuperación de textos


Un problema que también está relacionado con la recuperación de la información. Por un lado, y similar a lo expuesto con las imágenes, hay problemas a la hora de indexar correctamente frases. En contraposición a la utilización de términos unitarios, parece que añadir descriptores supone una mejora sustancial, estos deben ser buenos indicadores del contenido.
Por otro lado, el vocabulario del usuario es usualmente diferente del usado a la hora de indexar el documento, por lo que sería ideal el uso de un diccionario de sinónimos para ampliar la consulta del usuario.
El problema de esto es, una vez más, la ambigüedad del lenguaje. La solución, de nuevo, puede solucionarse relacionando el término con el contexto.


Recuperación de imágenes



Para la recuperación de imágenes se utiliza el método CBIR, o Recuperación de imágenes basada en contenido. Una primera aproximación de esta técnica, conseguía recuperar imágenes basándose en la forma y el color de éstas. Tras esto, la técnica ha seguido evolucionando, y ahora se pueden recuperar imágenes basándonos en color, forma, textura y texto. En la actualidad, los sistemas CBIR se centran en tres aspectos fundamentalmente:


  • Extracción de las características de una imagen
  • Mejora de la indexación con el fin de poder realizar búsquedas más eficientes
  • Mejorar las interfaces de usuarios para facilitarles la labor


Existen varios sistemas CBIR destacados, como son el QBIC de IBM, el Virage, o el Excalibur, comprado por Yahoo para su motor de imágenes. Además, son varios los proyectos de universidades e investigaciones centrados en este tipo de tecnologías.


Sistemas Oracle



Oracle por su parte tiene el sistema Oracle InterMedia, que en su versión 11g pasa a llamarse Oracle Multimedia. En este sistema, se definen tipos de datos especiales como son ORDImage, ORDAudio, ORDVideo y ORDDoc. Una vez que estos tipos de datos son almacenados en la base de datos relacional, pueden ser consultados a través de consultas corrientes en lenguaje SQL o PL/SQL.

En el caso de las imágenes por ejemplo, Oracle Multimedia reconoce y extrae metadatos de imágenes en formate JPEG, TIFF y GIF. Una vez estos metadatos han sido extraidos, son guardados en documentos XML que se almacenan en la base de datos. Estos documentos podrán ser indexados y buscados, y de esta forma se conseguirá poder realizar consultas corrientes sobre las imágenes a las que corresponden los metadatos.


8.- Ventajas e inconvenientes



Como en todos los tipos de bases de datos, nuestra variante presenta algunas ventajas e inconvenientes que vamos a describir a continuación:


Ventajas:

  • Versatilidad: Las BBDD multimedia ofrecen la posibilidad de integrar en un único sistema una gran diversidad de formatos (imágenes, texto, video, sonido, etc).
  • Variedad: Ofrecen un mayor abanico de posibilidades a la hora de representar la información.
  • Mercado potencial: El cuál augura que se siga investigando activamente en el futuro.


Inconvenientes:

  • Ocupación: Necesita grandes espacios para almacenar toda la información que queremos.
  • Ancho de banda alto: Este tipo de bases de datos necesitan grandes anchos de banda para obtener un rendimiento óptimo.
  • Complejidad: En cuanto a programar operaciones, o incluso la interfaz, debido a la alta cantidad de formatos que hay que manejar, lo que puede repercutir en su rendimiento.
  • Costo, una diferencia a tener en cuenta cuando usamos este tipo de bases de datos es su factibilidad económica, ya que las DBMS pueden llegar a ser costosas si el tamaño de los archivos es alto, esto se debe a que el rendimiento de estas bases de datos depende, en gran medida, de los componentes hardware utilizado para el almacenamiento de los datos (servidores), y distribución de los mismos (altas velocidades en las redes de comunicación). Es por ello por lo que se requieren redes de transmisión de datos con una buena Calidad de Servicio, de modo que los datos se sirvan en el momento oportuno.


9.- Ejemplos



Hoy en día, con un crecimiento tecnológico cada vez mayor en la sociedad, con ordenadores en muchísimos hogares, con móviles con la capacidad de conectarse a internet, etc, las bases de datos multimedia tienen una gran importancia, y están cada vez más presentes. Estos son algunos ejemplos:


  • Ocio y entretenimiento


Conocidos sitios como Youtube, Goear, o Flickr poseen una base de datos multimedia con la capacidad de almacenar videos, música o fotos. Por otra parte, las bases de datos multimedia pueden ser de gran utilidad para agencias publicitarias y de viaje, puesto que son ámbitos donde se trabaja con sonido, video, fotos, e información asociadada a todo ello.


  • Educación/Formación


Sitios donde se pueden compartir documentos, como SlideShare o Scribd, también tienen bases de datos multimedia con el fin de poder guardar presentaciones de power point, o documentos de Word, pdf, etc. Además no es de extrañar que cada vez más se introduzcan este tipo de bases de datos en el ámbito de la educación, pues ya existen campus virtuales donde básicamente se trabaja con tipos de datos multimedia.


  • Sector empresarial


Cualquier empresa de cualquier ámbito podría estar interesada en almacenar documentos muy variados e información relacionada a ellos, bien pueden ser catálogos de ventas, fichas de trabajadores, actas de seguros, historiales clínicos, etc, lo que hace necesaria una base de datos multimedia.


10. Las ontologías ¿una solución?




Cuando queremos hablar de ontología nos referimos la Ontología Génica que provee un vocabulario controlado que describe el gen y los atributos del producto génico en cualquier organismo, en este caso sería una base de datos Multimedia. La ontología genética es algo que esta en proceso de desarrollo, mejor dicho en estado embrionario si nos referimos a la informática, se esta investigando sobre ello y hay grupos que se dedican al desarrollo y uso de GO (Gene Ontology), lo que ha permitido que la GO se haya convertido en una de las herramientas estándar en la bioinformática.

Que pretende la ontología en las bases de datos multimedia, pretende establecer un vocabulario generando una ontología a partir de una metodología prestablecida que nos permita desarrollarla y una arquitectura ontológica de bases de datos, propuesta previamente, todo esto para poder realizar busquedas por contexto dentro de nuestra base de datos multimedia. A continuación se muestra el modelo ontológico para las bases de datos multimedia, que en general poseen conceptos, operaciones y restricciones.






Por ejemplo ahora deberemos definir la taxonomía de los conceptos de bases de datos multimedia, lo que despues nos permitiria obtener un esquema como el siguiente.







Como vemos para definir el funcionamiento de las ontologías en una base de datos tendremos que definir diferentes taxonomías, que después nos permitan indagar a través de ellas para buscar información, para lo que habrá que tener un gestor de búsqueda que nos permita hacerlo. Además de tener un sistema de aprendizaje autónomo, dentro de la bases de datos, capaz de aprender cada nuevo concepto introducido, como un atributo o un nuevo proyecto o una nueva herramienta, por último comentar que esto es algo que se esta investigando, y que no se sabe si algun día llegará a desarrollarse cumpliendo los onjetivos esperados.




1.- Bibliografía


Tramullas

Documento de la Universidad de Trujillo
Universidad complutense de Madrid
Modelos de Bases de Datos
Ontologías en las bases de datos
Revista Ciencia e Ingenieria. Vol. 30, No 2, pp. 149-160, abril-julio, 2009. ISSN 1316-7081