jueves, 26 de marzo de 2009

Multimedia Informativa


Hoy las páginas web, especialmente de noticias y sitios Web (por ejemplo, CNN, Yahoo, MySpace, Facebook, YouTube, etc.), suelen ser ricos en los medios de comunicación, que contienen ambas imágenes y vídeo. Se espera que esta tendencia continúe como los medios de comunicación ricos en las páginas web cada vez más populares.

. Además de los principales contenidos, las páginas web suelen contener varios anuncios y otros contenidos que son periféricamente relacionadas con el contenido principal de la página. A los efectos de esta aplicación, el contenido multimedia en una página web que está clasificada como bien informativa o "auxiliar" de contenido. Multimedia, tales como anuncios, las ayudas a la navegación, gráficos decorativos, o cualquier otro contenido periféricamente relacionadas con la parte informativa de la página se considera como auxiliar contenido.. En su mayor parte, los usuarios visiten una página web sobre todo por su contenido informativo.

En la mayoría de las aplicaciones web de minería de datos, la inclusión de auxiliares de contenido pueden degradar su rendimiento. En los últimos años, es la investigación en el análisis de contenido web y extracción que los intentos para hacer frente a semejante problema, pero muchos hacen hincapié en la información textual en lugar de los correspondientes datos multimedia Por lo tanto, invita a este Gran Reto soluciones robustas a la identificación y extracción de información de contenidos multimedia para cualquier página web arbitraria autor en cualquier idioma, no sólo Inglés: Idealmente, nos gustaría tener un Grand Challenge es la solución que más del 99% exacto para cualquier página web de cualquier idioma.

Entrada / Salida

Ejemplo:

De entrada sería una página web de la CNN o sitio web de compras Amazon, con la URL.. La página tendrá una o más imágenes y vídeos relacionados con el contenido principal (por ejemplo, noticias), así como otras imágenes y videos que muestran los anuncios o en calidad de ayudas a la navegación. Este contenido auxiliares, como los anuncios o las ayudas a la navegación, puede ser en diferentes formatos, por ejemplo, GIF, PNG, JPEG, MPEG, o SWF / FLV desempeñado por la versión de Flash Player.. El informativo de imágenes y contenido de video también puede ser en uno de estos formatos también.

En el caso mencionado, la salida sería un conjunto de todos las imágenes y vídeos de la página web junto con la caracterización de cada elemento multimedia como "contenido informativo" o "auxiliar de contenido". Además la caracterización de "contenido informativo" en categorías tales como noticias, deportes, etc. sería de más interés, pero que no es esencial.

0 comentarios:

Publicar un comentario en la entrada