Recuperación de Información

Opciones de búsqueda en Google imágenes vs Bing

dokumenta - 01 de agosto de 2009 - 20:33 - Recuperación de Información

La búsqueda de imágenes de Google ya muestra también opciones avanzadas véase post oficial de Google

De momento estas opciones no están para el español , al igual que las opciones de búsqueda para la búsqueda universal web.

En Google las opciones son:

> Por tamaño: cualquiera, medio, grande, pequeña, mayor que x, exactamente

> Por tipo: cualquiera, cara, foto, viñeta, clip art

> Por color: cualquiera, blanco y negro, selección de color

Si lo comparamos con Bing éste tiene las siguientes opciones:

> Tamaño : cualquiera, pequeña, intermedia, grande, papel tapiz

> Diseño: cualquiera, cuadradas, anchas y altas

> Color: cualquiera, a color, blanco y negro

> Estilo: cualquiera, fotografías, ilustraciones

> Personas: cualquiera, caras, cabeza y hombros, otros

Se puede ver que en el caso de Bing hay más opciones de búsqueda pero en Google hay más posibilidades de filtrado para las opciones de búsqueda. En el caso de Bing dichas opciones están disponibles también para el español

Un aspecto positivo de Bing es que no pierdes la lista de resultados aunque accedas a uno de ellos, ya que tienes un panel lateral donde se pueden visualizar el resto de resultados de imágenes para la búsqueda realizada, lo que ya no se entiende tan bien y creo no está bien resuelto es el enlace superior: "Todos los resultados".

En cambio en Google para ver de nuevo la lista de resultados tienes que hacer clic en "Back to image results"

Por otro lado, en cuanto a medición en Google Analytics, se puede saber el tráfico que te llega de Google imágenes, pero al ser origen de trafico de referencia no es posible conocer las palabras clave por las que llegan tus usuarios a tus imágenes :(

0 comentarios

Estructurando la información: Google Squared

dokumenta - 04 de junio de 2009 - 22:53 - Recuperación de Información

Google Labs nos trae otra aplicación interesante con el objetivo de categorizar la información de los resultados mostrándola en una especie de "cuadrícula". La idea y el concepto son realmente buenos y podría ser muy útil para poder tomar una decisión más eficaz ante los resultados, pero haciendo pruebas parece que no funciona demasiado bien todavía a nivel resultados ...

Al parecer, con los datos que editamos y creamos en ’Google Squared’ el sistema aprence a partir de nuevos campos que creamos para un determinado ’square’, o nuevos ’squares’ de términos que introducimos.

Ante las búsquedas te propone un cuadro semántico donde los resultados se ven categorizados según los campos que estima convenientes ante la petición, el usuario puede añadir y eliminar más campos de información. También puede guardar sus "squares" y compartirlos con sus contactos.

Quizás como apuntan en Error 500 el "invento" haya sido ideado "para desarrollos de terceros que pudieran obtener los atributos de productos y categorías de productos". Quizás para intranets, para mostrar los productos informativos de forma más eficaz, para vigilancia ... mediante API de Google Squared. Pero también creo que puede ser útil para el usuario final, se comparan mucho mejor los resultados, si se está buscando una lista de productos y además puedes adaptar los campos que necesitas para tomar una decisión, es muy valioso dichos listados dinámicos que aportan dicha flexibilidad. Sería una mejora para "competir" con buscadores verticales.

Dicha herramienta me recuerda un poco a mi experiencia con Denodo . Que muy resumidamente se trata de rastrear e indexar la información web, luego se parsea dicha información (aquí la tarea complicada) y se establecen los campos donde irá cada fragmento informativo parseado. Pero aquí dan un paso más porque te muestra de forma automática los campos más acordes para la consulta (luego el usuario puede añadir o eliminar campos).

Muchos lo están comparando con Wolfram Alpha pero de momento los resultados y su visualización distan mucho ...

Así que una vez más vemos la importancia que tendrá el etiquetado y los microformatos para que Google lo tenga más fácil para interpretar la información y así podamos fragmentarla en resultados según necesidades.

Anuncio de Google Squared en el blog de Google

6 comentarios

Wolfram|Alpha

dokumenta - 26 de abril de 2009 - 21:36 - Recuperación de Información

Hace algún tiempo que Stephen Wolfram anunciaba en su blog que iba a lanzar Wolfram|Alpha. Como nos contaban desde Denken Über, se presentaba como un nuevo paso en Internet. En ReadWriteWeb han publicado ahora sus impresiones tran una demostración con Stephen Wolfram del producto, fundador y CEO de Wolfram Research, del nuevo buscador Wolfram|Alpha cuyo lanzamiento tendrá lugar en mayo (están dando accesos "escogidos", se puede solicitar información). De momento sólo estará disponible en inglés.

A pesar de su gran potencial para el procesamiento del lenguaje natural, no parece que vaya a ser un competidor de Google quizás por sus grandes diferencias y objetivos. Aunque ante preguntas especializadas y concretas para resultados factuales Google "perderá" ante buscadores como éste ...

Al parecer, será capaz de responder ante la formulación de preguntas a partir de su potente base de datos y algoritmos. Se construye bajo una base matemática, física y también química. Será capaz de crear conocimiento a partir de la información de la que dispone. No busca respuestas, las construye. De este buscador se esperan respuestas factuales ante preguntas objetivas. Se pueden ver demostraciones en diferentes categorías.

Algunas informaciones interesantes en RealWriteWeb:

- Tendrá una versión gratuita y otra de pago en la "versión pro" el usuario podrá obtener los datos que hay detrás de los resultados para sus propio tratamiento

- Integración en webs propias y alertas (ante cambios de resultados ante las búsquedas)

- En cada resultado se verán las fuentes utilizadas para obtenerlos

- Mostrará también anuncios en el lateral y llegará acuerdos comerciales con otras entida

- También mostrará sus resultados en buscadores tradicionales (Google, Yahoo y Live)

- No creen que pueda poner en peligro a Google. Wolfram lo denomina "computational knowledge engine" (no como lo que entedemos por motor de búsqueda)

- Por otra parte, se acerca mucho como competidor o complemento a la wikipedia u otras obras de referencia, en vez de tener que navegar por dichas fuentes puedes

- Parece que la demo está más enfocada al área de las matemáticas y la ingeniería, habrá que ver cómo se comporta ante preguntas de historia ...

- Ven improbable que pueda ser el próximo Cuil

0 comentarios

Webmynd, añadiendo resultados a tus búsquedas

dokumenta - 23 de marzo de 2009 - 09:36 - Recuperación de Información

Webmynd es una de las últimas extensiones para navegadores que he probado y me parece bastante interesante, permite añadir diferentes tipos de resultados de búsqueda en Google, Yahoo! o Live Search. Se puede descargar para Firefox y para Internet Explorer

Aunque Google añade diferentes tipos de resultados a la búsqueda universal lo bueno de esta funcionalidad es que es configurable según los intereses del usuario y que añade sitios que no son de Google.

No sé si a Google le hará mucha gracia esta nueva extensión pues provoca que al incluir más resultados en el lateral los enlaces patrocinados bajen mucho en la página

Por otra parte, WebMynd almacena en su caché el contenido de tal manera que podemos consultar la página tal como la visitamos en su día. Por defecto almacena todas las páginas que visitamos, pero se puede evitar desde el menú "Herramientas->WebMynd Settings" desde donde podremos indicar los sitios que no queremos almacenar. También permite configurarlo para que sólo almacene las páginas bajo petición.

Así podemos acceder a la información y páginas que nos han interesado en offline, cuando no tenemos disponible una conexión a internet.

Puedes encontrar más información en el Blog de Webmynd

Otra extensión interesante para las búsquedas es KwiClick que presenta la información de las webs dentro de una pequeña ventana contextual sin necesidad de abrir varias pestañas para buscar información de sitios como Google, Flickr, Wikipedia, Amazon, YouTube, del.icio.us y Technorati. Muestra pequeña ventana de resultados de búsqueda sin tener que navegar por otra página (vía Bitácora del webmaster)

1 comentario

mapas en los libros con Google

dokumenta - 05 de noviembre de 2008 - 00:37 - Recuperación de Información

A través de Turisfera he recordado un interesante uso de google maps que nos acerca rápidamente a aquellos lugares en los que discurren las grandes historias ... Con el mashup de Google: Google book search + Google maps api.

El equipo de Google books search explicó que cuando detectan un importante número de localizaciones de calidad en una obra marcarían sus localizaciones en los mapas. Por tanto te muestra en el mapa los lugares en los que ocurren las historias, con el nº de pag, referencia de lo que en dicha localización pasa en el libro...

Algunos libros interesantes en los que se pueden encontrar localizaciones: Guerra y paz , La biografía de Bach, Las uvas de la ira , La vuelta al mundo en 80 días ...

El uso de la API de Google maps ha dado lugar a interesantes "map mashups" en el ámbito de los libros, uno de los más representativos es el Atlas de la ficción: "real places imagined by great writers" que describe y sitúa en Google maps lugares reales que los escritores han incluido en sus novelas.

El usuario también puede hacer el proceso inverso y encontrar en Google Earth una capa que marca si dispone de fragmentos de obras literarias que se refieren a las localizaciones ...

1 comentario

BOSS de Yahoo

dokumenta - 10 de julio de 2008 - 14:56 - Recuperación de Información

BOSS (Build Your Own Search Service)es la nueva API que posibilita la búsqueda sobre los resultados de Yahoo combinados con los de otras fuentes y realizar variaciones en la experiencia del usuario sobre los resultados. Yahoo, tras Search Monkey sigue abriendo otras posibilidades de negocio de apoyo a otros que se ahorrarían costes a cambio de compensaciones en el campo publicitario.

Por tanto, según ha anunciado, permitirá a otros sitios usar su tecnología para la creación de servicios propios de búsqueda. Así que, parece que continua la línea de negocio de apertura. Los usuarios podrán crear buscdores verticales, buscadores con mayor carga social y visual. Algunos aspectos positivos a destacar son: la posibilidad de realizar peticiones ilimitadas y poder mostrar los resultados como propios.

0 comentarios

Comparando resultados con SearchCrystal

dokumenta - 15 de julio de 2007 - 22:41 - Recuperación de Información

El metabuscador SearchCrystal compara gráficamente los resultados de diferentes buscadores en un mismo medio.
Se pueden encontrar páginas, imágenes, video, rss, blogs.. compartiendo los resultados, mezclándolos o comparándolos en una sola página. Para utilizarlo es necesario logearse. Se puede incluir como wiget en blogs e integrar en Facebook.

Los buscadores que utiliza, son Google, Yahoo, MSN, Ask, Exalead, Gigablast, Wisenut, Altavista y Alltheweb. También permita hacer búsquedas sobre sitios como Flickr o Youtube

0 comentarios

Quaero: Europa vs.Google

dokumenta - 18 de enero de 2006 - 00:44 - Recuperación de Información

Al parecer el desafio europeo , impulsado por Francia y Alemania, a Google está dando sus primeros pasos. Algunos de los socios del proyecto son: France Télécom y Deutsche Telekom, el Instituto Nacional francés de Investigación Informática y Automática, y la Universidad de Karlsruhe. El grupo mediático alemán Bertelsmann está cerca de un acuerdo para convertirse en el líder alemán del proyecto.

Uno de los elementos de dicho proyecto contará con aplicaciones de transcripción, indexación y traducción automática de documentos audiovisuales.

Según se apunta en el artículo publicado el día 15 de enero en el País por Andrea Rizzi, se observa este nuevo buscador de iniciativa pública, como una defensa a la hegemonía cultural estadounidense: "defender la diversidad de culturas ante la amenaza de la uniformidad".

Aunque Google parece presentar pluralidad ideológica y cultural como lo refleja el que cuente con más de cien dominios diferentes, aunque google también sea reflejo de lo que está pasando en la red en general, la hegemonía anglosajona es latente.

Japón también está trabajando en la creación de un portal de búsquedas nacional, auspiciado por compañías como Nec, Fujitsu y Matsushita, entre otras.

0 comentarios

Google Base

27 de octubre de 2005 - 00:06 - Recuperación de Información

Gracias a Tony Ruscoe y su "buscador de subdominios" éste descubre: google base . Se describía como una gran base de datos en la que podía añadirse cualquier tipo de contenido, de forma que fuera fácilmente recuperable en línea de forma gratuita (pronto dejaría de estar disponible). Algunos de los ejemplos mostrados de los registros que podían ser incluidos: Descripción de próximos eventos de la web, ventas, descripción de la organización de una celebración ... A los items se les podría añadir atributos para ayudar a los usuarios a buscar en Google Base.

Se comentaba que Google pretende añadir resultados de feeds (de 1 a 3) sobre los resultados de búsqueda y que éstos se mostraran de forma combinada con los resultados al ejecutar las búsqueda.

Google contestaba que el nuevo "test site" pretendía investigar en hacer más sencillo a los usuarios de Google el envío de contenido así como hacerlo fácilmente recuperable ...: "Like our Web crawl and the recently released Google Sitemaps program, we are working to provide content owners an easy way to give us access to their content. We're continually exploring new opportunities to expand our offerings, but we don't have anything to announce at this time." Así que de momento no parece haber nada anunciado "oficialmente".

0 comentarios

Google Sitemaps

12 de junio de 2005 - 18:31 - Recuperación de Información

Google Sitemaps tiene la misión de informar de una forma más eficiente a su robot para una mejor navegación de las páginas, en aspectos tales como el grado de actualización de las páginas, relavancia de las mismas respecto al resto del site ... También tiene el objetivo de aumentar su cobertura.
Se trata de un nuevo "experimento" de navegación que pretende aumentar el vol de págs y mejorar el tiempo de inclusión el el "index". Se trata la creación de un fichero estandarizado en el servidor (bajo licencia "Attribution-Share Alike Creative Commons".)
Para generar el fichero, Google ha creado un pequeño script en Python que debe ser ejecutado en nuestro servidor.
Supone un rastreo de las páginas acorde con los cambios que se producen en las mismas. Google resumen el proceso en 2 pasos:
1. Generar Sitemap en el formato adecuado
2. Actualizar el Sitemap cuando se producen cambios.

Google recomienda especialmente su utilización para: webs que requieren un mayor rastreo de sus páginas y para webs que requieren indicar el grado de actualización de sus páginas.
Su utilización es gratuita y no influencia sobre el PageRank.
Pretende enseñar a Google sobre la estructura de los sites produciendo una mejora en el trabajo de rastreo.
Utiliza el "Sitemap Protocol" en XML. Puede usuarse para la inclusión del Sitemap de forma automática el "Sitemap Generator script", también podría usarse una solicitud http (para su localización ): www.google.com/webmaster/sitemaps/ping?sitemap=http://wwww. (...)
Se pueden incluir en el Sitemap el listado de URLs o los hosts correspondientes a las mismas (para facilitar la tarea en casos de págs dinámicas).
Otros formatos que también soportaría son: OAI protocol for metadata harvesting, RSS 2.0, Atom 0.3
Aunque ser recomienda el formato XML (aporta más información) también puede incluirse simplemente un fichero de texto (UTF-8) que contenga una lista de URLs.
Por tanto, Google utiliza un esquema XML para definir los elementos y atributos que pueden aparecer el fichero Sitemap.

El "Sitemap Generator" puede crear sitemaps desde una lista de URLs, acceso logs, directorio de los host ... (requiere Phythom 2.2 o superior).
Así, la información principal que ofrece "XML Sitemap Format" es:
- Grado de actualización
- Últimas modificaciones
- Pesos de relevancia de las urls
A partir de los siguientes tags: changefreq, lastmod, loc, priority, url, urlset
Cada fichero sitemap no debe contener más de 50.000 urls y no pesar más de 10 MB.
Aumentará significativamente su volúmen de información? Será más rapido en la indexación de las págs si su navegación es más eficiente? Cómo afectará en el posicionamiento ? ..........
Más información:
Dirson: http://google.dirson.com/noticias.new/1374/
Google: https://www.google.com/webmasters/sitemaps/docs/en/about.html
N.Kennedy:
http://www.niallkennedy.com/blog/archives/2005/06/google_sitemaps.html

0 comentarios

Diferentes resultados

11 de abril de 2005 - 00:58 - Recuperación de Información

Algunas de las posibles herramientas, para seguir conociendo mejor el distinto comportamiento de los buscadores y ayudar al usario a seleccionar los que mejor se ajusten a sus necesidades, son:

-Yagoohoogle, comentado en el blog irsweb sobre Recuperción de Información, permite visualizar simultáneamente los resultado obtenidos para una misma búsqueda en Yahoo y Google.
-También comentado en esta bitácora encontramos la referencia de una recurso interesante que permite visualizar de forma rápida, debido a su formato gráfico, el comportamiento de dos grandes buscadores (Yahoo y Google) es: http://www.langreiter.com/exec/yahoo-vs-google.html (para los 100 primeros resultados).
-Jux2 que como bien comentan en Deakialli posibilita ver los resultados que se recuperan en los buscadores estudiados, resultados que no presenta el buscador seleccionado, etc ... Se trataría de un buscador que ofrece la posibilidad de ordenar los recursos según el número de coincidencias de resultados con los buscadores seleccionados. A partir de las búsquedas ejecutadas por los usuarios realizan estadísticas con el fin de reflejar las diferencias entre los mismos (aunque las estadísticas que ofrecen son escasas).
-Otros recurso interesante es Turbo10 (sobretodo las opciones "topic clusters", "edit my collection" y "engine filtering").

0 comentarios