dokumenta - marketing on-line, SEO, usabilidad y documentación



busca...




Se muestran los artículos pertenecientes al tema Recuperación de Información.

15/07/2007

Comparando resultados con SearchCrystal

20070715224042-crystal.gif

El metabuscador SearchCrystal compara gráficamente los resultados de diferentes buscadores en un mismo medio.
Se pueden encontrar páginas, imágenes, video, rss, blogs.. compartiendo los resultados, mezclándolos o comparándolos en una sola página. Para utilizarlo es necesario logearse. Se puede incluir como wiget en blogs e integrar en 
Facebook.

Los buscadores que utiliza, son Google, Yahoo, MSN, Ask, Exalead, Gigablast, Wisenut, Altavista y Alltheweb. También permita hacer búsquedas sobre sitios como Flickr o Youtube

Etiquetas: , , , , ,

15/07/2007 22:41 Autor: dokumenta. Enlace permanente. Tema: Recuperación de Información No hay comentarios. Comentar.

18/01/2006

Quaero: Europa vs.Google

Al parecer el desafio europeo , impulsado por Francia y Alemania, a Google está dando sus primeros pasos. Algunos de los socios del proyecto son: France Télécom y Deutsche Telekom, el Instituto Nacional francés de Investigación Informática y Automática, y la Universidad de Karlsruhe. El grupo mediático alemán Bertelsmann está cerca de un acuerdo para convertirse en el líder alemán del proyecto.

Uno de los elementos de dicho proyecto contará con aplicaciones de transcripción, indexación y traducción automática de documentos audiovisuales.

Según se apunta en el artículo publicado el día 15 de enero en el País por Andrea Rizzi, se observa este nuevo buscador de iniciativa pública, como una defensa a la hegemonía cultural estadounidense: "defender la diversidad de culturas ante la amenaza de la uniformidad".

Aunque Google parece presentar pluralidad ideológica y cultural como lo refleja el que cuente con más de cien dominios diferentes, aunque google también sea reflejo de lo que está pasando en la red en general, la hegemonía anglosajona es latente. 

Japón también está trabajando en la creación de un portal de búsquedas nacional, auspiciado por compañías como Nec, Fujitsu y Matsushita, entre otras.

 

18/01/2006 00:44 Autor: dokumenta. Enlace permanente. Tema: Recuperación de Información No hay comentarios. Comentar.

27/10/2005

Google Base

20051027000533-google-base-jpg

Gracias a Tony Ruscoe y su "buscador de subdominios" éste descubre: google base . Se describía como una gran base de datos en la que podía añadirse cualquier tipo de contenido, de forma que fuera fácilmente recuperable en línea de forma gratuita (pronto dejaría de estar disponible). Algunos de los ejemplos mostrados de los registros que podían ser incluidos: Descripción de próximos eventos de la web, ventas, descripción de la organización de una celebración ... A los items se les podría añadir atributos para ayudar a los usuarios a buscar en Google Base.

Se comentaba que  Google pretende añadir resultados de feeds (de 1 a 3) sobre los resultados de búsqueda y que éstos se mostraran de forma combinada con los resultados al ejecutar las búsqueda.

Google contestaba que el nuevo "test site" pretendía investigar en hacer más sencillo a los usuarios de Google el envío de contenido así como hacerlo fácilmente recuperable ...: "Like our Web crawl and the recently released Google Sitemaps program, we are working to provide content owners an easy way to give us access to their content. We're continually exploring new opportunities to expand our offerings, but we don't have anything to announce at this time."  Así que de momento no parece haber nada anunciado "oficialmente".

 

27/10/2005 00:06 Enlace permanente. Tema: Recuperación de Información No hay comentarios. Comentar.

12/06/2005

Google Sitemaps

google2.jpg

Google Sitemaps tiene la misión de informar de una forma más eficiente a su robot para una mejor navegación de las páginas, en aspectos tales como el grado de actualización de las páginas, relavancia de las mismas respecto al resto del site ... También tiene el objetivo de aumentar su cobertura.
Se trata de un nuevo "experimento" de navegación que pretende aumentar el vol de págs y mejorar el tiempo de inclusión el el "index". Se trata la creación de un fichero estandarizado en el servidor (bajo licencia "Attribution-Share Alike Creative Commons".)
Para generar el fichero, Google ha creado un pequeño script en Python que debe ser ejecutado en nuestro servidor.
Supone un rastreo de las páginas acorde con los cambios que se producen en las mismas. Google resumen el proceso en 2 pasos:
1. Generar Sitemap en el formato adecuado
2. Actualizar el Sitemap cuando se producen cambios.

Google recomienda especialmente su utilización para: webs que requieren un mayor rastreo de sus páginas y para webs que requieren indicar el grado de actualización de sus páginas.
Su utilización es gratuita y no influencia sobre el PageRank.
Pretende enseñar a Google sobre la estructura de los sites produciendo una mejora en el trabajo de rastreo.
Utiliza el "Sitemap Protocol" en XML. Puede usuarse para la inclusión del Sitemap de forma automática el "Sitemap Generator script", también podría usarse una solicitud http (para su localización ): www.google.com/webmaster/sitemaps/ping?sitemap=http://wwww. (...)
Se pueden incluir en el Sitemap el listado de URLs o los hosts correspondientes a las mismas (para facilitar la tarea en casos de págs dinámicas).
Otros formatos que también soportaría son: OAI protocol for metadata harvesting, RSS 2.0, Atom 0.3
Aunque ser recomienda el formato XML (aporta más información) también puede incluirse simplemente un fichero de texto (UTF-8) que contenga una lista de URLs.
Por tanto, Google utiliza un esquema XML para definir los elementos y atributos que pueden aparecer el fichero Sitemap.

El "Sitemap Generator" puede crear sitemaps desde una lista de URLs, acceso logs, directorio de los host ... (requiere Phythom 2.2 o superior).
Así, la información principal que ofrece "XML Sitemap Format" es:
- Grado de actualización
- Últimas modificaciones
- Pesos de relevancia de las urls
A partir de los siguientes tags: changefreq, lastmod, loc, priority, url, urlset
Cada fichero sitemap no debe contener más de 50.000 urls y no pesar más de 10 MB.
Aumentará significativamente su volúmen de información? Será más rapido en la indexación de las págs si su navegación es más eficiente? Cómo afectará en el posicionamiento ? ..........
Más información:
Dirson: http://google.dirson.com/noticias.new/1374/
Google: https://www.google.com/webmasters/sitemaps/docs/en/about.html
N.Kennedy:
http://www.niallkennedy.com/blog/archives/2005/06/google_sitemaps.html

12/06/2005 18:31 Enlace permanente. Tema: Recuperación de Información No hay comentarios. Comentar.

11/04/2005

Diferentes resultados

busc4.JPGAlgunas de las posibles herramientas, para seguir conociendo mejor el distinto comportamiento de los buscadores y ayudar al usario a seleccionar los que mejor se ajusten a sus necesidades, son:

-Yagoohoogle, comentado en el blog irsweb sobre Recuperción de Información, permite visualizar simultáneamente los resultado obtenidos para una misma búsqueda en Yahoo y Google.
-También comentado en esta bitácora encontramos la referencia de una recurso interesante que permite visualizar de forma rápida, debido a su formato gráfico, el comportamiento de dos grandes buscadores (Yahoo y Google) es: http://www.langreiter.com/exec/yahoo-vs-google.html (para los 100 primeros resultados).
-Jux2 que como bien comentan en Deakialli posibilita ver los resultados que se recuperan en los buscadores estudiados, resultados que no presenta el buscador seleccionado, etc ... Se trataría de un buscador que ofrece la posibilidad de ordenar los recursos según el número de coincidencias de resultados con los buscadores seleccionados. A partir de las búsquedas ejecutadas por los usuarios realizan estadísticas con el fin de reflejar las diferencias entre los mismos (aunque las estadísticas que ofrecen son escasas).
-Otros recurso interesante es Turbo10 (sobretodo las opciones "topic clusters", "edit my collection" y "engine filtering").
11/04/2005 00:58 Enlace permanente. Tema: Recuperación de Información No hay comentarios. Comentar.




Zaida Santiago

Reflexiones sobre marketing on-line, SEO, usabilidad y documentación

Archivos

Temas

Enlaces


Suscrí
bete a este blog. RSS 2.0 Este Blog ha sido creado con Blogia. Ver derechos de autor . Estadísticas. Admin. [Blogia colabora con 1001 relatos.]