2. GOOGLE. Búsquedas avanzadas


Desde sus inicios en septiembre de 1998 hasta hoy día, Google ha crecido a un ritmo frenético. Ha pasado de ser un eficaz motor de búsqueda en Internet a una empresa de servicios en red capaz de cubrir las necesidades más comunes de cualquier internauta.

Con el pinchazo de la burbuja de las punto com y el surgimiento de Google ocurre un punto de inflexión en la web. Por una parte las empresas que se habían apresurado en invertir en Internet tienen enormes pérdidas y se retiran del juego quedando en la red aquellos que aún confiaban en su potencial (social). Por otra, Google comienza a despuntar como un buscador eficaz que permitía sacar a la luz aquellas webs que por su estructura se habían mantenido en la oscuridad anteriormente.

Introducción

Google es un poderoso sistema de búsqueda en Internet que permite un acceso muy fácil y rápido a cualquier tipo de información que haya disponible en la Gran Red, desde cualquier lugar del mundo.

Como curiosidad podemos decir que el nombre se creó permutando las letras de la palabra GOOGOL que fue inventada por Milton Sirotta cuando su tío, el matemático americano Edward Kasner, le pidió que "bautizase" a un número muy grande (10 elevado a 100: un 1 seguido de 100 ceros).
La empresa tuvo sus orígenes en un garaje de California a partir de un proyecto universitario y contaba con cuatro empleados (1998). En la actualidad recibe más de 200 millones de consultas diarias y tiene más de 2000 trabajadores. Es posible efectuar búsquedas en mas de 35 millones de documentos HTML.

Este y otros buscadores de la red son tan potentes que comportan ciertos problemas, ya que gracias a Google y a herramientas similares es casi imposible conservar intacta la privacidad en Internet. Basta, por ejemplo, con encontrar el nombre de una persona en la red y acceder a servicios como las páginas blancas para tener acceso a su teléfono y dirección.


Pero esta misma tecnología de búsquedas masivas permite cosas como por ejemplo navegar a través de un museo con la mayoría de las páginas web desde la fecha de su creación. Entra en www.archive.org, escribe una dirección y curiosea las distintas versiones de la página desde su creación.

Google es un sitio que se ha convertido en sinónimo de búsquedas en Internet. Pero Google es mucho más que un simple sitio de búsqueda. Es una poderosa herramienta que si se utiliza adecuadamente puede ayudarnos mucho y ahorrarnos un tiempo precioso en la búsqueda de información en la red.

Cómo funciona Google

El funcionamiento de Google se basa en el cruce de diversas informaciones presentes en las páginas web registradas en la gigantesca base de datos del motor de búsqueda, y en la determinación de un orden jerárquico específico de las páginas obtenidas en cada búsqueda. El criterio de búsqueda de evaluación se apoya en la estructura de enlaces de la web. Mediante este mecanismo Google consigue rastrear e indexar eficientemente la web, y producir resultados más exactos que los de otros sitios de búsqueda. Esto es posible porque además de buscar por palabras, también atribuye un ranking o una "nota" para las páginas. Para determinar la "nota" de una página Google utiliza una función llamada PageRank. Un factor importante en esta función es el número de páginas (referencias) que apuntan hacia la página que evalúa. Si tienes curiosidad por los fundamentos matemáticos de la función PageRank, puede obtenerlos aquí y aquí(en inglés).


Para presentar los resultados al usuario, los programas de búsqueda trabajan básicamente de dos formas:

  • por medio de un esquema de registro de páginas o sitios en el que las páginas que desean aparecer deben registrarse.
  • Y por rastreo de la web, que es llevado a cabo por programas llamados robots que solicitan páginas a los servidores web y, además de almacenarlas para usos futuros, extraen sus enlaces en ellas contenidos a otras páginas. Estos enlaces se almacenan para ser visitados con posterioridad. De esta forma, si en una página almacenada hay una referencia a una página nueva, ésta será descubierta.


Pero el proceso no acaba cuando una página ha sido "descubierta". Es necesario almacenar el contenido de la página de forma ordenada, es decir, en forma de índices. Cada índice contiene un conjunto diferente de información sobre la página almacenada y, para cada página indexada, se almacenará información como: palabras contenidas en la página, título, enlaces... Con esta información el orden jerárquico comienza a calcularse.

Conoce la herramienta Google

Para usar Google podemos dirigirnos a la página de Google en España , o la página central. Entre ellas hay algunas diferencias relativas a la interfaces del idioma y a los servicios disponibles, pero el funcionamiento de las herramientas es básicamente el mismo.

Hacer una búsqueda en Google es algo muy sencillo: basta con teclear la palabra o frase deseada en la caja de búsqueda y hacer clic en Búsqueda (o pulsar Intro). Inmediatamente después aparecerá una pantalla en la que se listan los resultados de la búsqueda.

Un clic ahora sobre el enlace que selecciones e inmediatamente serás direccionado al sitio deseado. Los enlaces se muestran ordenados por la probabilidad de contener la información solicitada, y esto sobre la base del orden jerárquico establecido por Google. El enlace del sitio aparece en azul. A continuación se incluye una descripción del sitio, obtenida a partir de una etiqueta en el código del propio sitio, o, en otros casos, puede consistir en un fragmento del contenido del sitio. Después de la descripción aparece la dirección (URL) del sitio, el tamaño de la página a la que hace referencia el enlace además de dos opciones: En caché y Páginas similares.

Al hacer clic en el vínculo almacenado en caché, se verá el contenido de la página web tal como aparecía en el momento en que la indexamos. Si por algún motivo, el vínculo del sitio no muestra la página actual, todavía puede obtener la versión en caché y encontrar la información que se necesita. Los términos de la búsqueda aparecen resaltados en la versión almacenada en caché.

En la pantalla de resultados, presenta además los enlaces para las páginas encontradas, el número de páginas web que Google ha encontrado en ese momento y el tiempo que empleó en la búsqueda.

Si deseamos conocer con más detalle los elementos de la pantalla de Google podemos consultarlos aquí.

Búsqueda

El enlace Búsqueda cuenta con tres opciones en Google España:

  • La web, con esta opción Google realizará la búsqueda en fuentes web de todo el mundo, pero limitándose a documentos WWW, es decir dejando fuera direcciones ftp, telnet, ...
  • Páginas en español, Google filtrará las páginas cuyo contenido se identifique como escrito en español.
  • Páginas en España, Google filtrará la búsqueda de forma que sólo devolverá los enlaces que tengan que ver con direcciones IP españolas.

Como ejercicio realiza la misma búsqueda con las tres opciones y verás la diferencia de resultados entre unas y otras. Busca por ejemplo la palabra "virus".


Guía de búsqueda en Google

Google ignora las palabras y caracteres comunes, conocidos como términos superfluos. Descarta automáticamente términos como "http" y".com,", así como ciertos dígitos o letras, porque raramente estos términos ayudan a acotar la búsqueda y pueden demorarla de forma significativa.

Las búsquedas Google no distinguen entre mayúsculas y minúsculas.  Todas las letras, independientemente de como estén escritas, se consideran minúsculas. Por ejemplo, buscar: "google", "GOOGLE" o "GoOgLe" generará los mismos resultados. Se pueden escribir hasta un máximo de 32 palabras en una búsqueda; todas las que sobrepasen ese número serán ignoradas, aunque con esa cantidad de palabras tendría que ser más que suficiente para localizar cualquier cosa. Google no ignora ahora las palabras comunes como “de” “como” “para” y similares como lo hacía antes.

Las búsquedas Google en español en forma predeterminada no distinguen los acentos diacríticos, diéresis ni la letra eñe.

Google dispone de varios operadores lógicos para facilitar la búsqueda, además de otros recursos menos utilizados. Pero, antes de explorar los secretos de Google, conozcamos algunos procedimientos elementales para efectuar consultas.

Búsquedas en Google

Ejemplo de búsqueda
Resultado obtenido
Historia de los cuentos
Ambas palabras serán consultadas y Google mostrará las páginas con mayores probabilidades de contener la información deseada. En general páginas que contengan estas cuatro palabras en un orden cualquiera. Las palabras "de" y "los" son tan frecuentes que no influirán en el resultado de la búsqueda. Sería prácticamente igual si hubiésemos buscado "historia cuentos".
Historia OR Cuentos Se mostrarán páginas que contengan cualquiera de las dos palabras "Historia" o "Cuentos" (no necesariamente las dos).
"Historia de los cuentos" Google mostrará páginas que contengan esta frase exacta.
Cuentos-hadas -príncipes Se mostrarán las páginas que contengan la palabra "Cuento" pero que no contengan ni la palabra "hadas" ni la palabra "príncipes".
Cuentos+ranas La búsqueda se llevará a cabo por el término "Cuentos", y se incluirán aquellas que contengan el término "ranas".
~enamorado Se buscarán páginas en las que aparezca un término parecido a "enamorado": enamorada, enamorarse...
define:hada Permite conocer el significado de una palabra.
secretos*google Devolverá páginas que contengan una frase con los términos "secretos" y "google" y además un, y sólo uno, término cualquiera entre las dos palabras.
Botón Voy a tener suerte Con este botón se visita automáticamente la primera página que devolvería la consulta efectuada.

Otras formas de hacer búsquedas.

Ejemplo de búsqueda Resultado obtenido
site:www.iesaverroes.org Devuelve el contenido del dominio solicitado, no las páginas que hablen del ies averroes en este caso.
webquest in site: www.iesaverroes.org
Se mostrarán las páginas que contengan el término buscado en el dominio indicado.
link: www.iesaverroes.org Lista las páginas que contengan enlaces con el dominio solicitado.
"+www.iesaverroes.org" Muestra las páginas que hacen referencia al dominio solicitado.


Intitle: podemos restringir buscar palabras solamente en el titulo de la pagina, por ejemplo: intitle: IESAverroes. Te mostrara solo resultados donde el título de la pagina sea IESAverroes.

También podemos buscar canciones con google; por ejemplo queremos buscar mp3 de Beatles utiliza esta busqueda: intitle:index + mp3 + “beatles” -html -htm -php -asp apache

Reemplazamos el nombre “beatles” con el nombre del grupo o cantante que queramos buscar y listo.

Si quieres buscar canciones utilizando google esta página lo hace por ti.

Inurl: Para buscar paginas que contienen en su dirección o URL ciertas palabras. Ejemplo: inurl:fresas

Allinurl: La misma que la anterior pero con más palabras, ejemplo: allinurl:fresas crema.

Intext: Busca dentro de una pagina el texto que queramos, ejemplo: intext:zyxws.

Allintext: Todas las palabras deben de aparecer en el texto de la pagina, ejemplo: allintext:abcdefghijklmnopqrstuvwxyz

Sinónimos y similares: Si, también podemos buscar sinónimos de palabras anteponiendo el signo ~ a la palabra que queramos buscar por ejemplo: ~software nos buscará todas las paginas que contengan la palabra software y similares.

Filetype: Puedes buscar por el tipo de archivo: PDF, XLS, ODF, DOC, JPG, etc. Queremos buscar un documento en PDF lo escribimos de la siguiente forma: nombredeldocumento filetype:pdf. Con esto buscamos solamente archivos en el formato específico.

Movie: Si queremos ver algún review sobre alguna película, lo escribimos de esta forma: movie:película. Por ejemplo: movie:300 te mostrara todos los reviews de la película 300.

El clima: Quieres saber el clima en alguna ciudad (sólo EEUU) escríbelo de la siguiente forma: weather nombreciudad. Ejemplo: weather miami, florida.

Rango de números: Podemo buscar entre un rango de números, por ejemplo queremos buscar términos como: NBA Series 1990..2000 para lograr esto coloca dos puntos .. entre los números que quieras buscar.

Información financiera: Para buscar información financiera en las bolsas de valores por ejemplo: stock:goog

Operador Define: Tenemos también la posibilidad que Google nos busque la definición de una palabra anteponiéndole a esta la palabra define:lapalabra. Por ejemplo: define:linux nos mostrara definiciones de Linux.

Pregúntale a Google: En el 2005 Google introdujo las preguntas y respuestas (Q&A) en sus búsquedas. Por ejemplo quieres saber la población de Guatemala introduce: population of Guatemala.

Otro ejemplo de Question & Answer de Google: Preguntemos quien es el primer ministro de Inglaterra de la siguiente forma: Who is Prime Minister of England?

Quien te enlaza: Escribiendo en el campo de búsqueda link:http//nombredetupagina.com puedes saber quienes tienen enlaces hacia tu pagina web. Por ejemplo: link:http://beryl-project.org y enter. Te mostrara todas las paginas que tienen enlace hacia el sitio de Beryl.

Info: Introduce info:nombrelapagina para tener toda la informacion de búsqueda sobre esa pagina, quien la enlaza, similares, paginas que contiene, cache, etc.

Busca direcciones: Escribe la dirección en el campo de búsqueda, por ejemplo:calle Hernando de Magallanes Córdoba. Google te mostrara en un mapa la ubicación de tu dirección, también te pondrá un enlace al sitio de Google Maps para poder verlo mas a detalle.

Buscar en un dominio: Puedes restringir la búsqueda a un solo dominio, por ejemplo: google site:ubuntu.com y enter. Estamos restringiendo la búsqueda de la palabra google solamente al dominio ubuntu.com. Esto es útil para buscar en sitios que no tienen el espacio para hacer búsquedas o algunos que lo tienen desactivado por el trafico.

Uno o varios: Google diferencia entre palabras escritas en singular y en plural, por ejemplo te mostrará resultados diferentes si escribes: ave o aves.

Comodines: Google no acepta comodines en una búsqueda normal, pero si la escribes entre comillas “*” sí acepta * para lo que sea, por ejemplo: “travolta * fiction” te mostrara: Travolta Pulp Fiction, John Travolta Cult Fiction.

Googlebombing: Esta es una técnica utilizada por algunos webmaster para que al buscar determinada palabra nos aparezca el resultado deseado colectivamente. Por ejemplo dentro del código html de sus paginas asocian determinada palabra con la url que quieren que aparezca. Mas información aquí.

En España miles de Webmaster asociaron la palabra “ladrones” y otras mas al URL de la SGAE, los algoritmos de google leyeron esos miles de sitios y ahora cuando buscas la palabra ladrones en google en los primeros lugares aparece el sitio de la SGAE.

Imágenes.

El mecanismo de búsqueda por imágenes de Google dispone de más de 390 millones de imágenes. Es importante recordar que el hecho de que un cierto documento (música, fotografías, vídeos, textos, etc.) no indique de forma explícita quién es su creador y bajo qué licencia permite a los demás usarlo, no significa que dicho contenido sea de libre uso sino todo lo contrario, es decir, dicha obra tendría todos los derechos reservados por parte de su creador, que en caso de litigio tendría que demostrar la autoría. Más información.

Para hacer uso de la búsqueda de imágenes de Google basta con acceder www.google.es y hacer clic en la opción Imágenes.

El procedimiento para llevar a cabo una búsqueda es el mismo que en el caso del texto: se teclean los términos de la búsqueda y se hace clic en el botón Búsqueda de Imágenes (o Intro). Para llevar a cabo la búsqueda, Google analiza el texto próximo a la imagen o el pie de grabado de la imagen entre otros aspectos. Se utilizan sofisticados algoritmos para que no se repitan imágenes y para que las de mejor calidad aparezcan al principio.

El propio usuario también puede refinar la búsqueda utilizando las opciones que aparecen en Búsqueda avanzada.


O, una vez efectuada la búsqueda, filtrarlas según el tamaño: Grandes, Medianas y Pequeñas.

La lista de resultados se muestra como miniaturas que son enlaces a las imágenes con el tamaño original. Al hacer clic en cualquiera de ellas aparece una página con un marco horizontal, en la parte superior contiene los datos de la imagen sobre la que hicimos clic y en la parte inferior la página que contiene la imagen.

Búsqueda de imágenes con un formato específico.

En caso de que queramos localizar imágenes con un determinado formato de archivo, basta con precisar, en el campo de búsqueda, el indicador filetype: seguido del tipo de archivo deseado. Para encontrar, por ejemplo, imágenes de la torre Eiffel en formato .jpg, teclearemos en la caja de búsqueda, la expresión Torre Eiffel filetype:jpg.

Herramientas del idioma.

El ítem Herramientas del idioma de Google cuenta con opciones para refinar la búsqueda en lo referente al criterio del idioma, y acceder a diversas versiones del sitio a través del mundo, además de ofrecer un traductor automático que convierte términos entre distintas lenguas.

Para acceder a estos recursos haremos clic, en la página inicial de Google, sobre la opción Herramientas del idioma.

El primer ítem de la página es Buscar páginas en idiomas o en países específicos, que nos permite aplicar filtros a las búsqueda.

Otro recurso ofrecido por Herramientas del idioma es la traducción automática que puede ser bastante útil para dudas puntuales. Para usar esta herramienta basta con escribir una expresión en la caja de texto correspondiente y escoger entre qué idiomas de los ofrecidos pretendemos hacer la traducción. Una vez seleccionados los idiomas haremos clic en Traduzca. Como el idioma nativo de Google es el inglés, este idioma es el que ofrece más opciones de traducción. Es posible también traducir automáticamente una página entera. Sin embargo, debemos de tener presente que la traducción automática de textos extensos no ofrece resultados muy satisfactorios. Muchas expresiones, giros e incluso términos aislados no se traducen adecuadamente.

Otras opciones de esta herramienta son la posibilidad de Usar el interfaz de Google en el idioma que deseemos y visitar sitios locales de google en otros países.

Como curiosidad, ahora que hablamos de idiomas en Google, podemos visitar algunas de estas páginas:


Preferencias

En el ítem Preferencias, situado al lado derecho de la caja de búsqueda de Google, se puede hacer que el sitio guarde, mediante cookies, información relativa a las opciones de búsqueda preferidas por usuario, de forma que Google pueda "acordarse" de ellas cuando el usuario acceda al sitio.

Entre estas preferencias está las de idioma de la interfaz, el idioma (o idiomas) de búsqueda, la aplicación de filtros para páginas con contenido para adultos, el número de resultados por página y la posibilidad de que el resultado de la búsqueda se muestre en la misma ventana del navegador o se abra una nueva.

Búsqueda avanzada

Como hemos comentado antes, podemos utilizar operadores lógicos (OR, + y -) en la caja de búsqueda. Podemos memorizar estos operadores porque esto agiliza mucho la búsqueda. Pero en el caso de no recordarlos podemos usar el ítem Búsqueda avanzada para aplicar estos y otros criterios. Este ítem se encuentra también a la derecha de la caja de búsqueda en la pantalla principal de google.

Algunas de las opciones que nos ofrece la búsqueda avanzada son la posibilidad de buscar resultados especificando algunas palabras, todas las palabras, frase exacta o excluyendo alguna palabra. Estas opciones no son excluyentes, podemos usarlas de forma combinada.

Otras opciones de la Búsqueda avanzada hacen referencia al idioma (devuelve páginas sólo del idioma especificado), al formato del archivo (tiene dos opciones: sólo devuelve archivos en el formato especificado o en cualquier formato excepto el especificado), la fecha (devuelve páginas en función de su fecha de actualización), etc.

En una tercera tanda de opciones la búsqueda avanzada nos permite buscar páginas similares a una dada (según el PageRank de Google) y páginas que enlazan a la que introduzcamos.

Otras formas de buscar

El directorio de Google
El directorio de Google consiste en una clasificación por categorías del contenido de la web. Para acceder al directorio sólo tenemos que hacer clic en el ítem Directorio de la página principal de Google. Y haciendo clic en los enlaces correspondientes, buscar las páginas que nos interesen en la correspondiente categoría.


Las noticias de Google

Es un servicio automatizado que clasifica y publica noticias actualizadas constantemente a partir de 700 fuentes de información en español, para que podamos buscar y explorar distintas perspectivas sobre una misma historia. Para acceder a ellas debemos hacer clic en el enlace correspondiente en la parte superior de la ventana principal de google.

La calculadora Google

Además de como buscador podemos usar google como una potente calculadora científica, para usarla sólo tenemos que introducir la operación que deseamos realizar en la caja de búsqueda y pulsar en Búsqueda (o Intro).


La calculadora incorpora las siguientes funciones Matemáticas:

Suma: se usa el símbolo "+"
Ejemplo: 3+2

Resta: se usa el símbolo "-"
Ejemplo: 7-5

Multiplicación
: se usa el símbolo "*"
Ejemplo: 6*5

División: se usa el símbolo "/"
Ejemplo: 10/2

Exponencial: se usa el símbolo "^"
Ejemplo: 2^5

Módulo (Resto de la División): se usa el símbolo "%"
Ejemplo: 8%7

Combinaciones
(De cuantas formas de pueden elegir 4 elementos de 18 elementos sin que influya el orden): se usa el símbolo "choose"
Ejemplo: 18 choose 4

Raíz n-ésima: se usa el símbolo "th root of"
Ejemplo: 5th root of 32

Porcentaje: se usa el símbolo "% of"
Ejemplo: 20% of 150

Raíz cuadrada, se usa el símbolo "sqrt"
Ejemplo: sqrt(9)

Seno: se usa el símbolo "sin"
Ejemplo: sin(0)

Coseno: se usa el símbolo "cos"
Ejemplo: cos(0)

Tangente: se usa el símbolo "tan"
Ejemplo: tan(45 degrees)

Seno hiperbólico: se usa el símbolo "sinh"
Ejemplo: sinh(10)

Coseno hiperbólico: se usa el símbolo "cosh&"
Ejemplo: cosh(10)

ArcoTangente: se usa el símbolo "arctan"
Ejemplo: arctan(10)

Logaritmo Neperiano: se usa el símbolo "ln"
Ejemplo: ln(17)

Logaritmo Base 10
: se usa el símbolo "log"
Ejemplo: log(1000)

Factorial: se usa el símbolo "!"
Ejemplo: 5!

Además de estas funciones, Google puede realizar operaciones con complejos, convertir unas unidades en otras... 


TAREA 4 (voluntaria)

Diseña una consulta
: ¿qué términos habría que poner en el buscador para encontrar en el sitio web del CNICE, ahora ITE (Instituto de Tecnologías Educativas), páginas que hablen de formación permanente del profesorado pero no mencionen la palabra becas?
Envíalo a la tutora a través de la plataforma del curso del CEP Azahar (en la caja de texto de la tarea 4).