Larecoleta

Lo más interesante del mundo

Búsqueda en Google

Google Search o Google Web Search es un motor de búsqueda web propiedad de Google Inc. y es el motor de búsqueda más utilizado en la World Wide Web. Google recibe varios cientos de millones de consultas al día a través de sus distintos servicios.
El objetivo principal de la Búsqueda de Google es buscar texto en páginas web, a diferencia de otros datos, como ocurre con la Búsqueda de imágenes de Google. La Búsqueda de Google fue desarrollada originalmente por Larry Page y Sergey Brin en 1997, basándose en diseños anteriores de motores de búsqueda.

Google Search ofrece al menos 22 funciones especiales además de la capacidad original de búsqueda por palabras. Entre ellas se incluyen sinónimos, previsiones meteorológicas, husos horarios, cotizaciones bursátiles, mapas, datos sobre terremotos, horarios de películas, aeropuertos, listados de viviendas y resultados deportivos. (véase más abajo: Funciones especiales). Hay funciones especiales para los números, como rangos (70..73), precios, temperaturas, conversiones dinero/unidad («10,5 cm en pulgadas»), cálculos ( 3*4+sqrt(6)-pi/2 ), seguimiento de paquetes, patentes, códigos de área y traducción de idiomas de las páginas mostradas.

El orden de los resultados de búsqueda (ghits para Google hits) en las páginas de resultados de búsqueda de Google se basa, en parte, en un rango de prioridad denominado «PageRank». La Búsqueda de Google ofrece muchas opciones para personalizar la búsqueda (véase más abajo: Opciones de búsqueda), utilizando operadores booleanos como: exclusión («-xx»), inclusión («+xx»), alternativas («xx OR yy») y comodín («x * x»).

Motor de búsqueda

El éxito de Google se debe en gran parte a un algoritmo patentado llamado PageRank que ayuda a clasificar las páginas web que coinciden con una cadena de búsqueda determinada.
Los métodos anteriores de clasificación de los resultados de búsqueda basados en palabras clave, utilizados por muchos motores de búsqueda que en su día fueron más populares que Google, clasificaban las páginas en función de la frecuencia con la que aparecían los términos de búsqueda en la página o del grado de asociación de los términos de búsqueda dentro de cada página resultante.
En cambio, el algoritmo PageRank analiza los enlaces generados por humanos, asumiendo que es probable que las páginas web enlazadas desde muchas páginas importantes sean a su vez importantes. El algoritmo calcula una puntuación recursiva para las páginas, basada en la suma ponderada de los PageRanks de las páginas que enlazan con ellas. Se cree que PageRank se correlaciona bien con los conceptos humanos de importancia.
Además del PageRank, Google ha añadido a lo largo de los años muchos otros criterios secretos para determinar la clasificación de las páginas en las listas de resultados, que, según se informa, superan los 200 indicadores diferentes. Los detalles se mantienen en secreto debido a los spammers y con el fin de mantener una ventaja sobre los competidores de Google.

El porcentaje exacto del total de páginas web que Google indexa no se conoce, ya que es muy difícil de calcular realmente.
Google no sólo indexa y almacena en caché páginas web, sino que también toma «instantáneas» de otros tipos de archivos, entre los que se incluyen PDF, documentos de Word, hojas de cálculo de Excel, SWF de Flash, archivos de texto sin formato, etc. Excepto en el caso de los archivos de texto y SWF, la versión almacenada en caché es una conversión a (X)HTML, que permite leer el archivo a quienes no dispongan de la aplicación de visualización correspondiente.
Los usuarios pueden personalizar el motor de búsqueda, estableciendo un idioma por defecto, utilizando la tecnología de filtrado «SafeSearch» y fijando el número de resultados que se muestran en cada página. Google ha sido criticado por colocar cookies de larga duración en los equipos de los usuarios para almacenar estas preferencias, una táctica que también les permite rastrear los términos de búsqueda de un usuario y conservar los datos durante más de un año. Para cualquier consulta, pueden mostrarse hasta los 1.000 primeros resultados, con un máximo de 100 por página. La posibilidad de especificar el número de resultados sólo está disponible si «Búsqueda instantánea» no está activada. Si «Búsqueda instantánea» está activada, sólo se muestran 10 resultados, independientemente de esta configuración.

A pesar de su inmenso índice, también hay una cantidad considerable de datos disponibles en bases de datos en línea a las que se puede acceder mediante consultas, pero no mediante enlaces. Esta llamada Web invisible o profunda está mínimamente cubierta por Google y otros motores de búsqueda. La Web profunda contiene catálogos de bibliotecas, documentos legislativos oficiales de los gobiernos, guías telefónicas y otros contenidos preparados dinámicamente para responder a una consulta.

En algunos países, la privacidad prohíbe mostrar algunos enlaces. Por ejemplo, en Suiza cualquier persona puede obligar a Google Inc. a eliminar un enlace que contenga su nombre.
Dado que Google es el motor de búsqueda más popular, muchos webmasters están ansiosos por influir en la clasificación de su sitio web en Google. Ha surgido una industria de consultores para ayudar a los sitios web a aumentar su clasificación en Google y en otros motores de búsqueda. Este sector, denominado optimización de motores de búsqueda, trata de discernir patrones en los listados de los motores de búsqueda y, a continuación, desarrollar una metodología para mejorar las clasificaciones y atraer más buscadores a los sitios de sus clientes.

La optimización para motores de búsqueda engloba tanto factores «on page» (como el cuerpo del texto, los títulos, los encabezados H1 y los atributos alt de las imágenes) como factores «off page» (como el texto de anclaje y el PageRank). La idea general es influir en el algoritmo de relevancia de Google mediante la incorporación de las palabras clave objetivo en varios lugares «en la página», en particular el elemento del título y el cuerpo del texto (nota: cuanto más arriba en la página, presumiblemente mejor será la prominencia de la palabra clave y, por tanto, la clasificación). Sin embargo, demasiadas apariciones de la palabra clave hacen que la página resulte sospechosa para los algoritmos de comprobación de spam de Google.

Google ha publicado una serie de directrices para los propietarios de sitios web que deseen mejorar su clasificación recurriendo a consultores de optimización legítimos.

Funcionalidad

La búsqueda de Google consiste en una serie de sitios web localizados. El mayor de ellos, el sitio google.com, es el más visitado del mundo. Algunas de sus funciones son un enlace con la definición de la mayoría de las búsquedas, incluidas las palabras del diccionario, el número de resultados obtenidos en la búsqueda, enlaces a otras búsquedas (por ejemplo, para las palabras que Google cree que están mal escritas, proporciona un enlace a los resultados de la búsqueda utilizando su ortografía propuesta), y muchas más.



El motor de búsqueda de Google normalmente acepta consultas como un texto simple, y descompone el texto del usuario en una secuencia de términos de búsqueda, que normalmente serán palabras que deben aparecer en los resultados, pero también se pueden utilizar operadores booleanos, como: comillas («) para una frase, un prefijo como «+», «-» para términos cualificados, o uno de varios operadores avanzados, como «site:». Las páginas web de «Conceptos básicos de la Búsqueda de Google» describen cada una de estas consultas y opciones adicionales (véase más adelante: Opciones de búsqueda).

El formulario web de búsqueda avanzada de Google ofrece varios campos adicionales que pueden utilizarse para calificar las búsquedas según criterios como la fecha de la primera recuperación. Todas las consultas avanzadas se transforman en consultas normales, normalm
ente con términos cualificados adicionales.

Google aplica la expansión de consultas a la consulta de búsqueda enviada, transformándola en la consulta que se utilizará realmente para obtener resultados. Al igual que ocurre con la clasificación de páginas, los detalles exactos del algoritmo que utiliza Google son deliberadamente oscuros, pero sin duda entre las transformaciones que se producen se encuentran las siguientes:
La página de inicio de Google incluye un botón llamado «Me siento afortunado». Cuando un usuario hace clic en el botón, se le lleva directamente al primer resultado de búsqueda, sin pasar por la página de resultados del motor de búsqueda. La idea es que, si el usuario «se siente afortunado», el motor de búsqueda le devuelva la coincidencia perfecta a la primera sin tener que pasar por los resultados de búsqueda. Según un estudio de Tom Chavez de «Rapt», esta función le cuesta a Google 110 millones de dólares al año, ya que el 1% de todas las búsquedas utilizan esta función y eluden toda la publicidad.

El 30 de octubre de 2009, para algunos usuarios, el botón «Me siento afortunado» fue eliminado de la página principal de Google, junto con el botón de búsqueda normal. Ambos botones se sustituyeron por un campo que decía: «Este espacio se ha dejado en blanco intencionadamente». Este texto se desvanecía al mover el ratón por la página, y la función de búsqueda normal se consigue rellenando el campo de búsqueda con los términos deseados y pulsando Intro. Un portavoz de Google explica: «Esto es sólo una prueba, y una forma de calibrar si a nuestros usuarios les gustará una interfaz de búsqueda aún más sencilla.» Las páginas de inicio personalizadas de Google conservaron ambos botones y sus funciones normales.



El 21 de mayo de 2010, 30º aniversario de Pac-Man, el botón «Me siento con suerte» se sustituyó por otro en el que se podía leer «Insertar moneda». Tras pulsar el botón, el usuario comenzaría una partida de Pac-Man con temática de Google en la zona donde normalmente estaría el logotipo de Google. Al pulsar el botón una segunda vez, se iniciaba una versión para dos jugadores del mismo juego que incluía a Ms. Se puede acceder a esta versión a través de un enlace permanente a la página.
El 12 de mayo de 2009, Google anunció que analizaría los microformatos hCard, hReview y hProduct y los utilizaría para rellenar las páginas de resultados de búsqueda con lo que denominó «fragmentos enriquecidos».

Además de la función principal del motor de búsqueda de buscar texto, la Búsqueda de Google tiene más de 22 «funciones especiales» (que se activan introduciendo cualquiera de las docenas de palabras desencadenantes) al realizar una búsqueda:

Las páginas web del Centro de asistencia de Google contienen textos que describen más de 15 opciones de búsqueda distintas.
Los operadores de Google:

Algunas de las opciones de búsqueda son las siguientes:

Las opciones de visualización de página (o tipos de consulta) son:



Ten en cuenta que Google busca en la codificación HTML dentro de una página web, no en la apariencia de la pantalla: las palabras que se muestran en una pantalla podrían no aparecer en el mismo orden en la codificación HTML.

Algunas búsquedas darán un error 403 Forbidden con el texto

«Lo sentimos…



… pero su consulta se parece a las peticiones automáticas de un virus informático o de una aplicación espía. Para proteger a nuestros usuarios, no podemos procesar tu solicitud en este momento.

Restableceremos tu acceso lo antes posible, así que inténtalo de nuevo pronto. Mientras tanto, si sospechas que tu ordenador o tu red han sido infectados, tal vez quieras ejecutar un antivirus o un eliminador de programas espía para asegurarte de que tus sistemas están libres de virus y otros programas espurios.

Disculpa las molestias y esperamos volver a verte de parte de todo el equipo de Google».
a veces seguido de un mensaje CAPTCHA.
La pantalla se notificó por primera vez en 2005, y fue una respuesta al uso intensivo de Google por parte de las empresas de optimización de motores de búsqueda para comprobar las clasificaciones de los sitios que estaban optimizando. El mensaje se activa cuando se recibe un gran volumen de solicitudes desde una única dirección IP. Al parecer, Google utiliza la cookie de Google como parte de su determinación de denegar el servicio.

En junio de 2009, tras la muerte de la superestrella del pop Michael Jackson, este mensaje apareció a muchos usuarios de Internet que buscaban en Google noticias relacionadas con el cantante, y Google supuso que se trataba de un ataque DDoS, aunque muchas consultas fueron enviadas por buscadores legítimos.

Google marca los resultados de búsqueda con el mensaje «Este sitio puede dañar su equipo» si se sabe que el sitio instala software malicioso en segundo plano o de forma subrepticia. Google hace esto para proteger a los usuarios contra la visita de sitios que podrían dañar sus ordenadores. Durante aproximadamente 40 minutos del 31 de enero de 2009, todos los resultados de búsqueda se clasificaron erróneamente como malware y, por lo tanto, no se podía hacer clic en ellos; en su lugar, aparecía un mensaje de advertencia y se pedía al usuario que introdujera manualmente la URL solicitada. El fallo se debió a un error humano. La URL de «/» (que se expande a todas las URL) se añadió por error al archivo de patrones de malware.
En determinadas ocasiones, el logotipo de la página web de Google cambia a una versión especial, conocida como «Google Doodle». Al hacer clic en el Doodle se enlaza a una cadena de resultados de búsqueda de Google sobre el tema. El primero fue una referencia al Festival Burning Man en 1998, y se han producido otros para los cumpleaños de personas notables como Albert Einstein, acontecimientos históricos como el 50 aniversario del bloque entrelazado de Lego y festividades como el Día de San Valentín.

En agosto de 2009, Google anunció el lanzamiento de una nueva arquitectura de búsqueda, denominada «Caffeine».
La nueva arquitectura se diseñó para devolver los resultados más rápidamente y para gestionar mejor la información que se actualiza con rapidez procedente de servicios como Facebook y Twitter.
Los desarrolladores de Google señalaron que la mayoría de los usuarios notarían pocos cambios inmediatos, pero invitaron a los desarrolladores a probar la nueva búsqueda en su sandbox.
Entre las diferencias señaladas por su impacto en la optimización de los motores de búsqueda figuran una mayor ponderación de las palabras clave y la importancia de la antigüedad del dominio.
En algunos círculos se interpretó la medida como una respuesta al reciente lanzamiento por Microsoft de una versión mejorada de su propio servicio de búsqueda, rebautizado Bing.
Google anunció la finalización de Caffeine el 8 de junio de 2010, afirmando que los resultados eran un 50% más frescos gracias a la actualización continua de su índice.
Con Caffeine, Google trasladó su sistema de indexación back-end de MapReduce a BigTable, la plataforma de base de datos distribuida de la compañía. Caffeine también se basa en Colossus, o GFS2, una revisión del sistema de archivos distribuidos GFS.
En mayo de 2010, Google puso en marcha la búsqueda web cifrada SSL. Se puede acceder a la búsqueda cifrada en: Archivado 2013-12-15 en la Wayback Machine

Google Instant, una mejora que muestra resultados sugeridos mientras el usuario escribe, se introdujo en Estados Unidos a partir del 8 de septiembre de 2010. Una de las preocupaciones es que la gente pueda seleccionar uno de los resultados sugeridos en lugar de terminar su solicitud, y que esta práctica pueda causar un sesgo hacia empresas conocidas u otros términos de búsqueda. L
os términos de búsqueda pornográficos u ofensivos quedan excluidos de los resultados sugeridos. La función instantánea sólo aparece en el sitio básico de Google y no en las páginas especializadas de iGoogle. Google espera que Google Instant ahorre a los usuarios entre 2 y 5 segundos en cada búsqueda, lo que, según ellos, supondrá un ahorro colectivo de 11 millones de segundos por hora. Los expertos en marketing de buscadores especulan con que Google Instant tendrá un gran impacto en las búsquedas locales y de pago.

Junto con el lanzamiento de Google Instant, Google deshabilitó la posibilidad de que los usuarios eligieran ver más de 10 resultados de búsqueda por página. La búsqueda instantánea puede desactivarse a través del menú «Preferencias» de Google, pero ahora no pueden desactivarse las sugerencias de búsqueda de tipo autocompletar. Un representante de Google declaró: «Es coherente con nuestra visión de una experiencia de búsqueda de Google unificada hacer que las funciones populares y útiles formen parte de la experiencia predeterminada, en lugar de mantener diferentes versiones de Google. Como la calidad de Autocompletar ha mejorado, nos pareció apropiado tenerla siempre activada para todos nuestros usuarios.»

Internacional

Google está disponible en muchos idiomas y ha sido localizado para muchos países.

La interfaz también está disponible en algunos idiomas con fines humorísticos:

Además de la URL principal Google.com, Google Inc. posee 160 nombres de dominio para cada uno de los países/regiones en los que se ha localizado. Como Google es una empresa estadounidense, el nombre de dominio principal puede considerarse el de EE.UU.

Algunos nombres de dominio no registrados por Google están actualmente ocupados, como «Google.ua» (para Ucrania, donde la URL correcta es «google.com.ua»).

Buscar productos

Además de su herramienta de búsqueda de páginas web, Google también ofrece servicios de búsqueda de imágenes, grupos de noticias de Usenet, sitios web de noticias, vídeos, búsqueda por localidad, mapas y artículos en venta online. En 2006, Google ha indexado más de 25.000 millones de páginas web, 400 millones de consultas al día, 1.300 millones de imágenes y más de mil millones de mensajes de Usenet. También almacena en caché gran parte del contenido que indexa. Google cuenta con otras herramientas y servicios, como Google Noticias, Google Suggest, Google Product Search, Google Maps, Google Co-op, Google Earth, Google Docs, Picasa, Panoramio, YouTube, Google Translate, Google Blog Search y Google Desktop Search.
Google también ofrece productos que no están directamente relacionados con las búsquedas. Gmail, por ejemplo, es una aplicación de correo web, pero incluye funciones de búsqueda; Google Browser Sync no ofrece ninguna función de búsqueda, aunque pretende organizar el tiempo de navegación.

También Google pone en marcha muchos nuevos productos beta, como Google Social Search o Google Image Swirl.

En 2017, la USPTO concedió a Microsoft una patente que describe una metodología que podría servir como alternativa a la búsqueda instantánea de Google.

Consumo de energía

Google afirma que una consulta de búsqueda requiere en total alrededor de 1 kJ o 0,0003 kW-h.