Saltar a contenido

Search Engine Discovery

Los motores de búsqueda sirven como nuestros guías en el vasto paisaje de Internet, ayudándonos a navegar a través de la aparentemente interminable cantidad de información. Sin embargo, más allá de su función principal de responder a consultas diarias, los motores de búsqueda también albergan un tesoro de datos que pueden ser invaluables para el reconocimiento web y la recopilación de información. Esta práctica, conocida como descubrimiento en motores de búsqueda o recopilación de OSINT (Open Source Intelligence), implica usar motores de búsqueda como herramientas poderosas para descubrir información sobre sitios web, organizaciones e individuos objetivo.

En su esencia, el descubrimiento en motores de búsqueda aprovecha el inmenso poder de los algoritmos de búsqueda para extraer datos que pueden no ser visibles fácilmente en los sitios web. Los profesionales de la seguridad y los investigadores pueden profundizar en la web indexada utilizando operadores de búsqueda especializados, técnicas y herramientas, descubriendo desde información sobre empleados y documentos sensibles hasta páginas de inicio de sesión ocultas y credenciales expuestas.

Por qué es importante el descubrimiento en motores de búsqueda

El descubrimiento en motores de búsqueda es un componente crucial del reconocimiento web por varias razones:

  • Fuente Abierta: La información recopilada es públicamente accesible, lo que la convierte en una forma legal y ética de obtener información sobre un objetivo.
  • Amplitud de Información: Los motores de búsqueda indexan una gran parte de la web, ofreciendo una amplia gama de posibles fuentes de información.
  • Facilidad de Uso: Los motores de búsqueda son fáciles de usar y no requieren habilidades técnicas especializadas.
  • Económico: Es un recurso gratuito y fácilmente disponible para la recopilación de información.

La información que puedes obtener de los motores de búsqueda puede aplicarse de varias maneras:

  • Evaluación de Seguridad: Identificación de vulnerabilidades, datos expuestos y posibles vectores de ataque.
  • Inteligencia Competitiva: Recopilación de información sobre productos, servicios y estrategias de la competencia.
  • Periodismo de Investigación: Descubrimiento de conexiones ocultas, transacciones financieras y prácticas poco éticas.
  • Inteligencia de Amenazas: Identificación de amenazas emergentes, seguimiento de actores maliciosos y predicción de posibles ataques.

Sin embargo, es importante notar que el descubrimiento en motores de búsqueda tiene limitaciones. Los motores de búsqueda no indexan toda la información, y algunos datos pueden estar deliberadamente ocultos o protegidos.

Operadores de Búsqueda

Los operadores de búsqueda son como los códigos secretos de los motores de búsqueda. Estos comandos y modificadores especiales desbloquean un nuevo nivel de precisión y control, permitiéndote identificar tipos específicos de información en la vasta web indexada.

Aunque la sintaxis exacta puede variar ligeramente entre motores de búsqueda, los principios subyacentes permanecen consistentes. Veamos algunos operadores de búsqueda esenciales y avanzados:

Operador Descripción del Operador Ejemplo Descripción del Ejemplo
site: Limita los resultados a un sitio web o dominio específico. site:example.com Encuentra todas las páginas públicamente accesibles en example.com.
inurl: Encuentra páginas con un término específico en la URL. inurl:login Busca páginas de inicio de sesión en cualquier sitio web.
filetype: Busca archivos de un tipo particular. filetype:pdf Encuentra documentos PDF descargables.
intitle: Encuentra páginas con un término específico en el título. intitle:"confidential report" Busca documentos titulados "confidential report" o variaciones similares.
intext: Busca un término dentro del texto del cuerpo de las páginas. intext:"password reset" Identifica páginas web que contengan el término "password reset".
cache: Muestra la versión en caché de una página web (si está disponible). cache:example.com Ve la versión en caché de example.com para ver su contenido anterior.
link: Encuentra páginas que enlazan a una página web específica. link:example.com Identifica sitios web que enlazan a example.com.
related: Encuentra sitios web relacionados con una página web específica. related:example.com Descubre sitios web similares a example.com.
info: Proporciona un resumen de información sobre una página web. info:example.com Obtén detalles básicos sobre example.com, como su título y descripción.
define: Proporciona definiciones de una palabra o frase. define:phishing Obtén una definición de "phishing" de varias fuentes.
numrange: Busca números dentro de un rango específico. site:example.com numrange:1000-2000 Encuentra páginas en example.com que contengan números entre 1000 y 2000.
allintext: Encuentra páginas que contengan todas las palabras especificadas en el texto del cuerpo. allintext:admin password reset Busca páginas que contengan "admin" y "password reset" en el texto del cuerpo.
allinurl: Encuentra páginas que contengan todas las palabras especificadas en la URL. allinurl:admin panel Busca páginas con "admin" y "panel" en la URL.
allintitle: Encuentra páginas que contengan todas las palabras especificadas en el título. allintitle:confidential report 2023 Busca páginas con "confidential," "report," y "2023" en el título.
AND Restringe los resultados al requerir que todos los términos estén presentes. site:example.com AND (inurl:admin OR inurl:login) Encuentra páginas de administración o inicio de sesión específicamente en example.com.
OR Amplía los resultados al incluir páginas con cualquiera de los términos. "linux" OR "ubuntu" OR "debian" Busca páginas web que mencionen Linux, Ubuntu o Debian.
NOT Excluye resultados que contengan el término especificado. site:bank.com NOT inurl:login Encuentra páginas en bank.com excluyendo las páginas de inicio de sesión.
* (wildcard) Representa cualquier carácter o palabra. site:socialnetwork.com filetype:pdf user* manual Busca manuales de usuario (user guide, user handbook) en formato PDF en socialnetwork.com.
.. (range search) Encuentra resultados dentro de un rango numérico especificado. site:ecommerce.com "price" 100..500 Busca productos con precios entre 100 y 500 en un sitio de comercio electrónico.
" " (quotation marks) Busca frases exactas. "information security policy" Encuentra documentos que mencionen la frase exacta "information security policy".
- (minus sign) Excluye términos de los resultados de búsqueda. site:news.com -inurl:sports Busca artículos de noticias en news.com excluyendo contenido relacionado con deportes.

Google Dorking

El Google Dorking, también conocido como Google Hacking, es una técnica que aprovecha el poder de los operadores de búsqueda para descubrir información sensible, vulnerabilidades de seguridad o contenido oculto en sitios web, utilizando Google Search.

Aquí hay algunos ejemplos comunes de Google Dorks, para más ejemplos, consulta la Google Hacking Database:

  • Encontrar Páginas de Inicio de Sesión:
  • site:example.com inurl:login
  • site:example.com (inurl:login OR inurl:admin)
  • Identificar Archivos Expuestos:
  • site:example.com filetype:pdf
  • site:example.com (filetype:xls OR filetype:docx)
  • Descubrir Archivos de Configuración:
  • site:example.com inurl:config.php
  • site:example.com (ext:conf OR ext:cnf) (busca extensiones comúnmente usadas para archivos de configuración)
  • Localizar Copias de Seguridad de Bases de Datos:
  • site:example.com inurl:backup
  • site:example.com filetype:sql