LOCALIZANDO A SPOCK PARA TELETRANSPORTE, EN UNA NAVE LLENA DE VULCANOS EN CELO.
– Scotty, teletransporte a Spock.
– Capitán, hay 5.000 vulcanos en celo en esa nave, ¿cómo distingo a Spock?
– Es el único que lleva la insignia de la flota estelar, Scotty.
Seguro que alguna vez nos hemos encontrado buscando algo en Internet y hemos obtenido 5.000 vulcanos en celo, cuando nosotros solo buscábamos a Spock. El truco, buscar la insignia de la flota estelar.
Cada fichero, tiene una extensión, y por esa extensión se identifica que tipo de contenido tiene, es su insignia. Por ejemplo, spock,txt, es un fichero de texto, spock.jpg, una imagen jpg, spock.gif, una imagen gif, y así con .png, .pdf…
Tanto Google como BIng, no pierdan de ojo Bing, nos ofrece el operador filetype y ext (son sinónimos en Google, pero no en Bing). Estos operadores nos permiten buscar ficheros por tipo, por ejemplo, queremos buscar ficheros pdf que tengan la palabra Canarias. Usaremos esta cadena de búsqueda:
Google nos devuelve más de cinco millones de resultados. Pero hace trampa, nos devuelve todos aquellos resultados que tienen en la URL .pdf. (para él es lo mismo filetype y ext) ¿Qué pasa por ejemplo con los resultados de Jable, cuyos resultados son proporcionados por un fichero exe y no un pdf puro y duro? Pues que con Google, este tipo de resultados no funcionan. Bing en su buscador es capaz de detectar el tipo de fichero que se esconde en una URL, usando el tipo MIME que devuelve la cabecera http al conectar.
Queremos encontrar ficheros pdf en una página determinada, por ejemplo, hemos encontrado un pdf interesante en www.gobiernodecanarias.org/educacion y pensamos que hay muchos más. Pues para eso tenemos un comando del buscador, el comando site. Queremos buscar ficheros pdf, en todo el sitio www.gobiernodecanarias.org/educacion, pues usamos.
filetype:pdf site:gobiernodecanarias.org/educacion (quitamos www para ampliar la búsqueda.)
Conseguimos un montón de pdfs, muy curiosos. Pero nosotros queremos pdf que hablen de música, pues nuestra búsqueda sería.
musica filetype:pdf site:gobiernodecanarias.org/educacion
Resulta que algún profesor, fanático de los Sabandeños, ha llenado el servidor con ficheros pdf repetidos por todos los directorios del servidor, ¿cómo quitamos esos ficheros de los resultados? Utilizamos el operador NOT, o lo que es lo mismo el -, si el menos, eso indica al motor de búsqueda que elimine los resultados que contengan la palabra que pongamos después del -. En este caso nuestra búsqueda quedaría.
musica -Sabandeños filetype:pdf site:gobiernodecanarias.org/educacion
Esto nos devuelve todos los pdfs, que contengan la palabra música, pero no sabandeños en el site del gobierno de canarias, carpeta educación.
Ya tenemos la insignia (extensión), la nave (el sitio web) y la palabra a buscar, ¿te crees capaz de teletransportar a Spock?
Vulcano – celo filetype:flotaestelar site:nave.vulcana