robots.txt, france, TLD fr, nl.media subdomain

Le domaine nl.media.france.fr fait partie du top-level-domain "fr".

En termes sémantiques, plusieurs concepts sous-jacents peuvent apparaître dès la lecture du domaine. Notez que ces concepts sont déterminés automatiquement par un algorithme et sans chercher à savoir ce que contient réellement le domaine. La proximité de ces concepts n'est donc qu'indicative.

france

A Gentleman of France. ABB en France. ADVFN France. AMSAT France. AOL France. ARTE France. ASL Airlines France. ATEC-ITS France. ATTAC France. Abandonware France. Abattage rituel des animaux en France. Abattoirs, ateliers de decoupe, conditionnement de volailles en France. Abattoirs, ateliers de découpe, conditionnement de volailles en France. Abolition de l'esclavage en France. Abolition de la peine de mort en France. Abolition du servage en France. Abstention En France. Abstention lors d'élections en France. Abus Sexuel Sur Mineur En France. Abwehr en France....

Quelques autres domaines qui contiennent "france"

media

/media. APN News & Media. ASCII MEDIA WORKS. Acorn Media Group. Acrocomia media. Action critique media. Action critique média. Active Gaming Media. Adobe Flash Media Server. Adobe Flash Media Server FMS. Adresse media access control. Aegis Media France. Al Jazeera Media Network. Al Jazeera Network Media. Alliance TRACE Media. Alliance for Open Media. Alma Media. Altice Media Group. American Latino Media Arts. American Latino Media Arts Award....

Quelques autres domaines qui contiennent "media"

Voilà une version du fichier robots.txt tel qu'il a pu être récupéré sur ce domaine.

#
# robots.txt
#
# This file is to prevent the crawling and indexing of certain parts
# of your site by web crawlers and spiders run by sites like Yahoo!
# and Google. By telling these "robots" where not to go on your site,
# you save bandwidth and server resources.
#
# This file will be ignored unless it is at the root of your host:
# Used:    http://example.com/robots.txt
# Ignored: http://example.com/site/robots.txt
#
# For more information about the robots.txt standard, see:
# http://www.robotstxt.org/robotstxt.html
#
# For syntax checking, see:
# http://www.frobee.com/robots-txt-check

User-agent: *
Crawl-delay: 10
# Directories
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Disallow: /themes/
# Files
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /INSTALL.sqlite.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
# Paths (clean URLs)
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /filter/tips/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
Disallow: /user/logout/
# Paths (no clean URLs)
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=filter/tips/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/
Disallow: /?q=user/logout/

© 2024 www.http-header.com — cookies