Come bloccare Baidu dall'indexing dei file MP3?

Utilizzando Apache voglio impedire alle persone di scaricare direttamente la musica tramite url. Voglio solo che il flash player gioca. Tuttavia Baidu MP3 ha trovato i file e sta stabilendo download diretti alla mia musica. C'è un modo per impedire questo con htaccess?

  • Apache riscrive molteplici condizioni
  • il mio server è stato hacked w00tw00t.at.ISC.SANS.DFind
  • Il proxy inverso di Apache all'applicazione su tomcat con la port 8080 dà URL errato nell'intestazione di risposta
  • come ordinare l'elenco di directory apache nell'ultimo ordine modificato
  • performance apache e ajp
  • Apache2 - Esegui Apache come account utente
  • Spegni il controllo rigoroso delle chiavi ssh
  • Perché reindirizza .htaccess lavoro in http ma non con https?
  • pam service (sshd) ignorando i tentativi massimi
  • Eseguire SSHD su più porte su CentOS release 6.2 (Final)
  • Disabilitare la sostituzione del command in shell
  • Tunnel SSH non funziona come previsto
  • 3 Solutions collect form web for “Come bloccare Baidu dall'indexing dei file MP3?”

    In pratica avete due opzioni:

    1. Informi i crawler di non indicizzare i tuoi file MP3
    2. Impedire l'accesso diretto da chiunque non venga dal tuo sito web nei tuoi file MP3

    Per la prima opzione, è necessario creare un file robots.txt nella radice del tuo host web. Includerà qualcosa di simile:

    User-agent: * Disallow: /path/to/mp3s 

    Per quanto riguarda la seconda opzione, è necessario utilizzare mod_rewrite e creare un file .htacess o aggiungere qualcosa di simile al tuo config:

     RewriteEngine On RewriteBase / ReWriteCond %{REQUEST_URI} ^/path/to/mp3s/.* RewriteCond %{HTTP_REFERER} !^$ RewriteCond %{HTTP_REFERER} !^http://(.+\.)?example.com/.*$ [NC] RewriteRule .*\.(mp3)$ - [F,NC] 

    Esso impedirà a qualsiasi visitatore non proveniente dal tuo sito web di accedere ai tuoi file MP3 (cioè senza collegamento profondo).

    Ti consiglierei di utilizzare entrambi i methods contemporaneamente, poiché nessun indicizzatore da un motore di ricerca non impedisce che i file siano trovati da altri crawler (ignorando robots.txt) e la regola di riscrittura non impedisce ai crawler di accedere ai file, solo visitatori provenienti da una pagina di ricerca.

    Spegnere l'elenco della directory potrebbe farlo:

     <Directory /path/to/mp3s> Options -Indexes </Directory> 

    In questo modo il crawler non riesce a trovare gli URL MP3 senza leggere il file flash, che quasi certamente non lo fa.

    Questo presuppone che Baidu rispetta i robots.txt, che può o less. Altri agenti di ricerca dubbi potrebbero scegliere di ignorarlo.

    È inoltre ansible bloccare l'indirizzo IP (o l'intervallo) specifico, se si dispone di particolare

     order allow,deny deny from 127.0.0.1 deny from 127.0.0.2 deny from 127.0.0.3 allow from all 

    == Fuori dall'ambito della tua domanda:

    Hai detto che hai avuto un flashplayer che stava suonando la musica. Se puoi modificare Flash Player per accedere agli URL con una string di query aggiuntiva – dire "flashaccess = true" – quindi tutte le richieste alla tua directory mp3 di redirect in un file PHP (che controlla l'argomento), quindi restituirlo il contenuto del file MP3.

    Torna a htaccess – È anche ansible che l'applicazione Flash effettui la richiesta con un utente specifico e blocca / reindirizza tutti gli altri. [ http://blamcast.net/articles/block-bots-hotlinking-ban-ip-htaccess un esempio]

    Non è così scoraggiante come sembra.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.