TEE SLIME-KONE (Kadonnut video) ✎ Craftingeek

Onko keino kertoa hakukoneille, että heidän indeksoimansa sivun tulisi sisältyä hakutuloksiin nyt, mutta se on poistettava tietyllä hetkellä tulevaisuudessa?

Minulla on verkkosivusto, jossa satoja julkaisuja esiintyy päivittäin ja haluan, että ne indeksoidaan ja että ne ovat haettavissa, mutta minun on laillisesti pakko poistaa tiedot jonkin ajan kuluttua (kunkin sivun yksittäinen päivämäärä).

Mainitun päivämäärän jälkeen sivu ei ole enää verkkosivustollani näkyvissä (HTTP-vastaus 410 mennyt), mutta sivu viipyy esimerkiksi google-välimuisti jonkin aikaa, mikä voi aiheuttaa minulle juridisia ongelmia. Ilmeisesti ei ole kannattavaa antaa satoja sisällön poistopyyntöjä Googlelle käsin. Toisaalta yksittäisiä sivuja ei muuteta muutaman kuukauden ajan, ennen kuin ne on hävitettävä, joten Google-botti ei kirjaudu sisään usein.

Ymmärtääkseni HTTP Expires -otsikko on tarra vähimmäisjuoreille eikä korkeimmalle käyttöikälle, eikö? Lähetän viimeksi muokattuja at- ja etag-otsikoita, mutta ne eivät auta tässä. Onko mitään tapaa sanoa "välimuisti, mutta vasta 15.8.2011 asti"?

  • Google voi kokeilla: <meta name='googlebot' content='nosnippet'>
  • Lisäksi noarchive-tunniste kehottaa Googlea olemaan tallentamatta välimuistissa olevaa kopiota sivustasi.

Googlelle on sisällönkuvauskenttä nimeltä unavailable_after, joka tekee tarkalleen mitä etsin: Se kehottaa Googlea poistamaan tietyn sivun tiettynä ajankohtana tulevaisuudessa.

Se on ainoa tapa saavuttaa se, mitä toivoin saavuttaa: Sivujen poistaminen automaattisesti, oikeaan aikaan, ei luottamus indeksoijaan palaamaan ja huomaamaan 410 Gone -vastauksen, joka voi viedä viikkoja sisällön lähettämisen jälkeen. poistettu.

Esimerkki:

<meta name='GOOGLEBOT' content='unavailable_after: 25-Aug-2007 15:00:00 EST'>

Tai HTTP-otsikossa, PDF-tiedostoille jne.:

X-Robots-Tag: poissa käytöstä: 23. heinäkuuta 2007 15:00:00 PST

Lähteet: http://googleblog.blogspot.com/2007/07/robots-exclusion-protocol-now-with-even.html ja http://www.google.com/support/webmasters/bin/answer.py? vastaus = 79812

En voinut selvittää, ovatko Bing, Yahoo & Co hyväksyneet tämän Google-tunnisteen.

Ensinnäkin sinulla ei ole hallintaa siitä, mitä hakukoneet indeksoivat ja mitä ne lisäävät hakemistoonsa.

MUTTA, Esimerkiksi Google ottaa tietosi sivuidesi reaaliaikaisesta ajasta erittäin vakavaksi. Joten jos lisäät oikean HTTP-otsikon, se ottaa huomioon nämä tiedot. Voit myös lisätä robots.txt-tiedostoosi joitain tietoja virheellisistä sivuista.

On myös Webmaster-työkaluja, joissa voit kehottaa Googlea poistamaan sivut hakemistosta.

Virallisesta Google-verkkovastaavan blogista löydät erittäin hyödyllistä tietoa URL-osoitteiden poistamisesta hakemistosta ja sisällön sisällyttämisestä uudelleen. Siellä he sanovat, että voit poistaa URL-osoitteet seuraavasti:

  • käyttäen 410,
  • robots.txt tai
  • noindex-sisällönkuvauskenttä

työskennellyt sinulle: Charles Robertson | Haluatko yhteyttä?