
WordPress Sitem İçin Güvenli ve Etkili Bir Robots.txt Dosyası Nasıl Hazırlarım?
Bir SEO editörü olarak, web sitenizin arama motorları tarafından doğru bir şekilde taranması ve indekslenmesi, dijital varlığınızın temel taşlarından biridir. Bu sürecin en önemli bileşenlerinden biri de
robots.txt dosyasıdır. Bu küçük metin dosyası, sitenizde bulunan sayfaların hangi arama motoru botları tarafından taranıp taranmayacağını belirleyen bir yol haritası görevi görür. Özellikle WordPress gibi dinamik bir platformda, doğru yapılandırılmış bir robots.txt, hem arama motoru optimizasyonu (SEO) çabalarınızı destekler hem de Google AdSense gibi reklam platformlarından gelir elde etme potansiyelinizi korur.
Bu makalede, WordPress siteniz için güvenli ve etkili bir robots.txt dosyasını nasıl oluşturacağınızı, nelere dikkat etmeniz gerektiğini ve sık yapılan hatalardan nasıl kaçınacağınızı detaylıca ele alacağız. Amacımız, sitenizin performansını artırırken, Google’ın yönergelerine uyumlu bir yapı kurmanıza yardımcı olmaktır.
Robots.txt Nedir ve Neden Bu Kadar Önemlidir?
robots.txt dosyası, web sitenizin kök dizininde yer alan basit bir metin dosyasıdır. Temel işlevi, web sitenizi ziyaret eden web tarayıcılarına (Googlebot, Bingbot, Yandexbot gibi arama motoru botları) sitenizin hangi bölümlerine erişmelerine izin verildiğini veya hangi bölümlerine erişmelerinin engellendiğini bildirmektir. Bu dosya, bir arama motoru botu sitenize ilk geldiğinde baktığı ilk yerlerden biridir.
Peki, neden bu kadar önemlidir?
Crawl Bütçesini Verimli Kullanma
Her web sitesinin, özellikle büyük sitelerin, arama motorları tarafından tahsis edilen sınırlı bir "crawl bütçesi" vardır. Bu bütçe, botların sitenizde belirli bir süre içinde tarayabileceği sayfa sayısını ifade eder.
robots.txt dosyası sayesinde, arama motoru botlarını sitenizin daha az önemli veya yinelenen içerik barındıran sayfalarını taramak yerine, en değerli ve kullanıcılarınız için kritik olan sayfalarınıza yönlendirebilirsiniz. Bu, crawl bütçenizi en verimli şekilde kullanmanızı ve sitenizin ana sayfalarının daha hızlı taranıp indekslenmesini sağlar.
Hassas veya Değersiz İçeriği Gizleme
Web sitenizde yönetim paneli sayfaları (örneğin, `/wp-admin/`), eklenti dosyaları, tema dosyaları, test sayfaları veya özel kullanıcı verileri içeren dizinler gibi arama motorları tarafından indekslenmesini istemediğiniz içerikler bulunabilir. Bu tür içeriklerin arama sonuçlarında görünmesi hem güvenlik zafiyeti yaratabilir hem de kullanıcı deneyimini olumsuz etkileyebilir. robots.txt, bu tür içeriklerin taranmasını ve dolayısıyla indekslenmesini engelleyerek sitenizin genel kalitesini ve profesyonelliğini artırır. Ancak unutulmamalıdır ki robots.txt bir güvenlik önlemi değildir; sadece bir tarama yönergesidir. Bağlantı verilen sayfalar yine de indekslenebilir.
SEO Performansını Destekleme
Doğru yapılandırılmış bir robots.txt, sitenizin genel
arama motoru optimizasyonu (SEO) stratejisine doğrudan katkıda bulunur. Sadece değerli içeriğin indekslenmesini sağlayarak, sitenizin arama sonuçlarındaki görünürlüğünü artırırsınız. Ayrıca, engellediğiniz gereksiz sayfalar sayesinde, arama motorları sitenizi daha temiz ve düzenli algılar, bu da sıralama potansiyelinizi olumlu yönde etkileyebilir. Sayfaların hızlı ve doğru taranması, içerik güncellemelerinizin de daha çabuk fark edilmesini sağlar.
Google AdSense Politikaları ile Uyumluluk
Bir SEO editörü olarak, Google AdSense ile ilgili deneyimlerim bana robots.txt dosyasının reklam gelirleri üzerindeki potansiyel etkisini net bir şekilde göstermiştir. Google AdSense’ten para kazanıyorsanız, reklamların gösterileceği sayfaların Google botları (özellikle `Mediapartners-Google` botu) tarafından erişilebilir olması kritik önem taşır. Eğer reklam göstereceğiniz bir sayfayı veya sitenizin geneline erişimi robots.txt ile engellerseniz, Google reklamları doğru bir şekilde hedefleyemez veya hiç gösteremez. Bu durum, reklam gelirlerinizin düşmesine veya hatta AdSense hesabınızın
Google AdSense politikaları ihlali nedeniyle askıya alınmasına yol açabilir. Bu nedenle, reklam gösterimi için kritik olan hiçbir sayfayı kesinlikle engellememelisiniz.
WordPress ve Robots.txt: Varsayılan Durum ve Özelleştirme
WordPress, kutudan çıktığı haliyle sanal bir robots.txt dosyası oluşturur. Bu varsayılan dosya genellikle şu şekildedir:
```
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
```
Bu yapı, tüm botların (`User-agent: *`) `/wp-admin/` dizinini taramasını engellerken, `admin-ajax.php` dosyasına erişime izin verir (ki bu, bazı WordPress işlevselliği için gereklidir). Ancak bu varsayılan yapı, çoğu site için yeterli değildir ve genellikle özelleştirme gerektirir.
Özelleştirme İhtiyacı
WordPress siteniz büyüdükçe, farklı eklentiler, temalar, medya kütüphaneleri ve diğer özel içerikler ekledikçe, arama motoru botlarının hangi bölümlere erişip hangilerine erişmemesi gerektiğini daha hassas bir şekilde yönetmek istersiniz. Örneğin:
*
Gereksiz Eklenti/Tema Dosyaları: Bazı eklenti veya tema dosyaları, sitenin arka planında çalışan ancak arama motorlarının indekslemesine gerek olmayan betikleri veya stil dosyalarını içerebilir.
*
Arama Sayfaları: Genellikle sitenizin kendi arama sonuç sayfalarının indekslenmesi istenmez, çünkü bu sayfalar yinelenen içerik oluşturabilir.
*
Etiket ve Kategori Sayfaları: Bazı durumlarda, özellikle içerik bakımından zengin olmayan etiket veya kategori sayfalarının indekslenmesi yerine, bunları `noindex` etiketiyle yönetmek daha doğru olabilir. Ancak robots.txt ile engellemek, arama motorunun bu sayfaları hiç görmemesine neden olur.
*
Geliştirme Ortamları: Eğer sitenizin bir geliştirme veya staging versiyonu varsa, bunun arama motorları tarafından indekslenmesini engellemek çok önemlidir.
Robots.txt Dosyasını Oluşturma veya Düzenleme Yöntemleri
WordPress sitenizde bir
robots.txt dosyası oluşturmanın veya mevcut olanı düzenlemenin birkaç yolu vardır:
1.
WordPress Eklentileri ile: Yoast SEO, Rank Math gibi popüler SEO eklentileri, sitenizin robots.txt dosyasını kolayca düzenlemenize olanak tanıyan bir arayüze sahiptir. Bu, teknik bilgi gerektirmeyen en basit yöntemdir. Eklentinin ayarlarında "Araçlar" veya "SEO" bölümünde genellikle "Dosya Düzenleyici" veya "Robots.txt" sekmesini bulabilirsiniz. Bu
WordPress eklentileri, size görsel bir arayüz sunarak hata yapma riskinizi azaltır.
2.
FTP/cPanel ile Manuel Olarak: Eğer bir SEO eklentisi kullanmak istemiyorsanız veya daha fazla kontrol arıyorsanız, sitenizin kök dizinine FTP istemcisi (FileZilla gibi) veya hosting kontrol paneliniz (cPanel, Plesk vb.) aracılığıyla erişerek robots.txt dosyasını manuel olarak oluşturabilir veya düzenleyebilirsiniz. Dosya adı `robots.txt` olmalı ve sitenizin ana dizininde (genellikle `public_html` veya `www` klasörü) bulunmalıdır. Eğer yoksa, yeni bir metin dosyası oluşturup bu isimle kaydedebilirsiniz.
Güvenli ve Etkili Bir Robots.txt İçin Temel Kurallar
İşte WordPress siteniz için güvenli ve etkili bir robots.txt oluştururken göz önünde bulundurmanız gereken temel direktifler ve AdSense ile ilgili önemli noktalar:
1. User-agent Direktifi
`User-agent:` komutu, hangi botlar için kurallar belirlediğinizi gösterir.
* `User-agent: *`: Bu, tüm arama motoru botları için geçerli olan kuralları belirtir. Çoğu durumda, bu en çok kullanacağınız direktiftir.
* `User-agent: Googlebot`: Sadece Google'ın ana tarayıcısı için kurallar.
* `User-agent: Mediapartners-Google`: Google AdSense botu için özel kurallar. Bu botun sitenizdeki içerikleri reklam hedefleme amacıyla taraması gerektiğinden, erişimini asla kısıtlamamalısınız.
2. Disallow Direktifi
`Disallow:` komutu, belirtilen User-agent'ın belirli bir dizini veya dosyayı taramasını engeller.
Örnekler:
* `Disallow: /wp-admin/`: WordPress yönetim panelini engeller.
* `Disallow: /wp-includes/`: WordPress'in temel dosyalarının bulunduğu dizini engeller.
* `Disallow: /wp-content/plugins/`: Eklenti dosyalarının bulunduğu dizini engeller (ancak unutmayın ki bazı CSS/JS dosyalarını engellemek sitenizin görünümünü bozabilir ve mobil uyumluluğu etkileyebilir).
* `Disallow: /search/`: Sitenizin dahili arama sonuç sayfalarını engeller.
* `Disallow: /tag/`: Etiket sayfalarını engeller (eğer bunları indekslemek istemiyorsanız).
3. Allow Direktifi
`Allow:` komutu, Disallow kuralı içinde olmasına rağmen belirli bir alt dizine veya dosyaya erişime izin verir. Bu, özellikle `wp-admin` içinde `admin-ajax.php` gibi belirli dosyaların çalışması gerektiğinde faydalıdır.
Örnek:
```
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
```
4. Sitemap Direktifi
Bu komut,
XML site haritasınızın (genellikle `sitemap.xml` veya `sitemap_index.xml`) konumunu arama motorlarına bildirir. Bu, botların sitenizdeki tüm önemli sayfaları bulmasına yardımcı olan kritik bir direktiftir. Her zaman robots.txt dosyanızın en altına sitemap URL'inizi eklemelisiniz.
Örnek:
`Sitemap: https://www.siteniz.com/sitemap_index.xml`
WordPress İçin Örnek Bir Robots.txt Yapısı
İşte çoğu WordPress sitesi için iyi bir başlangıç noktası olabilecek bir
Robots Txt Üretici mantığıyla hazırlanmış, dengeli bir örnek:
```
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /trackback/
Disallow: /feed/
Disallow: /comments/feed/
Disallow: /attachment/
Disallow: /index.php
Disallow: /*?
Disallow: /wp-login.php
Disallow: /wp-register.php
CSS, JS, Gorsel dosyalarin Googlebot (veya diger botlar) tarafindan engellenmediginden emin olun.
Google, sayfanin dogru bir sekilde render edilmesi icin bu dosyalara ihtiyac duyar.
Daha fazla bilgi icin: https://developers.google.com/search/docs/crawling-indexing/block-page-resources
User-agent: Googlebot
Disallow: /cgi-bin/
User-agent: Mediapartners-Google
Allow: /
Sitemap: https://www.siteniz.com/sitemap_index.xml
```
Önemli Not: Yukarıdaki örnekte, `/wp-content/plugins/` ve `/wp-content/themes/` dizinlerinin engellenmesi, bazı durumlarda sitenizin görünümünü veya işlevselliğini bozabilir. Modern SEO pratikleri, Google'ın sayfayı tıpkı bir insan gibi görmesi gerektiği için CSS ve JavaScript dosyalarını engellememeyi önerir. Eğer bu dizinler sadece görsel veya fonksiyonel JS/CSS içeriyorsa, bu engellemeleri kaldırmanız veya `Allow` direktifleriyle spesifik dosyalara izin vermeniz gerekebilir. Bu, sitenizin mobil uyumluluğunu ve hızını etkileyebilir; bu konuda daha fazla bilgi için '/makale.php?sayfa=site-hizi-optimizasyonu' adresindeki makalemize göz atabilirsiniz.
Sık Yapılan Hatalar ve Kaçınılması Gerekenler
robots.txt dosyasını oluştururken veya düzenlerken dikkatli olmak çok önemlidir. Küçük bir hata, sitenizin tamamının arama motorlarından kaybolmasına neden olabilir.
1.
Her Şeyi Engellemek (`Disallow: /`): Bu en büyük hatadır. Sitenizin tamamının taranmasını ve indekslenmesini engellersiniz. Eğer yanlışlıkla bunu yaparsanız, siteniz arama sonuçlarından silinir.
2.
Kritik CSS ve JavaScript Dosyalarını Engellemek: Google, bir web sayfasını doğru bir şekilde işleyebilmek için CSS ve JavaScript dosyalarına ihtiyaç duyar. Bu dosyaları engellemek, Google'ın sitenizin nasıl göründüğünü anlayamamasına ve mobil uyumluluk sorunları yaşamasına neden olabilir. Bu durum, SEO sıralamalarınızı olumsuz etkiler.
3.
AdSense Botunu Engellemek: Daha önce de belirttiğim gibi, `Mediapartners-Google` botunun sitenize erişimini engellemek, reklam gelirlerinizin düşmesine veya AdSense hesabınızın kapatılmasına yol açabilir. Her zaman bu bot için `Allow: /` direktifini kullandığınızdan emin olun.
4.
Sitemap Dosyasını Belirtmemek: XML site haritasınızın konumunu robots.txt'ye eklememek, arama motorlarının sitenizdeki tüm önemli sayfaları keşfetmesini zorlaştırabilir. Sitemap'in önemi hakkında '/makale.php?sayfa=xml-sitemap-onemi' adresindeki makalemizi okuyabilirsiniz.
5.
robots.txt Dosyasını Yanlış Konumlandırmak: robots.txt dosyası her zaman sitenizin kök dizininde olmalıdır (örneğin, `https://www.siteniz.com/robots.txt`). Yanlış bir yere koyarsanız, botlar onu bulamaz.
6.
Değişiklikleri Test Etmemek: Herhangi bir değişiklik yaptıktan sonra, Google Search Console'daki "Robots.txt Test Aracı"nı kullanarak yaptığınız değişikliklerin doğru çalıştığından ve istemediğiniz hiçbir şeyi engellemediğinizden emin olun.
Sonuç
WordPress siteniz için güvenli ve etkili bir
robots.txt dosyası oluşturmak, sitenizin SEO performansı, kullanıcı deneyimi ve reklam geliri potansiyeli için kritik öneme sahiptir. Doğru direktiflerle arama motoru botlarını yönlendirerek, crawl bütçenizi verimli kullanır, hassas içerikleri korur ve AdSense politikalarına uyumluluğu sağlarsınız.
Unutmayın, bu dosya küçük olabilir, ancak etkisi büyüktür. Bu nedenle, bir `Robots Txt Üretici` mantığıyla kendi dosyanızı oluştururken her adımı dikkatlice atın ve yaptığınız değişiklikleri düzenli olarak Google Search Console üzerinden test edin. Düzenli kontrol ve güncellemelerle, sitenizin arama motorları dostu yapısını sürdürebilir ve dijital hedeflerinize ulaşabilirsiniz.
Yazar: Ezgi Avcı
Ben Ezgi Avcı, bir Dijital Pazarlama Uzmanı. Platformumuzda teknolojiyi herkes için anlaşılır kılmak, karmaşık konuları basitleştirerek okuyucularımızın günlük yaşamında pratik olarak kullanabileceği bilgiler sunmak, yeni beceriler kazandırmak, farkındalık oluşturmak ve teknoloji dünyasındaki gelişmeleri anlaşılır bir dille aktarmak amacıyla yazıyorum.