
Sadece Belirli Sayfaların Dizinlenmesini Sağlayan Detaylı Robots.txt Dosyası Nasıl Oluşturulur?
İnternet dünyasında bir web sitesinin görünürlüğü, başarısının temel taşlarından biridir. Ancak bu görünürlüğün her zaman sitenin tüm sayfaları için geçerli olması gerekmez. Hatta bazen, belirli sayfaların arama motoru dizinlerine dahil edilmesini engellemek, hem
SEO stratejileri hem de web sitesinin genel performansı açısından büyük önem taşır. İşte bu noktada, `robots.txt` dosyası devreye giriyor. Bir SEO editörü olarak, bu dosyanın doğru bir şekilde yapılandırılmasının, sitenizin kontrolünü elinizde tutmanın ve özellikle
AdSense politikaları çerçevesinde sitenizin değerini artırmanın kilit bir yolu olduğunu söyleyebilirim.
Bu makalede, `robots.txt` dosyasını kullanarak sadece istediğiniz sayfaların dizinlenmesini nasıl sağlayacağınızı, bu sürecin inceliklerini ve dikkat etmeniz gereken kritik noktaları detaylı bir şekilde ele alacağız. Amacımız, sitenizin
crawl bütçesini en verimli şekilde kullanmasını sağlamak ve arama motorlarının sitenizde gerçekten değerli olan içeriğe odaklanmasına yardımcı olmaktır.
Robots.txt Dosyasının Temel Yapısı ve İşleyişi
`robots.txt` dosyası, web sitenizin kök dizininde bulunan basit bir metin dosyasıdır. Temel amacı, Googlebot, Bingbot gibi
arama motoru botlarına sitenizdeki hangi sayfalara erişip erişemeyeceklerini bildirmektir. Bu dosya bir "rica" niteliğindedir; yani botların bu talimatlara uyması beklenir, ancak kötü niyetli botlar bu kuralları göz ardı edebilir. Ancak başlıca arama motorları bu protokole büyük ölçüde saygı duyar.
Bir `robots.txt` dosyasının temel bileşenleri şunlardır:
*
User-agent: Bu direktif, kime hitap ettiğinizi belirtir. Örneğin, `User-agent: *` tüm botlara hitap ederken, `User-agent: Googlebot` sadece Google'ın botuna özel talimatlar verir.
*
Disallow: Bu direktif, belirli bir dizine veya dosyaya erişimi engellemek için kullanılır. `Disallow: /yonetim/` örneği, `/yonetim/` dizinindeki hiçbir şeye erişilmemesi gerektiğini botlara bildirir.
*
Allow: Bu direktif, `Disallow` direktifiyle engellenmiş bir dizin içindeki belirli bir dosyaya veya alt dizine özel olarak izin vermek için kullanılır. Bu, sadece belirli sayfaların dizinlenmesini sağlamak istediğimizde anahtar bir direktiftir.
*
Sitemap: Bu direktif, sitenizin XML
site haritasının konumunu belirtir. Bu, botların sitenizdeki tüm önemli sayfaları daha kolay bulmasına yardımcı olur.
Neden Sadece Belirli Sayfaları Dizinlemelisiniz?
Sitenizdeki her sayfanın arama motorları tarafından dizinlenmesi, kulağa her ne kadar iyi gelse de, çoğu zaman verimsiz ve hatta zararlı olabilir. İşte belirli sayfaların dizinlenmesini kontrol etmenin başlıca nedenleri:
Crawl Budget Optimizasyonu
Büyük sitelerde veya sık güncellenen sitelerde, arama motorlarının sitenizde gezinmek için harcadığı belirli bir "crawl bütçesi" vardır. Eğer botlar zamanlarını önemsiz, düşük kaliteli veya yinelenen sayfalarda harcarsa, sitenizin gerçekten değerli ve güncel içeriğine ulaşmaları ve bunları dizine eklemeleri gecikebilir. `robots.txt` ile botları yönlendirerek,
crawl bütçesinin en önemli sayfalarınıza odaklanmasını sağlayabilirsiniz.
İçerik Kalitesi ve Alaka Düzeyi
Web sitenizde yönetim paneli sayfaları, test sayfaları, teşekkür sayfaları, alışveriş sepeti gibi arama sonuçlarında görünmesini istemediğiniz veya kullanıcılara bir değer katmayacak sayfalar bulunabilir. Ayrıca, bazı sayfalarınızın içeriği düşük kaliteli olabilir veya AdSense yayıncılığı yapıyorsanız
AdSense politikalarına uymayabilir. Bu tür sayfaların dizine eklenmesi, sitenizin genel kalite algısını düşürebilir ve sıralamalara olumsuz etki edebilir. AdSense açısından bakıldığında, botların reklamları göstermek için ziyaret etmesi gereken sayfaların erişilebilir olması kritik önem taşırken, reklam göstermek istemediğiniz veya politikalar gereği uygun olmayan sayfaların dizinlenmesini engellemek AdSense hesabınızın sağlığı için önemlidir.
Kopya İçerik Sorunlarının Önlenmesi
Bir web sitesinde, farklı URL'ler altında aynı veya çok benzer içeriğin bulunması (örneğin, filtreleme veya sıralama seçenekleri içeren
URL parametreleri ile oluşan sayfalar, yazıcı dostu versiyonlar) "kopya içerik" sorunlarına yol açabilir. Arama motorları bu durumu algıladığında, hangi sayfanın orijinal olduğunu belirlemede zorlanabilir ve bu da sitenizin sıralamalarını olumsuz etkileyebilir. `robots.txt` ile bu tür sayfaların dizinlenmesini engelleyerek, bu tür sorunları baştan çözebilirsiniz.
Gizlilik ve Güvenlik
Sitenizin kullanıcı verilerini içeren sayfalar, giriş panelleri veya diğer hassas bilgileri barındıran alanlar olabilir. Bu sayfaların arama motoru dizinlerinde görünmesini engellemek, birincil güvenlik katmanı olmasa da, kötü niyetli kişilerin bu sayfaları keşfetmesini zorlaştırır.
Sadece Belirli Sayfaların Dizinlenmesini Sağlayan Stratejiler
Şimdi asıl konumuza gelelim: `robots.txt` dosyasını kullanarak sadece istediğiniz sayfaların dizine eklenmesini nasıl sağlayacaksınız? Bu, genellikle iki ana yaklaşımla yapılır.
Varsayılan Olarak Her Şeyi Engelle, Sonra İzin Ver
Bu strateji, sitenizde sadece belirli, önceden tanımlanmış sayfaların dizine eklenmesini istediğinizde en güvenli ve kontrolcü yöntemdir. Tüm siteye erişimi engelleyerek başlarsınız ve ardından izin vermek istediğiniz belirli sayfa veya dizinleri listelersiniz.
```
User-agent: *
Disallow: /
Allow: /anasayfa.html
Allow: /hakkimizda/
Allow: /blog/onemli-yazi.html
Allow: /urunler/kategori1/
Sitemap: https://www.orneksite.com/sitemap.xml
```
Yukarıdaki örnekte:
* `User-agent: *` tüm arama motoru botlarını hedefler.
* `Disallow: /` tüm web sitesine erişimi yasaklar.
* `Allow: /anasayfa.html`, `/hakkimizda/` ve `/blog/onemli-yazi.html` gibi belirli sayfalar veya `/urunler/kategori1/` gibi bir dizin altındaki tüm sayfalara erişime izin verilir. Bu, botların yalnızca bu belirtilen sayfa ve dizinlere odaklanmasını sağlar.
Bu yöntemin temel avantajı, yanlışlıkla dizine eklenmesini istemediğiniz bir şeyin gözden kaçmasını engellemesidir. Varsayılan olarak her şey engellenir, bu da size tam kontrol sağlar.
Belirli Dizinleri Engelle, Belirli Dosyalara İzin Ver
Bu yaklaşım, sitenizin büyük bir bölümünün dizinlenmesine izin verirken, sadece belirli "sorunlu" dizinleri veya sayfaları engellemeyi ve bu engellenen dizinler içindeki bazı istisnai sayfalara izin vermeyi amaçlar. Bu, varsayılan olarak engelleme stratejisinden biraz daha az katıdır ve daha çok "özel durumları yönetme" amacına hizmet eder.
```
User-agent: *
Disallow: /admin/
Disallow: /test-sayfalari/
Disallow: /kullanici/profilim/
Allow: /test-sayfalari/canli-test-sonuclari.html
Sitemap: https://www.siteniz.com/sitemap.xml
```
Bu örnekte:
* `/admin/` dizini ve `/kullanici/profilim/` gibi hassas dizinler tamamen engellenmiştir.
* `/test-sayfalari/` dizini de engellenmiş, ancak bu dizin içindeki `canli-test-sonuclari.html` dosyasına özel olarak izin verilmiştir. Bu, botların test sayfalarının genelini görmesini engellerken, önemli bir raporu veya sonucu indekslemelerini sağlar.
Parametreli URL'ler İçin İzin Verme/Engelleme
Modern web sitelerinde, özellikle e-ticaret ve filtreleme kullanan sitelerde,
URL parametreleri ile oluşturulan birçok dinamik sayfa bulunur. Bu sayfaların çoğu kopya içeriğe yol açtığı için dizine eklenmesini istemeyiz.
```
User-agent: *
Disallow: /*?
Allow: /urunler/
Allow: /kategori/elbise/?renk=kirmizi
Sitemap: https://www.orneksite.com/sitemap.xml
```
Burada `Disallow: /*?` direktifi, içinde soru işareti (?) bulunan tüm URL'leri engellemeye çalışır. Bu, genellikle parametreli URL'lerin büyük çoğunluğunu engeller. Ancak ardından `Allow: /kategori/elbise/?renk=kirmizi` gibi özel bir parametreli URL'ye izin vererek, o belirli filtrelenmiş sayfanın dizine eklenmesini sağlayabilirsiniz. Bu oldukça güçlü bir kullanım şeklidir, ancak dikkatli kullanılmalı ve Search Console'da test edilmelidir.
Robots.txt Oluştururken Dikkat Edilmesi Gereken Önemli Noktalar
Konum ve İsimlendirme
`robots.txt` dosyası her zaman web sitenizin ana dizininde bulunmalı ve ismi tam olarak `robots.txt` olmalıdır (küçük harflerle). Örneğin, `www.siteniz.com/robots.txt`. Yanlış bir konumda veya yanlış isimle oluşturulan dosya, botlar tarafından tanınmaz.
Sözdizimi ve Büyük/Küçük Harf Duyarlılığı
`robots.txt` dosyasındaki direktifler büyük/küçük harf duyarlıdır. Örneğin, `/Anasayfa.html` ile `/anasayfa.html` farklı olarak algılanır. Bu nedenle, dosya yollarını ve isimlerini sitenizdeki gerçek yapıyla birebir aynı yazmalısınız.
Düzenli Test ve Kontrol
Robots.txt dosyasında yapılan bir hata, sitenizin önemli bölümlerinin dizinlerden tamamen kaybolmasına neden olabilir. Bu nedenle, herhangi bir değişiklik yaptıktan sonra Google Search Console'daki `robots.txt` test aracını kullanarak dosyanızı mutlaka test edin. Bu araç, botların hangi sayfalara erişebileceğini ve hangilerine erişemeyeceğini görmenizi sağlar. Ayrıca, sitenizin yapısı değiştikçe veya yeni sayfalar eklendikçe `robots.txt` dosyanızı düzenli olarak gözden geçirmeli ve güncellemelisiniz. Eğer bu araçları doğru kullanmakta zorlanıyorsanız, "/makale.php?sayfa=google-search-console-rehberi" gibi bir makaleye göz atmak faydalı olacaktır.
AdSense ve SEO Etkileşimi
Unutmayın ki AdSense reklamlarının web sayfalarınızda görünebilmesi için, Google'ın reklam botlarının (Mediapartners-Google) bu sayfalara erişebilmesi ve içeriği analiz edebilmesi gerekir. Eğer bir sayfayı `robots.txt` ile tamamen engellerseniz, Google'ın reklam botları da o sayfaya erişemez ve dolayısıyla reklam gösterimi yapamaz. Bu nedenle, AdSense geliri elde etmek istediğiniz tüm sayfaların `robots.txt` tarafından engellenmediğinden emin olmalısınız. Kısacası, AdSense gelirlerinizin sürdürülebilirliği için botların değerli içeriğinize erişiminin açık olması esastır. Doğru
içerik kalitesi ve görünürlük arasındaki dengeyi kurmak AdSense başarısının anahtarıdır.
Robots.txt'nin Yapamadıkları ve Alternatifleri
`robots.txt` güçlü bir araç olsa da, bazı sınırlamaları vardır ve her amaca hizmet etmez.
*
Güvenlik Aracı Değildir: `robots.txt` sadece iyi niyetli botlara bir rehberlik sağlar. Kötü niyetli botlar veya doğrudan erişim isteyen kullanıcılar bu dosyayı göz ardı edebilir. Hassas bilgileri korumak için sunucu taraflı güvenlik önlemleri (şifreleme, kimlik doğrulama vb.) kullanmalısınız.
*
Sayfayı Dizinlerden Tamamen Kaldırmaz: Eğer bir sayfa zaten arama motoru dizinlerine eklenmişse ve siz onu `robots.txt` ile engellerseniz, botlar sayfayı tekrar ziyaret edemez ancak sayfa dizinden hemen kalkmaz. Sayfa, tarama botları tarafından erişilemediği için zamanla dizinden düşebilir, ancak bu süreç uzun sürebilir. Sayfayı dizinden hızla kaldırmak istiyorsanız, `noindex` meta etiketi veya Google Search Console'daki URL kaldırma aracını kullanmalısınız.
*
Noindex Meta Etiketi / X-Robots-Tag: Bir sayfanın kesinlikle dizine eklenmemesini istiyorsanız, sayfanın `` bölümüne `
` etiketini eklemek veya HTTP başlığı aracılığıyla `X-Robots-Tag: noindex, follow` kullanmak daha kesin bir çözümdür. Ancak, botların bu etiketi görebilmesi için sayfaya erişiminin olması gerekir. `robots.txt` ile engellenen bir sayfanın `noindex` etiketini botlar göremez.
İç Linkleme Önerisi:
Eğer sitenizde `noindex` meta etiketi hakkında daha fazla bilgi almak isterseniz, "/makale.php?sayfa=noindex-etiketi-kullanimi" başlıklı makalemizi ziyaret edebilirsiniz. Ayrıca, genel SEO performansınızı artırmak için "/makale.php?sayfa=site-hizi-optimizasyonu" gibi konularda da bilgi edinebilirsiniz.
Sonuç
`robots.txt` dosyası, web sitenizin arama motorları tarafından nasıl algılandığını ve tarandığını kontrol etmeniz için vazgeçilmez bir araçtır. Özellikle sadece belirli sayfaların dizinlenmesini sağlayarak,
crawl bütçesinizi optimize edebilir,
AdSense politikalarına uygunluğu garantileyebilir, kopya içerik sorunlarını önleyebilir ve sitenizin genel SEO performansını artırabilirsiniz.
Bu dosyanın doğru bir şekilde oluşturulması ve düzenli olarak kontrol edilmesi, sitenizin uzun vadeli başarısı için kritik öneme sahiptir. Unutmayın, iyi yönetilen bir `robots.txt` dosyası, sitenizin en değerli içeriğinin hak ettiği görünürlüğe kavuşmasını sağlarken, gereksiz yükleri ortadan kaldırır. Sitenizin dinamik yapısına uygun, detaylı ve iyi düşünülmüş bir `robots.txt` ile web dünyasındaki yerinizi sağlamlaştırın.
Yazar: Ezgi Avcı
Ben Ezgi Avcı, bir Dijital Pazarlama Uzmanı. Platformumuzda teknolojiyi herkes için anlaşılır kılmak, karmaşık konuları basitleştirerek okuyucularımızın günlük yaşamında pratik olarak kullanabileceği bilgiler sunmak, yeni beceriler kazandırmak, farkındalık oluşturmak ve teknoloji dünyasındaki gelişmeleri anlaşılır bir dille aktarmak amacıyla yazıyorum.