Sadece Belirli Sayfalarin Dizinlenmesini Saglayan Detayli Robotstxt Do
Sadece Belirli Sayfalarin Dizinlenmesini Saglayan Detayli Robotstxt Do

Sadece Belirli Sayfaların Dizinlenmesini Sağlayan Detaylı Robots.txt Dosyası Nasıl Oluşturulur?


İnternet dünyasında bir web sitesinin görünürlüğü, başarısının temel taşlarından biridir. Ancak bu görünürlüğün her zaman sitenin tüm sayfaları için geçerli olması gerekmez. Hatta bazen, belirli sayfaların arama motoru dizinlerine dahil edilmesini engellemek, hem SEO stratejileri hem de web sitesinin genel performansı açısından büyük önem taşır. İşte bu noktada, `robots.txt` dosyası devreye giriyor. Bir SEO editörü olarak, bu dosyanın doğru bir şekilde yapılandırılmasının, sitenizin kontrolünü elinizde tutmanın ve özellikle AdSense politikaları çerçevesinde sitenizin değerini artırmanın kilit bir yolu olduğunu söyleyebilirim.
Bu makalede, `robots.txt` dosyasını kullanarak sadece istediğiniz sayfaların dizinlenmesini nasıl sağlayacağınızı, bu sürecin inceliklerini ve dikkat etmeniz gereken kritik noktaları detaylı bir şekilde ele alacağız. Amacımız, sitenizin crawl bütçesini en verimli şekilde kullanmasını sağlamak ve arama motorlarının sitenizde gerçekten değerli olan içeriğe odaklanmasına yardımcı olmaktır.

Robots.txt Dosyasının Temel Yapısı ve İşleyişi


`robots.txt` dosyası, web sitenizin kök dizininde bulunan basit bir metin dosyasıdır. Temel amacı, Googlebot, Bingbot gibi arama motoru botlarına sitenizdeki hangi sayfalara erişip erişemeyeceklerini bildirmektir. Bu dosya bir "rica" niteliğindedir; yani botların bu talimatlara uyması beklenir, ancak kötü niyetli botlar bu kuralları göz ardı edebilir. Ancak başlıca arama motorları bu protokole büyük ölçüde saygı duyar.
Bir `robots.txt` dosyasının temel bileşenleri şunlardır:
* User-agent: Bu direktif, kime hitap ettiğinizi belirtir. Örneğin, `User-agent: *` tüm botlara hitap ederken, `User-agent: Googlebot` sadece Google'ın botuna özel talimatlar verir.
* Disallow: Bu direktif, belirli bir dizine veya dosyaya erişimi engellemek için kullanılır. `Disallow: /yonetim/` örneği, `/yonetim/` dizinindeki hiçbir şeye erişilmemesi gerektiğini botlara bildirir.
* Allow: Bu direktif, `Disallow` direktifiyle engellenmiş bir dizin içindeki belirli bir dosyaya veya alt dizine özel olarak izin vermek için kullanılır. Bu, sadece belirli sayfaların dizinlenmesini sağlamak istediğimizde anahtar bir direktiftir.
* Sitemap: Bu direktif, sitenizin XML site haritasının konumunu belirtir. Bu, botların sitenizdeki tüm önemli sayfaları daha kolay bulmasına yardımcı olur.

Neden Sadece Belirli Sayfaları Dizinlemelisiniz?


Sitenizdeki her sayfanın arama motorları tarafından dizinlenmesi, kulağa her ne kadar iyi gelse de, çoğu zaman verimsiz ve hatta zararlı olabilir. İşte belirli sayfaların dizinlenmesini kontrol etmenin başlıca nedenleri:

Crawl Budget Optimizasyonu


Büyük sitelerde veya sık güncellenen sitelerde, arama motorlarının sitenizde gezinmek için harcadığı belirli bir "crawl bütçesi" vardır. Eğer botlar zamanlarını önemsiz, düşük kaliteli veya yinelenen sayfalarda harcarsa, sitenizin gerçekten değerli ve güncel içeriğine ulaşmaları ve bunları dizine eklemeleri gecikebilir. `robots.txt` ile botları yönlendirerek, crawl bütçesinin en önemli sayfalarınıza odaklanmasını sağlayabilirsiniz.

İçerik Kalitesi ve Alaka Düzeyi


Web sitenizde yönetim paneli sayfaları, test sayfaları, teşekkür sayfaları, alışveriş sepeti gibi arama sonuçlarında görünmesini istemediğiniz veya kullanıcılara bir değer katmayacak sayfalar bulunabilir. Ayrıca, bazı sayfalarınızın içeriği düşük kaliteli olabilir veya AdSense yayıncılığı yapıyorsanız AdSense politikalarına uymayabilir. Bu tür sayfaların dizine eklenmesi, sitenizin genel kalite algısını düşürebilir ve sıralamalara olumsuz etki edebilir. AdSense açısından bakıldığında, botların reklamları göstermek için ziyaret etmesi gereken sayfaların erişilebilir olması kritik önem taşırken, reklam göstermek istemediğiniz veya politikalar gereği uygun olmayan sayfaların dizinlenmesini engellemek AdSense hesabınızın sağlığı için önemlidir.

Kopya İçerik Sorunlarının Önlenmesi


Bir web sitesinde, farklı URL'ler altında aynı veya çok benzer içeriğin bulunması (örneğin, filtreleme veya sıralama seçenekleri içeren URL parametreleri ile oluşan sayfalar, yazıcı dostu versiyonlar) "kopya içerik" sorunlarına yol açabilir. Arama motorları bu durumu algıladığında, hangi sayfanın orijinal olduğunu belirlemede zorlanabilir ve bu da sitenizin sıralamalarını olumsuz etkileyebilir. `robots.txt` ile bu tür sayfaların dizinlenmesini engelleyerek, bu tür sorunları baştan çözebilirsiniz.

Gizlilik ve Güvenlik


Sitenizin kullanıcı verilerini içeren sayfalar, giriş panelleri veya diğer hassas bilgileri barındıran alanlar olabilir. Bu sayfaların arama motoru dizinlerinde görünmesini engellemek, birincil güvenlik katmanı olmasa da, kötü niyetli kişilerin bu sayfaları keşfetmesini zorlaştırır.

Sadece Belirli Sayfaların Dizinlenmesini Sağlayan Stratejiler


Şimdi asıl konumuza gelelim: `robots.txt` dosyasını kullanarak sadece istediğiniz sayfaların dizine eklenmesini nasıl sağlayacaksınız? Bu, genellikle iki ana yaklaşımla yapılır.

Varsayılan Olarak Her Şeyi Engelle, Sonra İzin Ver


Bu strateji, sitenizde sadece belirli, önceden tanımlanmış sayfaların dizine eklenmesini istediğinizde en güvenli ve kontrolcü yöntemdir. Tüm siteye erişimi engelleyerek başlarsınız ve ardından izin vermek istediğiniz belirli sayfa veya dizinleri listelersiniz.
```
User-agent: *
Disallow: /
Allow: /anasayfa.html
Allow: /hakkimizda/
Allow: /blog/onemli-yazi.html
Allow: /urunler/kategori1/
Sitemap: https://www.orneksite.com/sitemap.xml
```
Yukarıdaki örnekte:
* `User-agent: *` tüm arama motoru botlarını hedefler.
* `Disallow: /` tüm web sitesine erişimi yasaklar.
* `Allow: /anasayfa.html`, `/hakkimizda/` ve `/blog/onemli-yazi.html` gibi belirli sayfalar veya `/urunler/kategori1/` gibi bir dizin altındaki tüm sayfalara erişime izin verilir. Bu, botların yalnızca bu belirtilen sayfa ve dizinlere odaklanmasını sağlar.
Bu yöntemin temel avantajı, yanlışlıkla dizine eklenmesini istemediğiniz bir şeyin gözden kaçmasını engellemesidir. Varsayılan olarak her şey engellenir, bu da size tam kontrol sağlar.

Belirli Dizinleri Engelle, Belirli Dosyalara İzin Ver


Bu yaklaşım, sitenizin büyük bir bölümünün dizinlenmesine izin verirken, sadece belirli "sorunlu" dizinleri veya sayfaları engellemeyi ve bu engellenen dizinler içindeki bazı istisnai sayfalara izin vermeyi amaçlar. Bu, varsayılan olarak engelleme stratejisinden biraz daha az katıdır ve daha çok "özel durumları yönetme" amacına hizmet eder.
```
User-agent: *
Disallow: /admin/
Disallow: /test-sayfalari/
Disallow: /kullanici/profilim/
Allow: /test-sayfalari/canli-test-sonuclari.html
Sitemap: https://www.siteniz.com/sitemap.xml
```
Bu örnekte:
* `/admin/` dizini ve `/kullanici/profilim/` gibi hassas dizinler tamamen engellenmiştir.
* `/test-sayfalari/` dizini de engellenmiş, ancak bu dizin içindeki `canli-test-sonuclari.html` dosyasına özel olarak izin verilmiştir. Bu, botların test sayfalarının genelini görmesini engellerken, önemli bir raporu veya sonucu indekslemelerini sağlar.

Parametreli URL'ler İçin İzin Verme/Engelleme


Modern web sitelerinde, özellikle e-ticaret ve filtreleme kullanan sitelerde, URL parametreleri ile oluşturulan birçok dinamik sayfa bulunur. Bu sayfaların çoğu kopya içeriğe yol açtığı için dizine eklenmesini istemeyiz.
```
User-agent: *
Disallow: /*?
Allow: /urunler/
Allow: /kategori/elbise/?renk=kirmizi
Sitemap: https://www.orneksite.com/sitemap.xml
```
Burada `Disallow: /*?` direktifi, içinde soru işareti (?) bulunan tüm URL'leri engellemeye çalışır. Bu, genellikle parametreli URL'lerin büyük çoğunluğunu engeller. Ancak ardından `Allow: /kategori/elbise/?renk=kirmizi` gibi özel bir parametreli URL'ye izin vererek, o belirli filtrelenmiş sayfanın dizine eklenmesini sağlayabilirsiniz. Bu oldukça güçlü bir kullanım şeklidir, ancak dikkatli kullanılmalı ve Search Console'da test edilmelidir.

Robots.txt Oluştururken Dikkat Edilmesi Gereken Önemli Noktalar


Konum ve İsimlendirme


`robots.txt` dosyası her zaman web sitenizin ana dizininde bulunmalı ve ismi tam olarak `robots.txt` olmalıdır (küçük harflerle). Örneğin, `www.siteniz.com/robots.txt`. Yanlış bir konumda veya yanlış isimle oluşturulan dosya, botlar tarafından tanınmaz.

Sözdizimi ve Büyük/Küçük Harf Duyarlılığı


`robots.txt` dosyasındaki direktifler büyük/küçük harf duyarlıdır. Örneğin, `/Anasayfa.html` ile `/anasayfa.html` farklı olarak algılanır. Bu nedenle, dosya yollarını ve isimlerini sitenizdeki gerçek yapıyla birebir aynı yazmalısınız.

Düzenli Test ve Kontrol


Robots.txt dosyasında yapılan bir hata, sitenizin önemli bölümlerinin dizinlerden tamamen kaybolmasına neden olabilir. Bu nedenle, herhangi bir değişiklik yaptıktan sonra Google Search Console'daki `robots.txt` test aracını kullanarak dosyanızı mutlaka test edin. Bu araç, botların hangi sayfalara erişebileceğini ve hangilerine erişemeyeceğini görmenizi sağlar. Ayrıca, sitenizin yapısı değiştikçe veya yeni sayfalar eklendikçe `robots.txt` dosyanızı düzenli olarak gözden geçirmeli ve güncellemelisiniz. Eğer bu araçları doğru kullanmakta zorlanıyorsanız, "/makale.php?sayfa=google-search-console-rehberi" gibi bir makaleye göz atmak faydalı olacaktır.

AdSense ve SEO Etkileşimi


Unutmayın ki AdSense reklamlarının web sayfalarınızda görünebilmesi için, Google'ın reklam botlarının (Mediapartners-Google) bu sayfalara erişebilmesi ve içeriği analiz edebilmesi gerekir. Eğer bir sayfayı `robots.txt` ile tamamen engellerseniz, Google'ın reklam botları da o sayfaya erişemez ve dolayısıyla reklam gösterimi yapamaz. Bu nedenle, AdSense geliri elde etmek istediğiniz tüm sayfaların `robots.txt` tarafından engellenmediğinden emin olmalısınız. Kısacası, AdSense gelirlerinizin sürdürülebilirliği için botların değerli içeriğinize erişiminin açık olması esastır. Doğru içerik kalitesi ve görünürlük arasındaki dengeyi kurmak AdSense başarısının anahtarıdır.

Robots.txt'nin Yapamadıkları ve Alternatifleri


`robots.txt` güçlü bir araç olsa da, bazı sınırlamaları vardır ve her amaca hizmet etmez.
* Güvenlik Aracı Değildir: `robots.txt` sadece iyi niyetli botlara bir rehberlik sağlar. Kötü niyetli botlar veya doğrudan erişim isteyen kullanıcılar bu dosyayı göz ardı edebilir. Hassas bilgileri korumak için sunucu taraflı güvenlik önlemleri (şifreleme, kimlik doğrulama vb.) kullanmalısınız.
* Sayfayı Dizinlerden Tamamen Kaldırmaz: Eğer bir sayfa zaten arama motoru dizinlerine eklenmişse ve siz onu `robots.txt` ile engellerseniz, botlar sayfayı tekrar ziyaret edemez ancak sayfa dizinden hemen kalkmaz. Sayfa, tarama botları tarafından erişilemediği için zamanla dizinden düşebilir, ancak bu süreç uzun sürebilir. Sayfayı dizinden hızla kaldırmak istiyorsanız, `noindex` meta etiketi veya Google Search Console'daki URL kaldırma aracını kullanmalısınız.
* Noindex Meta Etiketi / X-Robots-Tag: Bir sayfanın kesinlikle dizine eklenmemesini istiyorsanız, sayfanın `` bölümüne `` etiketini eklemek veya HTTP başlığı aracılığıyla `X-Robots-Tag: noindex, follow` kullanmak daha kesin bir çözümdür. Ancak, botların bu etiketi görebilmesi için sayfaya erişiminin olması gerekir. `robots.txt` ile engellenen bir sayfanın `noindex` etiketini botlar göremez.

İç Linkleme Önerisi:


Eğer sitenizde `noindex` meta etiketi hakkında daha fazla bilgi almak isterseniz, "/makale.php?sayfa=noindex-etiketi-kullanimi" başlıklı makalemizi ziyaret edebilirsiniz. Ayrıca, genel SEO performansınızı artırmak için "/makale.php?sayfa=site-hizi-optimizasyonu" gibi konularda da bilgi edinebilirsiniz.

Sonuç


`robots.txt` dosyası, web sitenizin arama motorları tarafından nasıl algılandığını ve tarandığını kontrol etmeniz için vazgeçilmez bir araçtır. Özellikle sadece belirli sayfaların dizinlenmesini sağlayarak, crawl bütçesinizi optimize edebilir, AdSense politikalarına uygunluğu garantileyebilir, kopya içerik sorunlarını önleyebilir ve sitenizin genel SEO performansını artırabilirsiniz.
Bu dosyanın doğru bir şekilde oluşturulması ve düzenli olarak kontrol edilmesi, sitenizin uzun vadeli başarısı için kritik öneme sahiptir. Unutmayın, iyi yönetilen bir `robots.txt` dosyası, sitenizin en değerli içeriğinin hak ettiği görünürlüğe kavuşmasını sağlarken, gereksiz yükleri ortadan kaldırır. Sitenizin dinamik yapısına uygun, detaylı ve iyi düşünülmüş bir `robots.txt` ile web dünyasındaki yerinizi sağlamlaştırın.

Ezgi Avcı

Yazar: Ezgi Avcı

Ben Ezgi Avcı, bir Dijital Pazarlama Uzmanı. Platformumuzda teknolojiyi herkes için anlaşılır kılmak, karmaşık konuları basitleştirerek okuyucularımızın günlük yaşamında pratik olarak kullanabileceği bilgiler sunmak, yeni beceriler kazandırmak, farkındalık oluşturmak ve teknoloji dünyasındaki gelişmeleri anlaşılır bir dille aktarmak amacıyla yazıyorum.

Diğer Makaleler

Sitenizin Seosuna Zarar Vermeyen Robotstxt Dosyasini Hizla Ve Hatasiz Sitenizin Seosuna Zarar Vermeyen Robotstxt Dosyasini Hizla Ve Hatasiz Web Sitem Google Arama Sonuclarinda Yok Robotstxt Hatasi Olabilir Mi NWeb Sitem Google Arama Sonuclarinda Yok Robotstxt Hatasi Olabilir Mi NKopya Icerik Cezasi Almamak Icin Robotstxt Uretici Ile Hangi SayfalariKopya Icerik Cezasi Almamak Icin Robotstxt Uretici Ile Hangi SayfalariE Ticaret Sitemin Yonetim Paneli Sayfalarini Robotstxt Ile Googledan NE Ticaret Sitemin Yonetim Paneli Sayfalarini Robotstxt Ile Googledan NRobotstxt Ureticisiyle Olusturdugum Dosyaya Ragmen Sayfalarim GoogledaRobotstxt Ureticisiyle Olusturdugum Dosyaya Ragmen Sayfalarim GoogledaRobotstxt Ureticisi Kullanirken Onemli Sayfalarin Googledan EngellenmeRobotstxt Ureticisi Kullanirken Onemli Sayfalarin Googledan EngellenmeUrl Parametrelerinden Kaynaklanan Kopya Icerik Sorunlarini Gidermek VeUrl Parametrelerinden Kaynaklanan Kopya Icerik Sorunlarini Gidermek VeYonetici Paneli Sepet Veya Tesekkur Sayfalarinizi Arama Motorlarindan Yonetici Paneli Sepet Veya Tesekkur Sayfalarinizi Arama Motorlarindan Gereksiz Urllerin Google Tarayici Butcenizi Tuketmesini Engellemek IciGereksiz Urllerin Google Tarayici Butcenizi Tuketmesini Engellemek IciWordpress Sitenizdeki Etiket Ve Kategori Sayfalarini Googledan GizlemeWordpress Sitenizdeki Etiket Ve Kategori Sayfalarini Googledan GizlemeGelistirme Asamasindaki Sitenizi Veya Yonetici Panelinizi Robotstxt UrGelistirme Asamasindaki Sitenizi Veya Yonetici Panelinizi Robotstxt UrHangi Sayfalari Engellemeli Robotstxt Uretici Ile Seoya Zarar VermedenHangi Sayfalari Engellemeli Robotstxt Uretici Ile Seoya Zarar VermedenWordpress Sitemdeki Etiket Ve Kategori Sayfalarinin Arama MotorlarindaWordpress Sitemdeki Etiket Ve Kategori Sayfalarinin Arama MotorlarindaGoogle Search Consoledaki Tarama Hatasi Uyarisini Robots Txt Uretici IGoogle Search Consoledaki Tarama Hatasi Uyarisini Robots Txt Uretici IMevcut Robotstxt Dosyami Sitenize Zarar Vermeden Guvenli Bir Sekilde NMevcut Robotstxt Dosyami Sitenize Zarar Vermeden Guvenli Bir Sekilde NSubdomainler Icin Ayri Robotstxt Dosyasi Gerekli Mi Karar Verme KilavuSubdomainler Icin Ayri Robotstxt Dosyasi Gerekli Mi Karar Verme KilavuYinelenen Icerik Sorununu Robotstxt Dosyasiyla Cozmeye Calisirken YapiYinelenen Icerik Sorununu Robotstxt Dosyasiyla Cozmeye Calisirken YapiRobotstxt Uretici Kullanarak Dinamik Url Parametrelerini Tarama Disi BRobotstxt Uretici Kullanarak Dinamik Url Parametrelerini Tarama Disi BResim Ve Pdf Dosyalarimi Robotstxt Ile Google Gorsellerden EngelleyebiResim Ve Pdf Dosyalarimi Robotstxt Ile Google Gorsellerden EngelleyebiGelistirme Ortami Sitelerimi Robotstxt Kullanarak Arama Motoru TaramasGelistirme Ortami Sitelerimi Robotstxt Kullanarak Arama Motoru TaramasBuyuk Bir E Ticaret Sitesi Icin Robotstxt Dosyasini Uretecinizle EtkilBuyuk Bir E Ticaret Sitesi Icin Robotstxt Dosyasini Uretecinizle EtkilSitemap Konumunu Robotstxtye Nasil Eklerim Ve Bu Seomu Nasil EtkilerSitemap Konumunu Robotstxtye Nasil Eklerim Ve Bu Seomu Nasil EtkilerWordpress Yonetici Paneli Urlimi Robotstxt Ile Arama Motorlarindan GizWordpress Yonetici Paneli Urlimi Robotstxt Ile Arama Motorlarindan GizYanlis Robotstxt Dosyasi Yuzunden Google Indexinden Cikan Sayfalarimi Yanlis Robotstxt Dosyasi Yuzunden Google Indexinden Cikan Sayfalarimi Robotstxt Olustururken Seo Deger Kaybini Onlemek Icin Neler YapmaliyimRobotstxt Olustururken Seo Deger Kaybini Onlemek Icin Neler YapmaliyimRobotstxt Dosyasinda Yanlislikla Engellenen Gorselleri Nasil DuzeltiriRobotstxt Dosyasinda Yanlislikla Engellenen Gorselleri Nasil DuzeltiriTum Sitemi Dizine Kapatip Sadece Bir Kac Sayfayi Nasil Acik BirakirimTum Sitemi Dizine Kapatip Sadece Bir Kac Sayfayi Nasil Acik BirakirimSadece Belirli Arama Motoru Botlarina Izin Veren Robotstxt Nasil YaparSadece Belirli Arama Motoru Botlarina Izin Veren Robotstxt Nasil YaparRobotstxt Dosyamdaki Google Search Console Hatalarini Nasil GideririmRobotstxt Dosyamdaki Google Search Console Hatalarini Nasil GideririmE Ticaret Sitemdeki Kopyalanan Icerigi Robotstxt Ile Nasil GizlerimE Ticaret Sitemdeki Kopyalanan Icerigi Robotstxt Ile Nasil GizlerimRobotstxt Uretici Kullanarak Kategori Sayfalarini Dogru Sekilde Nasil Robotstxt Uretici Kullanarak Kategori Sayfalarini Dogru Sekilde Nasil Yanlis Robotstxt Dosyasi Yuzunden Sitem Neden Arama Motorunda CikmiyorYanlis Robotstxt Dosyasi Yuzunden Sitem Neden Arama Motorunda CikmiyorGooglein Belirli Sayfalarimi Indekslemesini Robotstxt Ile Nasil EngellGooglein Belirli Sayfalarimi Indekslemesini Robotstxt Ile Nasil EngellYeni Sitem Icin Robotstxt Dosyasini Hizlica Nasil OlusturabilirimYeni Sitem Icin Robotstxt Dosyasini Hizlica Nasil OlusturabilirimRobotstxt Hatalarini Onlemek Ve Site Sagligini Korumak Icin Ucretsiz ARobotstxt Hatalarini Onlemek Ve Site Sagligini Korumak Icin Ucretsiz AWeb Sitenizin Tarama Butcesini Optimize Etmek Icin Dogru Robotstxt DosWeb Sitenizin Tarama Butcesini Optimize Etmek Icin Dogru Robotstxt DosBelirli Url Parametrelerini Engelleme Robotstxt Ureteci Ile Adim Adim Belirli Url Parametrelerini Engelleme Robotstxt Ureteci Ile Adim Adim Yonetici Paneli Sayfalarinizi Arama Motorlarindan Uzak Tutmak Icin RobYonetici Paneli Sayfalarinizi Arama Motorlarindan Uzak Tutmak Icin RobSitemap Gondermeme Ragmen Robotstxtnin Dizine Engellemesini Nasil OnleSitemap Gondermeme Ragmen Robotstxtnin Dizine Engellemesini Nasil OnleOnemli Sayfalarim Neden Dizine Eklenmiyor Robotstxt Dosyami Nasil KontOnemli Sayfalarim Neden Dizine Eklenmiyor Robotstxt Dosyami Nasil Kont