
Yeni kurulan bir web sitesi için temel robots.txt dosyasını adım adım doğru şekilde nasıl oluştururum?
Yeni bir web sitesi kurmak heyecan verici bir süreçtir, ancak başarısı için teknik detaylara dikkat etmek büyük önem taşır. Bu detaylardan biri de
robots.txt dosyasıdır. Bir SEO editörü olarak, bu küçük ama güçlü dosyanın sitenizin arama motorları tarafından nasıl algılandığı, taranması ve dizine eklenmesi üzerindeki kritik etkilerini çok iyi biliyorum. Özellikle de gelecekte
Google AdSense gibi platformlardan gelir elde etmeyi hedefliyorsanız, doğru bir `robots.txt` yapılandırması sadece bir öneri değil, bir zorunluluktur. Bu makalede, yeni kurulan bir web sitesi için temel `robots.txt` dosyasını adım adım doğru şekilde nasıl oluşturacağınızı ve yönetiminizi kolaylaştıracak 'Robots Txt Retici' gibi araçların temelini nasıl anlayacağınızı inceleyeceğiz.
Robots.txt Nedir ve Yeni Siteler İçin Neden Hayatidir?
`robots.txt` dosyası, web sitenizin kök dizininde yer alan basit bir metin dosyasıdır. Bu dosya,
arama motoru botlarına (örneğin Googlebot, Bingbot) sitenizin hangi bölümlerini tarayabileceklerini ve hangilerini tarayamayacaklarını bildirir. Kısacası, bir trafik polisi gibi çalışarak botların sitenizdeki dolaşımını yönlendirir.
Yeni bir web sitesi için bu dosyanın önemi birkaç kat daha artar:
1.
Crawl Bütçesi Yönetimi: Arama motorlarının sitenizi taramak için ayırdığı sınırlı bir "crawl bütçesi" vardır. Özellikle yeni ve henüz çok sayıda sayfaya sahip olmayan sitelerde bu bütçe daha da kısıtlı olabilir. `robots.txt` ile botları, önemsiz (yönetim paneli, geçici dosyalar, tekrarlayan içerikler vb.) alanlara yönlendirmek yerine, değerli içeriklerinize odaklanmalarını sağlayarak
web sitesi taramasını optimize edersiniz. Bu, sitenizin önemli sayfalarının daha hızlı dizine eklenmesine yardımcı olur.
2.
Gizlilik ve Güvenlik (Yanlış Anlama): `robots.txt` bir güvenlik mekanizması değildir. Sadece botlara bir yönerge verir, ancak kötü niyetli botlar veya doğrudan URL'ye erişim engellemez. Yine de, hassas olabilecek yönetim paneli URL'lerinin arama sonuçlarında görünmesini engellemek için kullanılabilir.
3.
Dizinleme Kalitesi: Botları, sitenizin arama sonuçlarında görünmesini istemediğiniz veya düşük kaliteli içerik barındıran sayfaları taramasını engelleyerek genel
dizinleme (indexing) kalitesini artırırsınız. Bu, kullanıcıların sadece en alakalı ve değerli içeriklerinize ulaşmasını sağlar.
4.
AdSense Uyumu: Gelecekte sitenizde
Google AdSense reklamları göstermeyi planlıyorsanız, sitenizin düzgün bir şekilde taranabilir ve dizine eklenebilir olması kritik öneme sahiptir. AdSense, reklamların gösterileceği sayfanın içeriğini anlayabilmek için Googlebot'un bu sayfayı tarayabilmesini ister. Yanlış yapılandırılmış bir `robots.txt` dosyası, değerli içeriklerinizi botlardan gizleyerek reklam gösterimini veya onay sürecini olumsuz etkileyebilir.
Temel Robots.txt Dosyasını Adım Adım Oluşturma
Şimdi, yeni kurulan bir web sitesi için sağlam bir temel oluşturacak `robots.txt` dosyasını nasıl adım adım oluşturacağımıza geçelim.
Adım 1: Bir Metin Düzenleyici Açın
`robots.txt` dosyasını oluşturmak için Not Defteri (Windows), TextEdit (macOS) veya Sublime Text, VS Code gibi herhangi bir düz metin düzenleyiciyi kullanabilirsiniz. Word gibi kelime işlemcilerden kaçının, çünkü bunlar metne biçimlendirme ekleyerek dosyanın okunmaz hale gelmesine neden olabilir.
Adım 2: Tüm Botlara Genel Erişim İzni Verin
Çoğu yeni web sitesi için başlangıçta tüm arama motoru botlarına sitenin geneline erişim izni vermek istersiniz. Bu, sitenizin hızlıca dizine eklenmesini sağlar. Bu kuralı eklemek için şu satırları yazın:
```
User-agent: *
Disallow:
```
* `User-agent: *`: Bu, "tüm kullanıcı aracılarına" yani tüm arama motoru botlarına hitap ettiğiniz anlamına gelir.
* `Disallow:`: Boş bırakılan `Disallow` direktifi, belirli bir dizini veya dosyayı engellemediğiniz, yani her şeyi taramalarına izin verdiğiniz anlamına gelir.
Bu iki satır, yeni bir site için en temel ve genellikle en iyi başlangıç noktasıdır.
Adım 3: Gereksiz Alanları Engellemek İçin Disallow Kuralları Ekleyin
Ancak, bazı sayfaların veya dizinlerin arama motorları tarafından taranmasını ve dizine eklenmesini istemeyebilirsiniz. Bu genellikle yönetim panelleri, geçici test sayfaları, kullanıcıya özel profiller veya arama sonuçlarını boşa çıkaracak çok sayıda tekrarlayan içerik üreten alanlar olabilir.
İşte bazı yaygın engelleme örnekleri:
*
Yönetim Paneli:```
Disallow: /admin/
Disallow: /wp-admin/ (WordPress için)
Disallow: /panel/
```
Bu, sitenizin yönetim panelini (örneğin `/admin/` veya `/wp-admin/` gibi) botlardan gizler. Bu sayfalarda genellikle değerli içerik bulunmaz ve arama sonuçlarında görünmeleri istenmez.
*
Arama veya Filtreleme Sonuçları:```
Disallow: /search/
Disallow: /*?
```
`Disallow: /search/` arama sonuç sayfalarınızı engelleyebilir. `Disallow: /*?` ise genellikle dinamik parametrelerle (örneğin `?sayfa=2`) oluşan URL'leri engellemek için kullanılır. Ancak, bu kuralı dikkatli kullanmalısınız, çünkü bazı önemli dinamik içeriklerinizi de engelleyebilir.
*
Eklenti veya Tema Dosyaları:```
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
```
WordPress sitelerinde, eklenti ve tema dosyaları genellikle arama motorları için anlamlı içerik barındırmaz ve sitenizin
crawl bütçesini tüketebilir. Ancak, bazen CSS ve JS dosyalarını da içerdiği için bu kural dikkatli kullanılmalıdır; Google'ın sayfaları doğru render edebilmesi için bu dosyaları taraması gerekebilir. En iyi yaklaşım, bu dosyaların dizine eklenmesini engellemek, ancak taranmasına izin vermektir. Bu biraz daha gelişmiş bir konudur ve yeni siteler için başlangıçta bu kadar detaylı düşünmek zorunda değilsiniz.
Örnek bir temel `robots.txt` içeriği şu şekilde görünebilir:
```
User-agent: *
Disallow: /admin/
Disallow: /wp-admin/
Disallow: /cgi-bin/
Disallow: /temp/
Disallow: /search/
Disallow: /*? (Dikkatli kullanın)
```
Adım 4: Site Haritanızı (Sitemap) Belirtin
`robots.txt` dosyasının en önemli işlevlerinden biri de arama motorlarına
site haritası (Sitemap)nızın nerede olduğunu bildirmektir. Bir site haritası, arama motorlarının sitenizdeki tüm önemli sayfaları keşfetmesine yardımcı olan bir yol haritasıdır. Yeni bir site için özellikle önemlidir, çünkü henüz çok fazla dış bağlantıya sahip olmayabilir.
Sitemap adresinizi `robots.txt` dosyanıza eklemek için şu satırı kullanın:
```
Sitemap: https://www.websiteniz.com/sitemap.xml
```
`websiteniz.com` yerine kendi alan adınızı ve `/sitemap.xml` yerine de site haritanızın doğru yolunu yazmayı unutmayın. Eğer birden fazla site haritanız varsa, her birini ayrı bir satırda belirtebilirsiniz. Site haritası oluşturma hakkında daha fazla bilgi almak için "/makale.php?sayfa=sitemap-olusturma-rehberi" makalemizi ziyaret edebilirsiniz.
Adım 5: Dosyayı Kaydetme ve Yükleme
1.
Kaydetme: Metin düzenleyicinizde oluşturduğunuz içeriği `robots.txt` adıyla (küçük harfle ve `.txt` uzantısıyla) kaydedin.
2.
Yükleme: Bu dosyayı web sitenizin kök dizinine yüklemelisiniz. Kök dizin, sitenizin ana alan adıyla doğrudan erişilebilen yerdir. Yani, `https://www.websiteniz.com/robots.txt` adresinden erişilebilir olmalıdır. Genellikle FTP veya sitenizin kontrol panelindeki dosya yöneticisi (cPanel, Plesk vb.) aracılığıyla yüklenir.
Adım 6: Doğrulama ve Test Etme
Dosyayı yükledikten sonra, doğru çalıştığından emin olmanız gerekir:
1.
Tarayıcıda Kontrol: Web tarayıcınızdan `https://www.websiteniz.com/robots.txt` adresini ziyaret edin. Oluşturduğunuz içeriği görmelisiniz.
2.
Google Search Console Robots.txt Test Aracı: Google Search Console, sitenizin SEO performansını izlemek için güçlü bir araçtır. İçindeki Robots.txt Test Aracı ile dosyanızın Googlebot tarafından nasıl yorumlandığını görebilir, potansiyel hataları tespit edebilir ve belirli URL'lerin engellenip engellenmediğini test edebilirsiniz. Bu araç, özellikle karmaşık `robots.txt` dosyaları için hayati öneme sahiptir. Google Search Console kullanımı hakkında detaylı bilgi için "/makale.php?sayfa=google-search-console-kullanimi" sayfamızı ziyaret edebilirsiniz.
Sık Yapılan Hatalar ve Önemli Notlar
*
Güvenlik Aracı Değildir: `robots.txt` bir güvenlik mekanizması değildir. Engellediğiniz URL'lere doğrudan erişim hala mümkündür. Hassas verileri korumak için sunucu düzeyinde güvenlik veya parola koruması kullanmalısınız.
*
Çok Fazla Engelleme: Yeni bir site için her şeyi engellemek istemezsiniz. Yalnızca gerçekten taranmasını veya dizine eklenmesini istemediğiniz alanları engelleyin. Aşırı engelleme, sitenizin
dizinleme (indexing) oranını düşürebilir.
*
CSS/JS Engelleme: Google, sayfalarınızı doğru şekilde oluşturabilmek için CSS ve JavaScript dosyalarınıza erişebilmelidir. Bu dosyaları yanlışlıkla engellemek, Google'ın sitenizi yanlış anlamasına ve SEO sıralamanızın düşmesine neden olabilir. Temel bir `robots.txt` dosyasında bu tür dosyaları engellemekten kaçının.
*
AdSense Engellemeleri: Eğer sitenizin AdSense için onaylanmasını veya reklamların doğru gösterilmesini istiyorsanız, reklamların gösterileceği sayfaların `robots.txt` tarafından engellenmediğinden emin olun. Googlebot'un bu sayfaları taraması gereklidir.
Sonuç
`robots.txt` dosyası, yeni web sitenizin arama motorları dünyasına doğru bir başlangıç yapması için temel bir SEO aracıdır. Doğru bir şekilde yapılandırılmış bir
robots.txt dosyası,
arama motoru botlarının sitenizi verimli bir şekilde taramasına,
crawl bütçesini optimize etmesine ve değerli içeriğinizin arama sonuçlarında doğru şekilde yer almasına yardımcı olur. Bu da uzun vadede sitenizin SEO başarısı ve
Google AdSense gibi platformlardan elde edeceğiniz gelir için zemin hazırlar. Yukarıdaki adımları takip ederek, yeni siteniz için sağlam bir temel oluşturabilir ve dijital varlığınızın sağlıklı bir şekilde büyümesini sağlayabilirsiniz. Unutmayın, bu dosya dinamiktir; siteniz büyüdükçe ve geliştikçe düzenli olarak gözden geçirmeyi ve güncellemeyi ihmal etmeyin.
Yazar: Ezgi Avcı
Ben Ezgi Avcı, bir Dijital Pazarlama Uzmanı. Platformumuzda teknolojiyi herkes için anlaşılır kılmak, karmaşık konuları basitleştirerek okuyucularımızın günlük yaşamında pratik olarak kullanabileceği bilgiler sunmak, yeni beceriler kazandırmak, farkındalık oluşturmak ve teknoloji dünyasındaki gelişmeleri anlaşılır bir dille aktarmak amacıyla yazıyorum.