Robots.txt dosyası nedir?

Robots.txt dosyası, arama motoru botlarına (Googlebot gibi) sitenizdeki hangi sayfaları veya dosyaları tarayabileceklerini ya da tarayamayacaklarını söyler. Temel amacı sitenizi gereksiz isteklerle (request) aşırı yüklenmekten korumaktır.

Yapay zeka (AI) botlarının sitemi kazımasını (scrape) nasıl engellerim?

ChatGPT'nin GPTBot'u veya Common Crawl'un CCBot'u gibi yapay zeka botlarını, robots.txt dosyanızda User-agent'larını hedefleyen özel 'Disallow' (Engelle) kuralları ekleyerek engelleyebilirsiniz. Aracımızda bunu sizin için tek tıkla yapan bir şablon bulunmaktadır.

Ücretsiz Robots.txt Oluşturucu | Yapay Zeka Botlarını Engelle

Modern SEO İçin Nihai Robots.txt Rehberi

Bir robots.txt dosyası aslında web sitenizin "kapı görevlisidir". Bir arama motoru botu (örneğin Googlebot) alan adınıza geldiğinde, aradığı ilk dosya siteniz.com/robots.txt dosyasıdır. Bu düz metin dosyası, bota hangi dizinleri taramasına izin verildiğini ve hangi özel alanları (yönetici paneli vb.) görmezden gelmesi gerektiğini söyler.

Yapay Zeka Tehdidi (AI Scraping)

Son yıllarda, OpenAI'nin GPTBot'u ve Common Crawl'un CCBot'u gibi devasa yapay zeka botları, dil modellerini eğitmek için içerik üreticilerine hiçbir kredi veya trafik (hit) vermeden web sitelerini acımasızca kazımaktadır (scrape). Bu botlar için özel "Disallow" yönergeleri eklemek, fikri mülkiyetinizi korur.

Site Haritası Yönergesi

Robots.txt dosyanızın en altına her zaman XML Site Haritası URL'nizi ekleyin. Bu, Google ve Bing için doğrudan bir yol haritası görevi görerek yeni makalelerinizi ve ürünlerinizi standart bağlantı taramasından çok daha hızlı keşfetmelerine yardımcı olur.

"Disallow" sayfanın dizine eklenmeyeceği anlamına mı gelir?

Bu SEO dünyasında bilinen en yaygın yanlışlardan biridir. Disallow botun sayfayı taramasını engeller, ancak başka bir site o sayfaya link verirse Google URL'yi yine de dizine ekleyebilir (genellikle arama sonuçlarında "Bu sayfa için bilgi mevcut değil" uyarısı göstererek). Bir sayfayı Google'dan tamamen gizlemek istiyorsanız, sayfanın kendi kodlarına noindex meta etiketi eklemelisiniz.

Sıkça Sorulan Sorular

Robots.txt dosyasını nereye koymalıyım?

Web sitenizin kök (root) dizinine, yani ana klasörüne yerleştirilmelidir. Örneğin, alan adınız www.ornek.com ise, dosyaya tam olarak www.ornek.com/robots.txt adresinden erişilebilmelidir.

User-agent: * ne anlama gelir?

Yıldız işareti (*) bir joker (wildcard) karakterdir. Dosyada daha sonra daha spesifik bir User-agent (örneğin Googlebot) kuralı tanımlanmadığı sürece, kendisini takip eden kuralların küresel olarak tüm botlar (Google, Bing, Yahoo vb.) için geçerli olduğu anlamına gelir.

/wp-admin/ dizinini engellemeli miyim?

Evet. WordPress kullanıyorsanız, arama motorlarının giriş (login) sayfanıza veya arka plan dosyalarına erişmeye çalışarak tarama bütçelerini (crawl budget) boşa harcamamaları için /wp-admin/ klasörünü engellemeniz şiddetle tavsiye edilir.

Oluşturduğum dosyayı test edebilir miyim?

Evet! Kurallarınızın doğru çalıştığını ve önemli sayfaları (örneğin CSS veya JS dosyalarınızı) yanlışlıkla engellemediğini doğrulamak için Google Search Console (GSC) içindeki "Robots.txt Test Aracı"nı kullanabilirsiniz.

Gelişmiş Robots.txt Oluşturucu

Özel Dizin Kuralları