<rmcreative>

RSS

Все заметки с тегами «cpu, load»

Можно уточнить:

    (1)
  1. AhrefsBot и другие прожорливые поисковые боты

    17 августа 2020

    Нагрузку на сайт нередко делают не посетители, а разные поисковые боты. Когда-то проблемы были даже от робота Google, но сейчас он научился снижать аппетиты при появлении ошибок или существенном повышении времени ответа. Яндекс тоже поумерил аппетиты и настраивается через Вебмастер.

    Но "голодные" боты ещё остались. Один из таких - AhrefsBot. На наше счастье, многие боты, которые сами не умеют регулировать свой аппетит, подчиняются robots.txt в корне сайта, директиве Crawl-Delay. Она выставляет задержку между парсингом следующей страницы в секундах. Одной секунды для многих проектов вполне достаточно (86400 страниц). Если мало - можно использовать дробные значения.

    User-agent: *
    Crawl-Delay: 1
    

    UPD: для особо непослушных ботов можно и пожёстче через Nginx.

    Создаём в /etc/nginx конфиг block-bots.conf:

    if ($http_user_agent ~* SemrushBot|MJ12bot|AhrefsBot|DotBot|PetalBot|LinkpadBot|SputnikBot|statdom.ru|MegaIndex.ru|WebDataStats|Jooblebot|BackupLand|NetcraftSurveyAgent|openstat.ru) {
        return 444;
    }
    

    И подключаем в каждый блок server каждого конфига:

    server {
        include block-bots.conf;
    
    6 комментариев

rokokbet

situs toto

situs toto

rokokbet

situs toto

rokokbet

situs toto

situs toto

situs toto

situs toto

situs toto

rokokbet

rokokbet

toto slot

rokokbet

situs toto

rokokbet

rokokbet

rokokbet

rokokbet

situs toto

situs toto

situs toto

situs toto

situs toto

situs toto

situs toto

situs toto

situs toto

situs toto

situs toto

slot gacor

situs toto

situs toto

situs toto slot gacor Slot Thailand Slot777 Slot Gacor Pg Soft Slot Gacor Slot88 Slot Online Terlengkap slot gacor Slot777 Deposit Via Dana slot online Slot Gacor Bet 100