Το Burst αντιμετωπίζει σε καθημερινή βάση ένα από τα πιο επαναλαμβανόμενα τεχνικά προβλήματα των ελληνικών eshop: η faceted navigation — δηλαδή τα φίλτρα κατηγορίας (χρώμα, μέγεθος, τιμή, brand) — δημιουργεί εκατοντάδες ή χιλιάδες URL τα οποία ο Googlebot καταναλώνει ασκόπως, αφήνοντας τις πραγματικά σημαντικές σελίδες να ανανεώνονται αργά ή να μην αντικατοπτρίζονται σωστά στα αποτελέσματα αναζήτησης. Αν έχετε eshop με φίλτρα και παρατηρείτε ότι νέες σελίδες παίρνουν εβδομάδες για να εμφανιστούν στη Google, η faceted navigation είναι το πρώτο πράγμα που πρέπει να ελέγξετε.
Το πρόβλημα δεν είναι η ύπαρξη των φίλτρων καθεαυτή — τα φίλτρα είναι απαραίτητα για τον χρήστη. Το πρόβλημα είναι η crawlable URL explosion: κάθε συνδυασμός φίλτρου παράγει ένα ξεχωριστό URL που ο crawler μπορεί να ακολουθήσει, και έτσι ένα eshop με 10 κατηγορίες × 5 χρώματα × 8 μεγέθη × 4 εύρη τιμών μπορεί να παράγει θεωρητικά 10 × 5 × 8 × 4 = 1.600 URL ανά κατηγορία επιπέδου — και αν έχετε 50 κατηγορίες, φτάνετε σε 80.000 URL μόνο από φίλτρα. Αυτός ο αριθμός εξαντλεί το crawl budget και αποτρέπει τον Googlebot από το να δει τις πραγματικές σελίδες προϊόντων που θέλετε να κατατάξετε.
Τι είναι το crawl budget και γιατί έχει σημασία για eshop
Το crawl budget είναι ο αριθμός των σελίδων που ο Googlebot θα επισκεφτεί στον ιστότοπό σας σε μια δεδομένη χρονική περίοδο. Δεν είναι μια αυστηρά καθορισμένη τιμή — εξαρτάται από δύο παράγοντες: την crawl rate (πόσο γρήγορα ο Googlebot μπορεί να crawl χωρίς να υπερφορτώσει τον server σας) και την crawl demand (πόσο σημαντικές κρίνει η Google ότι είναι οι σελίδες σας).
Για ένα eshop μεσαίου μεγέθους με 5.000–20.000 προϊόντα, το crawl budget είναι ιδιαίτερα πολύτιμο. Αν ο Googlebot ξοδεύει το 60% του budget σε URL τύπου /category?color=κόκκινο&size=L&sort=price_asc που δεν έχουν καμία SEO αξία, αυτό σημαίνει ότι ανανεώνει τα πραγματικά σας προϊόντα σπανιότερα. Νέες κυκλοφορίες, αλλαγές τιμών, τροποποιήσεις περιεχομένου — όλα αυτά φτάνουν πιο αργά στον δείκτη. Η Burst αντιμετωπίζει αυτό ως crawl efficiency πρόβλημα, όχι απλώς ως τεχνική ρύθμιση.
Οι τέσσερις κατηγορίες URL που παράγει η faceted navigation
Για να σχεδιαστεί σωστά μια στρατηγική crawl control, πρέπει πρώτα να κατανοηθεί τι είδους URL παράγει η faceted navigation. Η Burst κατηγοριοποιεί τα faceted URL σε τέσσερις ομάδες με βάση την SEO αξία τους:
- Αξιόλογα, indexable URL: Φίλτρα που έχουν πραγματική αναζητητική ζήτηση, π.χ.
/παπούτσια/νάικ/ή/φορέματα/καλοκαιρινά/. Αυτά πρέπει να είναι crawlable και indexable. - Χαμηλής αξίας, non-indexable URL: Συνδυασμοί φίλτρων (π.χ. χρώμα + μέγεθος + τιμή) χωρίς αναζητητική ζήτηση. Πρέπει να αποκλείονται από τον δείκτη αλλά επιτρέπουν το crawling για UX.
- Διπλότυπα URL: Αντικείμενα που παράγουν ίδιο περιεχόμενο με διαφορετικό URL (π.χ. sort=asc vs sort=desc). Πρέπει canonical ή noindex.
- Άχρηστα, block-worthy URL: Φίλτρα που δεν πρέπει ούτε να crawl έπεται ούτε να index, π.χ. session IDs, παράμετροι tracking. Αποκλείονται από robots.txt ή Disallow.
Canonical tags: η πρώτη γραμμή άμυνας
Η χρήση του <link rel="canonical"> είναι η πιο ευρέως χρησιμοποιούμενη μέθοδος για τη διαχείριση faceted URL. Όταν κάποιος επισκέπτης ή crawler φτάνει σε ένα filtered URL όπως /γυναικεία-παπούτσια/?color=κόκκινο&size=39, το canonical tag λέει στη Google: «η αυθεντική έκδοση αυτής της σελίδας είναι η /γυναικεία-παπούτσια/». Το αποτέλεσμα είναι ότι η Google εκχωρεί το link juice και τη σχετικότητα στην κύρια σελίδα, όχι στο filtered URL.
Πρακτική εφαρμογή canonical για eshop:
- Για μονά φίλτρα (π.χ. μόνο χρώμα): αξιολογήστε αν έχουν αναζητητικό όγκο. Αν ναι, αφήστε canonical να δείχνει στον εαυτό τους (self-referential canonical) και κρατήστε τα indexable.
- Για διπλά ή τριπλά φίλτρα: βάλτε canonical που δείχνει πάντα στην κύρια κατηγορία-γονέα.
- Για παραμέτρους ταξινόμησης (sort, order): βάλτε πάντα canonical στο URL χωρίς παράμετρο sort.
- Βεβαιωθείτε ότι το CMS σας (WooCommerce, Magento, Shopify) δεν αντικαθιστά τα custom canonicals με αυτόματα — αυτό είναι κοινός παγίδα που ο SEO audit ιστοσελίδας αποκαλύπτει συχνά.
Noindex vs Canonical: πότε να χρησιμοποιείτε το ένα ή το άλλο
Πολλοί διαχειριστές eshop μπερδεύουν canonical και noindex, ή τα χρησιμοποιούν ταυτόχρονα (λάθος). Η Burst ακολουθεί έναν σαφή κανόνα:
Canonical χρησιμοποιείτε όταν θέλετε να πείτε στη Google «αυτό το URL υπάρχει, αλλά χρέωσε τη σχετικότητα αλλού». Ο crawler επισκέπτεται το URL, δεν το indexάρει ως ξεχωριστή σελίδα, και κατανοεί τη δομή σας.
Noindex (μέσω <meta name="robots" content="noindex">) χρησιμοποιείτε όταν θέλετε ρητά να αποκλείσετε μια σελίδα από τον δείκτη, ανεξάρτητα από canonical. Αυτό λειτουργεί καλύτερα για πολύ specific filtered pages που δεν θέλετε ποτέ να εμφανιστούν.
Η παγίδα: αν βάλετε noindex σε μια σελίδα ΚΑΙ canonical σε άλλη, η Google αγνοεί το canonical αν το noindex είναι παρόν. Επιλέξτε ένα από τα δύο. Επίσης, το noindex μόνο δεν εμποδίζει το crawling — ο Googlebot εξακολουθεί να επισκέπτεται noindexed σελίδες.
Robots.txt Disallow: το βαρύ εργαλείο για URL explosion
Όταν ο όγκος των faceted URL είναι τεράστιος (π.χ. πάνω από 100.000 URL ανά κατηγορία), ούτε canonicals ούτε noindex αρκούν για crawl control — γιατί ο Googlebot εξακολουθεί να τα επισκέπτεται. Το μόνο που αποτρέπει πλήρως το crawling είναι το robots.txt Disallow.
Στρατηγική Disallow για faceted URL:
- Αν τα φίλτρα υλοποιούνται ως query parameters (
?color=,?size=): χρησιμοποιήστεDisallow: /*?*color=ή παρόμοιες ρυθμίσεις. Ωστόσο η Google Search Console θεωρεί αυτό legacy — η Google είναι καλύτερη στο να κατανοεί parameters αν χρησιμοποιείτε canonical. - Αν τα φίλτρα υλοποιούνται ως path segments (
/color-red/size-39/): προσέξτε να μην κάνετε Disallow σε ολόκληρα paths που μπορεί να περιέχουν σελίδες που θέλετε indexable. - Δοκιμάστε πάντα με το Google Search Console URL Inspection Tool πριν εφαρμόσετε Disallow σε production.
- Η σωστή παραμετροποίηση του robots.txt & sitemap είναι κρίσιμη — ένα λάθος εδώ μπορεί να αποκλείσει εντελώς κατηγορίες προϊόντων από τον δείκτη.
URL parameters στη Google Search Console: η παλιά μέθοδος που ακόμα λειτουργεί
Η Google Search Console παρέχε για χρόνια το εργαλείο «URL Parameters» (στο παλιό interface), αλλά σε νέο Search Console αυτό έχει αφαιρεθεί — η Google λέει ότι ο Googlebot πλέον κατανοεί τις παραμέτρους καλύτερα χωρίς χειροκίνητη ρύθμιση. Αυτό δεν σημαίνει ότι πρέπει να αγνοήσετε το πρόβλημα — απλώς ο έλεγχος γίνεται πλέον αποκλειστικά με canonical, noindex, και robots.txt, συνδυαστικά.
Παρόλα αυτά, αν χρησιμοποιείτε παλαιότερη έκδοση Search Console ή έχετε access σε legacy settings, η ρύθμιση «Does not affect page content» σε παραμέτρους ταξινόμησης εξακολουθεί να δίνει σήμα στη Google ότι αυτές οι παράμετροι δεν παράγουν unique περιεχόμενο.
Sitemap XML: ο οδηγός του Googlebot για τις σελίδες που θέλετε
Ακόμα και αν έχετε εφαρμόσει canonical και robots.txt, η Google μπορεί να ανακαλύψει faceted URL μέσω internal links. Η λύση είναι να χρησιμοποιήσετε το sitemap XML ως θετικό σήμα: συμπεριλάβετε μόνο τα URL που θέλετε indexable, και μην συμπεριλαμβάνετε κανένα filtered URL.
Πρακτικά σημεία για sitemap σε eshop με faceted navigation:
- Μην συμπεριλαμβάνετε URL με query parameters στο sitemap (εκτός από φίλτρα που θέλετε ρητά να index).
- Χρησιμοποιήστε
<priority>και<changefreq>για να δώσετε σήμα στον Googlebot — οι σελίδες προϊόντων συνήθωςchangefreq=weekly, οι κατηγορίεςdaily. - Δημιουργήστε χωριστά sitemap αρχεία (sitemap index) για κατηγορίες, προϊόντα, και static σελίδες — διευκολύνει τον Googlebot να κατανοεί την ιεραρχία.
- Βεβαιωθείτε ότι κανένα blocked (robots.txt Disallow) URL δεν εμφανίζεται στο sitemap — αυτό δίνει αντικρουόμενα σήματα και μπερδεύει τον crawler.
Internal linking και faceted navigation: πώς να μην τροφοδοτείτε τον crawler με garbage URLs
Ένα σύνηθες λάθος είναι να έχετε ρυθμίσει canonical και noindex σωστά, αλλά παράλληλα να υπάρχουν εκατοντάδες internal links στα faceted URL — από breadcrumbs, pagination, ή widgets «πρόσφατα φίλτρα». Η Google ακολουθεί αυτά τα links και ξοδεύει budget, ακόμα κι αν τα URL είναι canonicalized.
Λύσεις για internal link hygiene:
- Βεβαιωθείτε ότι τα «active filter» links (breadcrumbs ενεργού φίλτρου) είναι
ή ιδανικά αφαιρούνται εντελώς ως anchor links. - Τα pagination links (
?page=2,?page=3) πρέπει να υλοποιούνται με<link rel="next">και<link rel="prev">— αν και η Google επίσημα έχει αποσύρει την υποστήριξη, εξακολουθεί να τα χρησιμοποιεί ως hint. - Αφαιρέστε τα «sort by» navigation links που παράγουν crawlable sort URLs. Χρησιμοποιήστε JavaScript-only sorting που δεν αλλάζει το URL.
WooCommerce: ειδικές ρυθμίσεις crawl control για το πιο δημοφιλές ελληνικό eshop CMS
Το WooCommerce παράγει από μόνο του αρκετά faceted URL μέσω των built-in product attribute pages. Η Burst εφαρμόζει τις εξής ρυθμίσεις σε WooCommerce sites:
Πρώτα, στο Rank Math ή Yoast: θέστε ως noindex όλες τις Product attribute pages (π.χ. /product-tag/, /pa_color/, /pa_size/) εκτός αν έχουν αξιόλογο αναζητητικό όγκο. Δεύτερο, απενεργοποιήστε τα built-in WooCommerce layered navigation URLs αν χρησιμοποιείτε custom AJAX φίλτρα. Τρίτο, στο robots.txt προσθέστε Disallow για /?add-to-cart=, /?removed_item= και άλλες WooCommerce-specific παραμέτρους που παράγει αυτόματα το σύστημα.
Ο σωστός digital marketing σχεδιασμός για eshop ξεκινά από την τεχνική αρχιτεκτονική — και το crawl control είναι κεντρικό στοιχείο αυτής της αρχιτεκτονικής, όχι ένα afterthought.
Η στρατηγική της «crawl path hierarchy»: τι indexάρετε και τι αποκλείετε
Η Burst υιοθετεί μια ιεραρχική προσέγγιση για τον αποφασισμό ποια faceted URL αξίζουν indexing. Το ερώτημα που απαντάται για κάθε τύπο URL είναι: «Αν κάποιος αναζητήσει αυτόν τον συνδυασμό στη Google, θα έβρισκε αρκετά αποτελέσματα για να δείξει αξία;»
Ιεραρχία απόφασης crawl control:
- Επίπεδο 1 — indexable: Μονά φίλτρα brand ή τύπου με αναζητητικό όγκο > 100 monthly searches. Παράδειγμα:
/αθλητικά-παπούτσια/nike/ - Επίπεδο 2 — canonical, crawlable: Μονά φίλτρα με χαμηλό αλλά υπαρκτό όγκο. Canonical στην κύρια κατηγορία.
- Επίπεδο 3 — noindex: Διπλά φίλτρα (brand + χρώμα) χωρίς αναζητητικό όγκο. Δεν αξίζουν index, αλλά επιτρέπουν crawl για UX.
- Επίπεδο 4 — robots.txt Disallow: Τριπλά+ φίλτρα ή παράμετροι sorting. Αποκλείονται από crawl εντελώς.
Core Web Vitals και faceted navigation: η σχέση που αγνοείται
Η faceted navigation δεν επηρεάζει μόνο το crawl budget αλλά και τα Core Web Vitals — ειδικά το LCP (Largest Contentful Paint) και το CLS (Cumulative Layout Shift). Όταν ο χρήστης εφαρμόζει φίλτρα και η σελίδα φορτώνει νέα αποτελέσματα, το layout μπορεί να μετατοπίζεται αν τα images ή τα product cards δεν έχουν ορισμένες διαστάσεις.
Το ταχύτητα ιστοσελίδας είναι ένα ranking factor που επηρεάζεται άμεσα από την υλοποίηση των φίλτρων: AJAX-based filtering (χωρίς full page reload) μειώνει δραματικά το LCP για τον χρήστη, αλλά απαιτεί προσοχή ώστε τα νέα URLs που παράγονται (ή δεν παράγονται) να αντιμετωπίζονται σωστά από SEO άποψη.
Πότε να επιτρέψετε την indexing μιας faceted URL: checklist
Πριν αποφασίσετε να αφήσετε ένα faceted URL indexable, ελέγξτε:
- Υπάρχει αναζητητικός όγκος για αυτόν τον συνδυασμό; (Ελέγξτε Google Keyword Planner ή Search Console queries.)
- Έχει η σελίδα τουλάχιστον 10-15 μοναδικά προϊόντα; (Λιγότερα δημιουργούν thin content.)
- Είναι το περιεχόμενο διαφορετικό από άλλες κατηγορίες; (Έλεγχος duplicate content.)
- Έχει η σελίδα ξεχωριστό title, H1 και meta description; (Αυτόματη δημιουργία από φίλτρα δεν αρκεί.)
- Θα σταθεί η σελίδα αξιόλογη μέσα στο επόμενο χρόνο; (Αν είναι sezonική, εξετάστε noindex off-season.)
Hosting και server response time: πώς επηρεάζουν το crawl budget
Ένας παράγοντας που συχνά αγνοείται: ο Googlebot ρυθμίζει το crawl rate ανάλογα με την ταχύτητα απόκρισης του server. Αν ο server σας επιστρέφει σελίδες σε 3-5 δευτερόλεπτα, ο Googlebot crawl λιγότερες σελίδες ανά ημέρα — και αυτό σε eshop με faceted navigation σημαίνει ακόμα μεγαλύτερο πρόβλημα. Ένα αξιόπιστο web hosting με γρήγορο server response time (κάτω από 200ms TTFB) επιτρέπει στον Googlebot να crawl περισσότερες σημαντικές σελίδες ανά ημέρα, βελτιστοποιώντας έμμεσα το crawl budget χωρίς να χρειαστεί να πειράξετε κανένα technical SEO setting.
Log file analysis: δείτε τι κάνει πραγματικά ο Googlebot
Η πιο ακριβής μέθοδος για να κατανοήσετε πώς ο Googlebot χρησιμοποιεί το crawl budget σας είναι η ανάλυση των server logs. Στα access logs φαίνεται:
- Ποια URL επισκέπτεται ο Googlebot πιο συχνά.
- Ποια faceted URL ακολουθεί παρά τα robots.txt Disallow (λάθος configuration).
- Ποιες σελίδες σπάνια ή ποτέ δεν επισκέπτεται (πιθανώς orphan pages ή pages με κακή internal linking).
- Η κατανομή του crawl ανά τύπο σελίδας (homepage, categories, products, filtered).
Εργαλεία log analysis: Screaming Frog Log File Analyser, JetOctopus, Botify (enterprise). Ακόμα και ένα απλό Excel pivot table πάνω στα access logs μπορεί να αποκαλύψει patterns που το Search Console δεν δείχνει.
Ολοκληρωμένη στρατηγική crawl control: βήμα προς βήμα
Η Burst ακολουθεί μια συγκεκριμένη σειρά βημάτων όταν αντιμετωπίζει faceted navigation crawl budget πρόβλημα σε eshop:
- Βήμα 1 — Audit: Log file analysis + Search Console Crawl Stats για να χαρτογραφηθεί το τρέχον crawl pattern.
- Βήμα 2 — Κατηγοριοποίηση URL: Δημιουργία πίνακα με όλους τους τύπους faceted URL και κατηγοριοποίησή τους στα 4 επίπεδα.
- Βήμα 3 — Canonical: Εφαρμογή canonical σε Level 2 και Level 3 URLs.
- Βήμα 4 — Noindex: Εφαρμογή noindex σε Level 3 URLs που δεν θέλετε index αλλά επιτρέπουν crawl.
- Βήμα 5 — Robots.txt: Disallow για Level 4 URLs (sorting, pagination πολλαπλών φίλτρων).
- Βήμα 6 — Sitemap cleanup: Αφαίρεση όλων των filtered URLs από το sitemap.
- Βήμα 7 — Internal link audit: Αφαίρεση ή nofollow σε internal links που δείχνουν σε Level 3-4 URLs.
- Βήμα 8 — Μέτρηση: Παρακολούθηση Crawl Stats για 4-6 εβδομάδες για επαλήθευση αποτελεσμάτων.
Το λάθος που κάνει ο αλγόριθμος να τιμωρεί: ταυτόχρονα crawlable και νέα μοναδικά φίλτρα
Ένα λεπτό αλλά σοβαρό πρόβλημα: αν το eshop σας δημιουργεί συνεχώς νέα faceted URL (π.χ. κάθε νέο προϊόν προσθέτει νέες ετικέτες που παράγουν νέα attribute URLs) χωρίς να έχετε crawl control, η Google αντιλαμβάνεται ότι ο ιστότοπός σας «επεκτείνεται» με χαμηλής ποιότητας σελίδες. Αυτό δεν οδηγεί σε κάποιο Google penalty, αλλά μειώνει σταδιακά το crawl demand — ο Googlebot επισκέπτεται λιγότερο συχνά, κρίνοντας ότι το νέο περιεχόμενο δεν αξίζει ταχεία ανανέωση. Μακροπρόθεσμα, αυτό βλάπτει τη φρεσκάδα του index.
Συμπέρασμα
Η διαχείριση faceted navigation σε eshop δεν είναι μια εφάπαξ ρύθμιση — είναι ένα συνεχές project που απαιτεί monitoring, testing, και προσαρμογή καθώς ο κατάλογος αλλάζει. Η Burst αντιμετωπίζει το crawl control ως θεμέλιο κάθε eshop SEO στρατηγικής: χωρίς σωστό crawl control, κανένα άλλο SEO effort — παραγωγή περιεχομένου, link building, meta optimization — δεν μπορεί να αποδώσει στο μέγιστο δυνατό. Ξεκινήστε με log file analysis, κατηγοριοποιήστε τα faceted URL σας, και εφαρμόστε canonical + robots.txt + sitemap cleanup ως ολοκληρωμένο πακέτο — όχι μεμονωμένα.
Συχνές Ερωτήσεις
Τι είναι η faceted navigation και γιατί δημιουργεί SEO πρόβλημα;
Η faceted navigation είναι το σύστημα φίλτρων σε eshop (χρώμα, μέγεθος, τιμή, brand). Κάθε συνδυασμός φίλτρου παράγει ένα ξεχωριστό URL, με αποτέλεσμα ο Googlebot να «χάνει» το crawl budget σε χιλιάδες άχρηστες σελίδες αντί να crawl τα πραγματικά προϊόντα και κατηγορίες. Η Burst αντιμετωπίζει αυτό με στρατηγική canonical + noindex + robots.txt Disallow.
Ποια είναι η διαφορά μεταξύ canonical και noindex για faceted URLs;
Το canonical λέει «υπάρχω, αλλά μέτρησε τη σχετικότητα αλλού» — ο Googlebot εξακολουθεί να crawl το URL. Το noindex λέει «μην με βάλεις στον δείκτη» — αλλά και πάλι επιτρέπει το crawling. Για να σταματήσετε τελείως το crawling, χρειάζεστε robots.txt Disallow. Ποτέ μην χρησιμοποιείτε canonical και noindex ταυτόχρονα στο ίδιο URL.
Πόσο χρόνο χρειάζεται για να δω βελτίωση μετά τη ρύθμιση crawl control;
Τα αποτελέσματα φαίνονται σταδιακά. Ο Googlebot χρειάζεται συνήθως 4-8 εβδομάδες για να «μάθει» τις νέες ρυθμίσεις και να ανακατανείμει το crawl budget. Η Burst παρακολουθεί το Crawl Stats report στη Search Console εβδομαδιαίως κατά την πρώτη φάση μετά από αλλαγές.
Πρέπει να εφαρμόσω crawl control ακόμα και αν ο ιστότοπός μου έχει μόνο 500 προϊόντα;
Για eshop με λιγότερα από 1.000 προϊόντα, το πρόβλημα crawl budget είναι λιγότερο έντονο αλλά υπαρκτό. Η βασική ρύθμιση (canonical για φίλτρα, noindex για sorting URLs, καθαρό sitemap) αξίζει τον κόπο ακόμα και σε μικρά eshop — ειδικά αν σκοπεύετε να μεγαλώσετε τον κατάλογο.
Μπορεί η faceted navigation να βοηθήσει και το SEO αντί να το βλάπτει;
Ναι, αν αντιμετωπιστεί στρατηγικά. Φίλτρα με αναζητητικό όγκο (π.χ. brand-specific category pages) αξίζουν indexing και μπορούν να φέρουν long-tail traffic. Το κλειδί είναι να επιλέξετε ποια faceted URLs θέλετε indexable και να τα εξοπλίσετε με σωστό title, H1, meta description, και επαρκή αριθμό προϊόντων — όχι να τα αφήνετε να δημιουργούνται αυτόματα χωρίς SEO σχεδιασμό.
