1. Ce este search-ul în ecommerce
Search-ul în ecommerce este funcția care primește un șir de text de la cumpărător, îl interpretează, caută în catalogul magazinului, ranchează produsele relevante și le afișează — toate în sub o secundă.
Nu e un widget cosmetic. Pentru cumpărătorii care folosesc search-ul (între 5% și 15% dintr-o sesiune medie de magazin online), e prima și uneori singura interacțiune cu catalogul. Cercetarea Baymard pe UX-ul de search ecommerce arată constant că aceștia convertesc de 2-3× mai mult decât utilizatorii care navighează doar prin categorii — pentru că au intenție explicită de cumpărare.
Iar partea dureroasă: când search-ul cedează, cumpărătorul nu reformulează. Pleacă. Pierderea nu apare în nicio metrică clasică (rata de conversie, AOV, durata sesiunii) — apare doar în log-urile de search, pe care majoritatea magazinelor nu le analizează niciodată.
2. Cum cedează un motor clasic
Motoarele de search native ale platformelor (OpenCart, Magento, WooCommerce default) folosesc full-text SQL — un fel de LIKE '%text%' peste numele și descrierea produselor. Cedează în trei situații care apar în fiecare zi.
- Sinonime regionale. Clientul scrie „ciubote", catalogul are „bocanci". Zero rezultate, zero vânzare.
- Greșeli de tastare. „aspirato" în loc de „aspirator". Zero rezultate.
- Forme gramaticale. „pantof damă" vs „pantofi damă". Zero rezultate.
Detaliat în articolul de ce căutarea clasică cedează în magazinele online, inclusiv cum măsori câte vânzări pierzi prin asta.
3. Anatomia unui motor relevant
Un motor de search relevant nu e un singur algoritm — e un pipeline de cinci layere care rulează în secvență la fiecare interogare.
- Tokenizare + stemming. Textul e tăiat în unități semnificative și redus la rădăcini („pantofi" → „pantof"). Pentru română necesită stemmer dedicat — engleza nu e suficientă.
- Sinonime. Dicționar configurabil de termeni echivalenți (regionali, brand, abrevieri).
- Typo tolerance. Editare distance ≤ 2 între query și termen din index, ponderat după probabilitate (literele apropiate pe tastatură contează mai mult).
- Ranking static. BM25 sau variantă — calculează relevanța text → document. Vezi Okapi BM25 pentru fundamentul matematic.
- Reranking comportamental. Re-ordonarea rezultatelor după semnalul real al cumpărătorilor — click-uri, adăugări în coș, conversii. Vezi secțiunea 6.
Algolia, Elasticsearch (cu plugin-uri ecommerce) și Lexis implementează toate cele cinci layere. Diferența e în default-urile de configurare și în cât de transparent vezi ce se întâmplă pe fiecare layer.
4. Cele 4 metrici de sănătate a search-ului
Înainte să optimizezi search-ul, măsoară-l. Patru metrici spun aproape totul. Pragurile de mai jos sunt benchmark-uri compilate din literatura publică ( Baymard, Nielsen Norman Group, Google Search Central) și din rapoartele anuale ale furnizorilor majori (Algolia State of Site Search, Klevu Ecommerce Search Report).
Metric 1 — Zero-result rate (rata căutărilor cu 0 rezultate)
- Definiție: procentul interogărilor care întorc 0 produse, raportat la totalul interogărilor în fereastra de timp.
- Praguri industrie:<5% sănătos, 5-10% zonă de îmbunătățire, >10% pâlnie spartă.
- Cauze tipice: sinonime regionale lipsă, typo-uri ne-tolerate, atribute populate inconsistent în catalog, brand-uri scrise diferit (cu/fără cratimă).
- Acțiune: exportă top 50 zero-result queries din ultima lună, găsește pattern-urile recurente, adaugă sinonime sau corectează catalogul.
Metric 2 — Click-through rate (CTR) pe rezultate
- Definiție:din căutările care întorc >0 rezultate, procentul în care utilizatorul a dat click pe cel puțin un produs.
- Praguri industrie:>40% excelent, 30-40% mediu, <30% problemă de relevanță. Baymard observă că rezultatele de pe poziția 1 primesc între 35% și 50% din click-urile totale — ceea ce face ranking-ul primelor 3 poziții cea mai importantă pârghie.
- Cauze tipice: ranking dominat de criterii neutre pentru cumpărător (alfabetic, data adăugării), lipsă reranking comportamental, imagini lipsă pe primele rezultate.
Metric 3 — Top căutări fără click (high-volume, low-engagement)
- Definiție:interogări cu volum mare în fereastra de timp, dar CTR < 10%.
- De ce contează: e singura metrică care îți spune unde concentrezi pierderi mari. O interogare cu 1.000 de căutări/lună și CTR 5% ascunde mai multe pierderi decât 50 de zero-result queries diferite.
- Acțiune: deschide top 10 din lista asta, rulează manual interogarea, vezi ce rezultate apar și pe ce poziție. De multe ori rezultatul corect e pe poziția 8-12 și ar trebui pe 1-3 — caz tipic de reranking lipsă.
Metric 4 — Conversie post-search
- Definiție: din sesiunile în care utilizatorul a folosit search-ul, procentul care ajung la check-out finalizat.
- Comparație: Baymard și Algolia raportează consistent că utilizatorii care folosesc search-ul convertesc de 2-3× mai mult decât cei care doar navighează prin categorii — pentru că au intenție explicită de cumpărare.
- Diagnostic:dacă raportul tău e <1.5×, search-ul nu transformă intenția în acțiune — fie rezultatele nu sunt relevante (vezi Metric 2), fie pâlnia post-search (PDP, coș, check-out) are altă problemă pe care search-ul o expune mai puternic.
Toate patru sunt vizibile by-default în dashboard-ul Lexis. Pentru Algolia ai nevoie de configurare explicită; pentru Elasticsearch trebuie să-ți construiești singur observabilitatea cu Kibana sau Grafana.
5. Cumpărătorul român scrie diferit
Cumpărătorul român are obiceiuri lingvistice care fac search-ul configurat pentru engleză să cedeze sistematic. Patru pattern-uri sunt dominante și fiecare are soluții cunoscute — descrise pe scurt mai jos, cu exemple concrete pe care le poți căuta în propriile log-uri.
Pattern 1 — Diacriticele lipsesc în input
Pe tastatura standard românească, diacriticele se scriu cu AltGr și mulți utilizatori, mai ales pe mobile, le omit complet. Catalogul magazinului folosește însă forma corectă (cu ă/â/î/ș/ț), pentru că așa au fost importate produsele.
Exemple frecvent observate (input → catalog):
papuci dama→papuci damătirbusoane→tirbușoaneaspirator masina→aspirator mașinăincalzitor apa→încălzitor apă
Soluție: normalizare bidirecțională — query-ul „papuci dama" match-uiește documentele „papuci damă" și viceversa. Fără ea, o parte semnificativă din trafic devine zero-result. Lexis aplică normalizarea by-default; pe Elasticsearch, configurezi prin asciifolding token filter.
Pattern 2 — Sinonime regionale & colocviale
România are dialecte regionale puternice. Catalogul folosește un singur termen oficial; cumpărătorii caută cu termenii pe care îi folosesc acasă. Câteva clustere observabile direct în log-urile oricărui magazin general:
- Încălțăminte iarnă:
cizme↔bocanci↔ghete↔ciubote(Moldova) ↔cizmulițe - Iluminat:
bec↔becuri↔led↔spot↔corp iluminat - Bagaje feminine:
geantă↔poșetă↔borsetă(categorii diferite în catalog, deseori confuzate de cumpărători) - Frigiderice:
frigider↔combină frigorifică↔side-by-side - Audio:
căști↔casti(fără diacritice) ↔headphones↔earbuds↔handsfree
Soluție: dicționar de sinonime, fie configurat manual, fie învățat semi-automat dintr-un corpus al log-urilor proprii. Ține minte că sinonimia nu e simetrică — „bocanc" implică „cizmă" pentru iarnă, dar nu invers (cizmele de vară nu sunt bocanci).
Pattern 3 — Forme gramaticale româneşti
Româna are mai multe forme flexionare per cuvânt decât engleza: masculin/feminin, singular/plural, articulat/nearticulat, cazuri (nominativ, genitiv, dativ, acuzativ). Stemming-ul configurat pe engleză le ratează pe toate.
- Singular ↔ plural:
pantof damă→pantofi damă - Articulat ↔ nearticulat:
rochia roșie→rochie roșie - Diminutive populare:
pantofiori↔pantofi mici↔pantofi copii - Genul gramatical pierdut în limbaj colocvial:
parfum femei↔parfum femeie↔parfum dama
Soluție: stemmer dedicat pentru română (algoritmul Snowball Romanian e disponibil în Lucene/Elasticsearch; Lexis folosește unul re-tunat pe vocabular ecommerce).
Pattern 4 — Typo-uri caracteristice tastaturilor românești
Magazinele cu trafic mobil dominant văd un volum constant de typo-uri care nu apar la fel pe desktop. Cele mai frecvente:
- Litere apropiate (mobile keyboard):
aspirato→aspirator;cuiti→cuțite - Litere duble eliminate:
acumlator→acumulator - Substituții fonetice:
cosmeticze→cosmetice(z în loc de c între dispozitive cu layout diferit) - Confuzii brand:
samasung→samsung;filips→philips
Soluție: typo tolerance bazat pe edit distance (Damerau-Levenshtein), ponderat după probabilitatea fizică a confuziei (litere adiacente pe tastatură contează mai mult decât litere distante). Practica industrie e un prag de edit distance ≤ 2 pentru cuvinte ≥ 4 caractere.
Lexis e calibrat pe corpus de magazine ecommerce românești — sinonimele regionale și pattern-urile de typo de mai sus sunt pre-încărcate ca defaults. Pentru detalii pe fiecare punct, vezi articolul de fundament pe sinonime și typo-uri.
6. Reranking comportamental
Reranking-ul comportamental este re-ordonarea rezultatelor unui search după semnalul real al cumpărătorilor — click-uri, adăugări în coș, conversii — astfel încât produsele care performează consistent să apară mai sus chiar dacă scorul lor de text matching e similar cu altele.
Reranking-ul are nevoie de două lucruri: volum suficient (~100 click-uri pe un query pentru un model robust) și tracking corect al evenimentelor (search → click → conversion, atașate unei sesiuni anonime).
Pe magazine sub 1.000 căutări/lună e mai bine să-l ții pasiv — semnalul e prea slab pentru inferențe. Lexis activează automat reranking-ul când un query depășește pragul de volum; sub el, rămâne relevanța statică (BM25 + sinonime + typo tolerance) care e oricum mai bună decât search-ul nativ pe majoritatea cataloagelor.
Aprofundare: cum învață Lexis ce vrea clientul, pas cu pas.
7. Pagini SEO din căutări
Paginile SEO din căutări sunt URL-uri publice generate automat din interogările cu volum mare ale cumpărătorilor — fiecare devine o pagină landing dedicată, indexabilă și optimizată pentru Google.
Mecanismul: motorul monitorizează volumul interogărilor și aplică un gate pe trei axe — volum minim, acoperire în catalog, calitate semantică. Când toate trei sunt OK, generează automat o pagină de tip /cauta/<query> cu title, meta description, listare produse, schema.org markup și sitemap entry.
Asta înseamnă că search-ul tău nu e doar o funcție internă a magazinului — e și o sursă continuă de trafic SEO. Detalii: pagini SEO dinamice generate din log-urile de search.
8. Lexis vs Algolia vs Elasticsearch
Pe profilul mid-market (1k-100k produse, 10k-1M căutări/lună), cele trei opțiuni dominante au profile foarte diferite.
- Algolia: standardul premium, UX legendar, preț $50-300/lună la mid-market. Lock-in cu InstantSearch face migrarea costisitoare.
- Elasticsearch: flexibilitate maximă, gratuit ca software, dar 1-2 zile DevOps lunar și default-uri non-ecommerce. Necesită echipă tehnică dedicată.
- Lexis: €0-29/lună, plugin OpenCart oficial, stemming RO nativ, pagini SEO din căutări incluse. Cel mai rapid timp de la cont creat la primul click ne-zero (~1 zi).
Comparație detaliată cu prețuri și criterii de alegere: Lexis vs Algolia vs Elasticsearch — ce alegi pentru un magazin mid-market.
9. Roadmap de implementare în 7 zile
De la zero la search relevant, observat și optimizat — în șapte zile, fără echipă dedicată.
- Ziua 1. Cont + plugin instalat + prima sincronizare. Dashboard activ. Pași concreți pentru OpenCart: integrare OpenCart în 30 minute.
- Ziua 2-3. Audit catalog: denumiri produse, atribute, stoc real. Vezi top 5 greșeli catalog care strică search-ul.
- Ziua 4-5. Monitor zero-result rate și top căutări fără click. Adaugă sinonime manual unde apar mismatch-uri evidente (5-15 sinonime acoperă tipic 80% din durere).
- Ziua 6. Activează reranking-ul pe Pro tier (auto-activat când volumul depășește pragul) sau confirmă că modelul rulează deja pe query-urile principale.
- Ziua 7. Activează feature-ul de pagini SEO dinamice. Setează pragul de volum (default: 50 căutări/lună). Așteaptă 30 de zile pentru primele candidate-pages live.
10. Erorile cele mai frecvente
Trei greșeli apar repetat la magazinele care implementează search bun și totuși nu văd rezultate.
- Catalog murdar. Search bun pe catalog cu coduri în loc de descrieri, atribute incomplete sau stoc fictiv = zero efect. Curăță catalogul întâi — cele 5 audit-uri obligatorii.
- Reranking activat prea devreme. Sub 1.000 căutări/lună, reranking-ul produce zgomot. Lexis îl ține pasiv automat; pe stack-uri custom verifică că nu forțezi activarea.
- Lipsă observabilitate. Search-ul rulează, nimeni nu se uită la metrici, problemele se acumulează în tăcere. Setează un review săptămânal de zero-result rate + top căutări fără click. 15 minute / săptămână salvează 5% din vânzări.
11. Întrebări frecvente
- Cât costă un motor de search pentru un magazin online?
- Pentru un magazin mid-market (1k-100k produse, sub 1M căutări/lună), bugetul realist e între €0 și €100/lună. Lexis: gratis pe Free tier, €29/lună pe Pro. Algolia: $50-300/lună în funcție de volum. Elasticsearch self-hosted: gratis ca software, dar 1-2 zile de DevOps lunar pentru menținere. Pentru magazine mari (>1M căutări/lună), bugetele se mută în zona de €200-1000/lună indiferent de furnizor.
- Ce e mai bun, Algolia sau Elasticsearch pentru ecommerce?
- Algolia e mai rapid de pus în producție (UX-ul instant search e standardul de aur) și are reranking inclus pe tier-urile paid. Elasticsearch e mai flexibil și gratuit ca software, dar default-urile lui nu sunt pentru ecommerce — necesită tuning serios sau plugin-uri dedicate. Pentru un magazin care vrea search bun mâine, Algolia. Pentru un magazin cu echipă DevOps care vrea control total, Elasticsearch. Pentru un magazin care nu vrea să aleagă între cele două extreme, Lexis e o cale de mijloc cu plugin OpenCart oficial și preț predictibil.
- Cum implementez search într-un magazin OpenCart?
- Cea mai rapidă cale e plugin-ul OCMOD Lexis: instalat în 30 minute, înlocuiește search-ul nativ fără modificări de template. Alternativa nativă (full-text MySQL) cedează pe sinonime, typo-uri și forme gramaticale — vezi articolul despre de ce căutarea clasică cedează. Implementarea custom cu Elasticsearch e fezabilă dar înseamnă 1-2 săptămâni de muncă pentru un dezvoltator senior.
- Câte căutări pe lună are un magazin mid-market?
- Estimare: 5-15% din vizitatorii unui magazin folosesc search-ul. Pentru un magazin cu 30k vizitatori unici/lună, asta înseamnă 1.500-4.500 sesiuni cu search, care la 2-3 căutări/sesiune dă 3.000-13.500 query-uri totale. Free tier-ul Lexis (100k/lună) acoperă confortabil orice magazin până în ~500k vizitatori. Peste asta, Pro tier-ul (€29) urcă plafonul la 1M.
- Reranking-ul comportamental funcționează pe magazine mici?
- Nu eficient. Reranking-ul are nevoie de minim ~100 click-uri pe un query ca să facă inferențe robuste. Sub 1.000 căutări/lună totale, semnalul e prea slab — modelul fie nu se activează (Lexis îl ține pasiv automat), fie face zgomot. Pentru magazinele mici, relevanța statică (BM25 + sinonime + typo tolerance) e suficientă și mai sigură.
- Care e diferența între search clasic și search AI?
- „Search AI" e termen marketing pentru două lucruri foarte diferite: (1) reranking comportamental — modele învățate care reordonează rezultate după click-uri reale, lucru standard de 5+ ani; (2) căutare semantică prin embeddings vectoriale — interpretează intenția dincolo de cuvinte, util pentru cataloage cu descrieri lungi sau interogări naturale. Search-ul clasic (BM25 + sinonime) acoperă 90% din cazurile dintr-un catalog ecommerce normal. AI-ul vectorial aduce restul de 10% pe interogări vagi sau pe cataloage cu text bogat.
- Pot migra de la Algolia la Lexis fără să pierd analytics?
- Da. Lexis exportă log-urile de search în CSV și JSON din ziua 1, iar Algolia oferă același lucru. Aliniază schema (query, timestamp, results_count, click_position) și ai un istoric continuu. Modelul de reranking se reconstruiește în 2-3 săptămâni de la migrare pe baza traficului nou — perioada de „adaptare" e vizibilă în dashboard ca CTR temporar mai mic, apoi se stabilizează.
- Pot folosi Lexis fără să las datele clienților să iasă din UE?
- Da. Cloud-ul Lexis rulează în Frankfurt, GDPR-compliant, cu datele izolate per organizație. Pentru cerințe stricte de data residency (BNR, ANSPDCP, audit-uri ISO27001), Lexis se livrează self-hosted: rulezi engine-ul pe propria infrastructură, nicio dată nu părăsește perimetrul tău. License-ul enterprise include suport, update-uri și SLA.