URL-indeksointi
Indeksoi verkkosivuja ja -sivustoja chatbotin tietopohjaan.
URL-indeksointi mahdollistaa verkkosivujen sisällön automaattisen lisäämisen chatbotin tietopohjaan.
Miten URL-indeksointi toimii?
- Syötät verkkosivun osoitteen
- Järjestelmä hakee sivun sisällön
- Teksti irrotetaan HTML:stä ja indeksoidaan
- Sisältö on käytettävissä tietopohjassa
Yhden sivun indeksointi
Vaihe 1: Lisää URL
- Siirry Tietopohja-välilehdelle
- Klikkaa "Lisää URL"
- Syötä sivun täydellinen osoite
- Klikkaa "Indeksoi"
Esimerkkejä hyödyllisistä sivuista
- UKK-sivu:
https://yritys.fi/ukk - Tuotesivu:
https://yritys.fi/tuotteet/tuote-x - Ohjesivut:
https://yritys.fi/ohjeet/kaytto - Hinnoittelu:
https://yritys.fi/hinnat
Sivuston indeksointi
Voit indeksoida useita sivuja kerralla:
Indeksointisyvyys
| Taso | Kuvaus |
|---|---|
| Vain tämä sivu | Indeksoi vain annettu URL |
| 1 taso | Annettu sivu + kaikki linkatut sivut |
| 2 tasoa | Edellinen + linkattujen sivujen linkit |
Sivuston indeksointi laskee jokaisen sivun erikseen. Syvempi indeksointi kuluttaa enemmän kiintiötä.
URL-sääntöjen määrittäminen
Voit rajata mitä sivuja indeksoidaan:
Sisällytä vain:
/ohjeet/* /tuotteet/* /ukk
Ohita:
/admin/* /kirjaudu /ostoskori
Indeksoinnin hallinta
Indeksointitila
| Tila | Kuvaus |
|---|---|
| 🟡 Jonossa | Odottaa indeksointia |
| 🔵 Käsittelyssä | Indeksointi käynnissä |
| 🟢 Valmis | Aktiivisena tietopohjassa |
| 🔴 Virhe | Indeksointi epäonnistui |
Päivitysaikataulu
Verkkosivut voivat muuttua. Valitse päivitystiheys:
| Vaihtoehto | Kuvaus |
|---|---|
| Manuaalinen | Päivitä vain pyydettäessä |
| Viikoittain | Automaattinen päivitys 7 päivän välein |
| Päivittäin | Automaattinen päivitys kerran päivässä |
Virhetilanteet
Yleisimmät virheet
403 Forbidden
- Sivu estää botit
- Ratkaisu: Käytä dokumenttia sen sijaan
404 Not Found
- Sivua ei löydy
- Tarkista URL-osoite
Timeout
- Sivu latautuu liian hitaasti
- Kokeile myöhemmin uudelleen
JavaScript-sivu
- Sisältö ladataan JavaScriptillä
- Ratkaisu: Kopioi sisältö dokumenttiin
JavaScript-sivujen käsittely
Monet modernit sivustot lataavat sisällön JavaScriptillä. Jos indeksointi ei toimi:
- Avaa sivu selaimessa
- Kopioi näkyvä teksti
- Tallenna dokumenttina (TXT/MD)
- Lataa dokumentti tietopohjaan
Parhaat käytännöt
✅ Suositeltavaa
- Indeksoi staattiset sisältösivut
- Käytä UKK-, ohje- ja tuotesivuja
- Päivitä muuttuneet sivut säännöllisesti
❌ Vältettävää
- Kirjautumisen takana olevat sivut
- Ostoskori ja kassasivut
- Dynaamiset hakutulossivut
- Liian laajat sivustot (satoja sivuja)
Indeksoidun sisällön tarkistaminen
- Klikkaa indeksoitua URL:ää listassa
- Valitse "Näytä sisältö"
- Tarkista että teksti on luettavissa
- Poista tarvittaessa virheellinen sisältö
Seuraavaksi
Varmista laatua Playgroundissa
Säädä botin käyttäytymistä