Skip to main content

URL-indeksointi

Indeksoi verkkosivuja ja -sivustoja chatbotin tietopohjaan.

URL-indeksointi mahdollistaa verkkosivujen sisällön automaattisen lisäämisen chatbotin tietopohjaan.

Miten URL-indeksointi toimii?

  1. Syötät verkkosivun osoitteen
  2. Järjestelmä hakee sivun sisällön
  3. Teksti irrotetaan HTML:stä ja indeksoidaan
  4. Sisältö on käytettävissä tietopohjassa

Yhden sivun indeksointi

Vaihe 1: Lisää URL

  1. Siirry Tietopohja-välilehdelle
  2. Klikkaa "Lisää URL"
  3. Syötä sivun täydellinen osoite
  4. Klikkaa "Indeksoi"

Esimerkkejä hyödyllisistä sivuista

  • UKK-sivu: https://yritys.fi/ukk
  • Tuotesivu: https://yritys.fi/tuotteet/tuote-x
  • Ohjesivut: https://yritys.fi/ohjeet/kaytto
  • Hinnoittelu: https://yritys.fi/hinnat

Sivuston indeksointi

Voit indeksoida useita sivuja kerralla:

Indeksointisyvyys

TasoKuvaus
Vain tämä sivuIndeksoi vain annettu URL
1 tasoAnnettu sivu + kaikki linkatut sivut
2 tasoaEdellinen + linkattujen sivujen linkit

Sivuston indeksointi laskee jokaisen sivun erikseen. Syvempi indeksointi kuluttaa enemmän kiintiötä.

URL-sääntöjen määrittäminen

Voit rajata mitä sivuja indeksoidaan:

Sisällytä vain:

/ohjeet/*
/tuotteet/*
/ukk

Ohita:

/admin/*
/kirjaudu
/ostoskori

Indeksoinnin hallinta

Indeksointitila

TilaKuvaus
🟡 JonossaOdottaa indeksointia
🔵 KäsittelyssäIndeksointi käynnissä
🟢 ValmisAktiivisena tietopohjassa
🔴 VirheIndeksointi epäonnistui

Päivitysaikataulu

Verkkosivut voivat muuttua. Valitse päivitystiheys:

VaihtoehtoKuvaus
ManuaalinenPäivitä vain pyydettäessä
ViikoittainAutomaattinen päivitys 7 päivän välein
PäivittäinAutomaattinen päivitys kerran päivässä

Virhetilanteet

Yleisimmät virheet

403 Forbidden

  • Sivu estää botit
  • Ratkaisu: Käytä dokumenttia sen sijaan

404 Not Found

  • Sivua ei löydy
  • Tarkista URL-osoite

Timeout

  • Sivu latautuu liian hitaasti
  • Kokeile myöhemmin uudelleen

JavaScript-sivu

  • Sisältö ladataan JavaScriptillä
  • Ratkaisu: Kopioi sisältö dokumenttiin

JavaScript-sivujen käsittely

Monet modernit sivustot lataavat sisällön JavaScriptillä. Jos indeksointi ei toimi:

  1. Avaa sivu selaimessa
  2. Kopioi näkyvä teksti
  3. Tallenna dokumenttina (TXT/MD)
  4. Lataa dokumentti tietopohjaan

Parhaat käytännöt

✅ Suositeltavaa

  • Indeksoi staattiset sisältösivut
  • Käytä UKK-, ohje- ja tuotesivuja
  • Päivitä muuttuneet sivut säännöllisesti

❌ Vältettävää

  • Kirjautumisen takana olevat sivut
  • Ostoskori ja kassasivut
  • Dynaamiset hakutulossivut
  • Liian laajat sivustot (satoja sivuja)

Indeksoidun sisällön tarkistaminen

  1. Klikkaa indeksoitua URL:ää listassa
  2. Valitse "Näytä sisältö"
  3. Tarkista että teksti on luettavissa
  4. Poista tarvittaessa virheellinen sisältö

Seuraavaksi

Varmista laatua Playgroundissa

Säädä botin käyttäytymistä