Elektronika.lt

Elektronika.lt - elektronikos, informacinių ir
ryšių technologijų portalas

Adresas: http://www.elektronika.lt
El. paštas: info@elektronika.lt
 Atspausdinta iš: http://www.elektronika.lt/straipsniai/kompiuterija/63707/naujas-google-algoritmas-sukuria-originalu-turini-is-svetainiu-straipsniu/spausdinti/

Naujas „Google“ algoritmas sukuria originalų turinį iš svetainių straipsnių

Publikuota: 2018-05-22 16:16
Tematika: Kompiuteriai, IT
Skirta: Pradedantiems
Aut. teisės: ©TopCom.lt
Inf. šaltinis: TopCom.lt

„Google“ paskelbė mokslinį straipsnį, skirtą naujam algoritmui, kuris gali perimti skirtingų svetainių turinį ir jo pagrindu sukurti logiškai suderintus straipsnius. Generuodamas originalų turinį naujas algoritmas gali atsakyti į vartotojo klausimus, nenukreipiant jo į kitas svetaines.


„Google“ paskelbė mokslinį straipsnį, skirtą naujam algoritmui, kuris gali perimti skirtingų svetainių turinį ir jo pagrindu sukurti logiškai suderintus straipsnius. Generuodamas originalų turinį naujas algoritmas gali atsakyti į vartotojo klausimus, nenukreipiant jo į kitas svetaines.

Kaip veikia naujas algoritmas?

Pirmajame etape programinė įranga apibendrina žiniatinklio turinį, naudodama algoritmą, kuris ištraukia svetainės turinį, o tada pašalina nereikalingas dalis – panašiai kaip algoritmai, naudojami kuriant gatavus atsakymus (featured snippets) paieškos puslapyje.

Šio algoritmo gaunami rezultatai vadinami „išgaunamomis santraukomis“, nes jie susideda iš turinio, ištraukto iš tinklalapių. Iš esmės šios santraukos yra rinkinys svarbiausių sakinių, susijusių su naudotojo užklausa.

Naujas „Google“ algoritmas sukuria originalų turinį iš svetainių straipsnių

Antrajame etape nauja technologija naudoja kitą algoritmą, pavadintą „abstrakčia santrauka“ (Abstractive Summary), kuris yra perfrazavimo forma. Dirbtinio perfrazavimo trūkumas yra tai, kad beveik trečdalis tokių pranešimų turi suklastotų faktų.

Minėtame straipsnyje paminėta, kad „Google“ tyrėjai surado būdą suderinti geriausius abiejų metodų aspektus. Jie naudoja „Extractive Summaries“, norėdami išgauti svarbiausius faktus iš žiniatinklio dokumentų, o tada taiko „Abstractive Summary“ šio turinio perfrazavimui. Rezultatas – naujas dokumentas, pagrįstas internete surinkta informacija. Tokiu būdu „Google“ kuria savo „Wikipedijos“ versiją.

„Featured Snippets“ – pirmas žingsnis

Blokai su atsakymais paieškoje yra aukščiau apibūdinto „Extractive Summaries“ pavyzdys. Naujas dviejų etapų algoritmas gali būti taikomas knygoms, atviroms duomenų bazėms, taip pat visiems viešiesiems interneto puslapiams.

Tyrime „Wikipedia“ temos buvo naudojamos kaip paieškos užklausos, o kaip išgaunamos santraukos – „Google“ paieškos rezultatai. Po to algoritmas perfrazavo šį turinį ir sukūrė visiškai naujus straipsnius. Algoritmas taip pat vykdė lygiagretųjį tyrimą, generuodamas antrąjį straipsnių rinkinį, kuriame naudojo tik „Wikipedijoje“ paminėtas nuorodas.

Eksperimento rezultatai

Apibendrindami tyrėjai pažymi, kad eksperimentas buvo sėkmingas. „Google“ gali kurti savo turinį, sujungdamas tinklalapių straipsnius, taip atsakydamas į naudotojo klausimą, o ne nukreipdamas jį į kitas svetaines. Kada „Google“ pradės taikyti šį algoritmą praktiškai straipsnyje nenurodyta. Susipažinti su nauju „Google“ kūriniu galite paspaudę nuorodą „Generating Wikipedia by Summarizing Long Sequences“.

Priminsime, kad „Google“ svetainių savininkams jau keletą metų siūlo įsidiegti jų kodą AMP, kuris tinklapio turinį mobiliojoje paieškoje vartotojui taip pat rodo nepalikus paieškos rezultatų puslapio.


TopCom.lt
‡ 1999–2024 © Elektronika.lt LTV.LT - lietuviškų tinklalapių vitrina Valid XHTML 1.0!