Automatická indexace
From Wikipedia, the free encyclopedia
Automatická indexace je automatický proces redukce textu pomocí počítačového programu za účelem získání relevantních pojmů, které výstižně charakterizují jeho obsah. Vybrané pojmy se mohou nechat v přirozeném jazyce, nebo jsou přiřazeny k heslům řízeného slovníku selekčních jazyků.[1] Takto vybrané výsledky se částečně překrývají s výstupy, které vytvořili lidští indexátoři, avšak určitá část výsledků, které nejsou shodné, je podrobena dalšímu výzkumu.[2] Ten by se měl pokusit najít odpovědět, jak tyto postupy sjednotit a pomoci zpřesnit automatickou indexaci, tak jak to umí lidští indexátoři.
Nicméně nejedná se pouze o jedinou technologii. Je zde využita řada dalších metod. Jde o kombinaci indexovacích algoritmů, statistických měření, jazykových analýz atd. Algoritmy mohou být nastaveny i tak, že neprozkoumávají pouze plný text, ale využívají i struktury daného dokumentu, jako jsou nadpisy, záhlaví a odstavce.[2]