Zpracování přirozeného jazyka

obor zkoumající strojové porozumění přirozeným jazykům / From Wikipedia, the free encyclopedia

Počítačové zpracování přirozeného jazyka (anglicky Natural language processing, NLP) je soubor technik na pomezí (počítačové) lingvistiky, informatiky (umělé inteligence), popř. též akustiky a dalších. Věnuje se analýze či generování textů nebo mluveného slova, které vyžadují určitou (ne absolutní) míru porozumění přirozenému jazyku strojem.

Tento článek potřebuje úpravy.

Tento článek potřebuje aktualizaci, neboť obsahuje zastaralé informace.

Aplikace NLP jsou např. strojový překlad, odpovídání na otázky (en:Question answering), dolování z textu (i výtah z textu; en:Automatic summarization) a automatická korektura textu či chatboti.^[1]

Mezi úkoly, které přispívají k řešení těchto problémů, patří mj. extrakce informací, strojový překlad, generování přirozeného jazyka (en:Natural language generation) a rozpoznávání a syntéza řeči (text-to-speech).

Zpracování přirozeného jazyka má tři historické fáze:

symbolické NLP (50. až 90. léta 20. stol.)
statistické NLP (90. léta 20. stol. až 00. léta 21. stol.)
neuronové NLP (počátky 2003, rozvoj po roce 2010 díky Tomáši Mikolovi a programu Word2vec)