W dzisiejszych czasach rozpoznawanie jednostek nazwanych (ang. named entity recognition, NER) i ekstrakcja informacji (ang. information extraction, IE) z dokumentów różnego typu stały się podstawą do wspomagania analizy i wykorzystania informacji zawartej w tekście. Podczas seminarium, na podstawie newsów, poruszony zostanie problem rozpoznawania i tłumaczenia jednostek nazwanych, a także ich lematyzacja. Następnie, na podstawie dokumentów dwuwymiarowych (skany, obrazki), omówiony zostanie temat ekstrakcji informacji w kontekście dokumentów biznesowych.