O projektu InkCapture

InkCapture je software, který mění možnosti digitalizace historických ručně psaných dokumentů. Ručně psané historické listiny, knihy a dokumenty byly doposud převážně pouze skenovány bez možnosti získat z nich jednoduše také textovou informaci. Nejen badatelé tak byli při hledání informací odkázáni na hodiny pročítání stovek stran dokumentů bez podpory vyhledávání, která je běžná pro tištěné dokumenty.

InkCapture má za cíl toto změnit a nasazením moderních metod strojového učení a počítačového vidění umožnit získat z ručně psaných dokumentů informace, které revolučním způsobem změní možnosti vyhledávání v historických dokumentech.

Klíčové vlastnosti InkCapture:

  • Detekce oblastí stránky s ručně psaným textem
  • Rozpoznávání hůlkového písma
  • Rozpoznávání psacího písma
  • Vyhledávání v dokumentu pomocí obrazových vzorů
    • hledání textu na základě obrazového vzorku podobného hledanému textu
  • Vyhledávání v dokumentu na základě textu („ctrl + f“ nebo jako „na Google“)
    • hledání textu podobného zadanému slovu

Jak to funguje?

Software pro vytěžování ručně psaného písma potřebuje pokročilejší technologie než tradiční OCR vytěžování textu. Využívá modelu strojového učení a pokročilé umělé inteligence k pochopení textu ručně psaného písma. Systém má schopnost se automaticky učit na základě již validovaných dat. Abychom docílili maximální úspěšnosti, musíme učením algoritmus neustále zlepšovat. A k tomu je potřeba získat velké množství kvalitní dat. V našem případě dokumenty historické povahy.

Projekt je aktuálně ve fázi vývoje ve spolupráci s vědeckými i historickými institucemi. I vy se můžete do projektu zapojit tím, že poskytnete své historické dokumenty k digitalizaci a přispějete tak k vytvoření řešení pro kvalitní detekci psaných textů v dokumentech za pomoci neuronových sítí.

Co tím získáte?

  • Profesionálně digitalizovaný historický dokument skenovaný na specializovaných knižních skenerech, které jsou šetrné na vzácné a křehké předlohy
    • kvalitní sken a textové informace z vašeho dokumentu
  • Dobrý pocit z přispění k projektu, který má za cíl usnadnit přístup k historickým dokumentům a uchovat z nich maximum informací pro budoucnost.

Co nám tím dáte?

  • Právo využít digitalizovaný dokument v rámci projektu.

Zde se dozvíte, jak se do projektu zapojit a získat váš digitalizovaný dokument.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *