Канунго Тапас
Система автоматической идентификации языка для многоязычного оптического распознавания символов
Номер патента: 1689
Опубликовано: 25.06.2001
Авторы: Чой Кеннет Чан, Боксер Минди Р., Канунго Тапас, Пон Леонард К., Янг Дзун
МПК: G06F 17/28, G06K 9/72
Метки: символов, система, языка, оптического, автоматической, идентификации, многоязычного, распознавания
Формула / Реферат:
1. Способ автоматического определения одного или более языков, сопоставляемых с текстом документа, включающий в себя этапы сегментации документа на совокупность словоформ, формирования, по крайней мере, одной гипотезы относительно символов в упомянутых словоформах, задания словаря каждого из нескольких языков, определения для упомянутой гипотезы слова показателей доверительности по упомянутым нескольким языкам, причем показатели определяют...