Чой Кеннет Чан
Система автоматической идентификации языка для многоязычного оптического распознавания символов
Номер патента: 1689
Опубликовано: 25.06.2001
Авторы: Канунго Тапас, Пон Леонард К., Чой Кеннет Чан, Боксер Минди Р., Янг Дзун
МПК: G06F 17/28, G06K 9/72
Метки: многоязычного, символов, идентификации, автоматической, система, распознавания, языка, оптического
Формула / Реферат:
1. Способ автоматического определения одного или более языков, сопоставляемых с текстом документа, включающий в себя этапы сегментации документа на совокупность словоформ, формирования, по крайней мере, одной гипотезы относительно символов в упомянутых словоформах, задания словаря каждого из нескольких языков, определения для упомянутой гипотезы слова показателей доверительности по упомянутым нескольким языкам, причем показатели определяют...