Чой Кеннет Чан

Система автоматической идентификации языка для многоязычного оптического распознавания символов

Загрузка...

Номер патента: 1689

Опубликовано: 25.06.2001

Авторы: Канунго Тапас, Пон Леонард К., Чой Кеннет Чан, Боксер Минди Р., Янг Дзун

МПК: G06F 17/28, G06K 9/72

Метки: многоязычного, символов, идентификации, автоматической, система, распознавания, языка, оптического

Формула / Реферат:

1. Способ автоматического определения одного или более языков, сопоставляемых с текстом документа, включающий в себя этапы сегментации документа на совокупность словоформ, формирования, по крайней мере, одной гипотезы относительно символов в упомянутых словоформах, задания словаря каждого из нескольких языков, определения для упомянутой гипотезы слова показателей доверительности по упомянутым нескольким языкам, причем показатели определяют...