Способ (варианты) и устройство воспроизведения данных о сходстве объектов в многомерном пространстве
Номер патента: 3796
Опубликовано: 30.10.2003
Авторы: Аграфиотис Димитрис К., Лобанов Виктор С., Сейллем Францис Р.
Формула / Реферат
1. Способ воспроизведения данных о сходстве объектов в многомерном пространстве посредством воспроизведения взаимосвязи между объектами в качестве расстояния от одного к другому на дисплейной карте, отличающийся тем, что сначала объектам присваивают координаты и помещают объекты на дисплейной карте в соответствии с присвоенными им координатам, затем выделяют подгруппу объектов по признакам ассоциированных взаимосвязей между объектами, после чего, уточняя координаты объектов, видоизменяют расстояния между объектами на дисплейной карте на основании взаимосвязей между объектами и расстояниями между ними и после этого повторяют выделение подгрупп и видоизменение расстояний, как сказано выше, и получают дополнительные подгруппы объектов из общей группы объектов, при этом видоизмененные расстояния между объектами отображают относительные взаимосвязи между объектами.
2. Способ по п.1, отличающийся тем, что выделение подгрупп объектов производят парами объектов по признакам двуточечной ассоциированной взаимосвязи.
3. Способ по п.2, отличающийся тем, что в случае неизвестности взаимосвязей между по меньшей мере одной парой объектов выделение подгрупп объектов, видоизменение расстояний и повторение выделения подгрупп и видоизменение расстояний осуществляют для пар объектов, ассоциированные взаимосвязи между которыми известны, а для пар объектов с неизвестными взаимосвязями расстояния адаптируют с приведением их к значениям, обеспечивающим удовлетворительное вложение для известных взаимосвязей.
4. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам ограниченной неопределенности видоизменение расстояния на дисплейной карте между парой объектов, имеющих взаимосвязь по признаку ограниченной неопределенности, осуществляют по набору допустимых диапазонов значений взаимосвязи только при условии, если это расстояние выходит за пределы вышеназванных диапазонов.
5. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам ограниченной неопределенности видоизменение расстояния на дисплейной карте между парой объектов, имеющих взаимосвязь по признаку ограниченной неопределенности, осуществляют по верхнему пределу допустимого значения взаимосвязи только при условии, если это расстояние по значению близко к вышеназванному верхнему пределу.
6. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам ограниченной неопределенности видоизменение расстояния на дисплейной карте между парой объектов, имеющих взаимосвязь по признаку ограниченной неопределенности, осуществляют по нижнему пределу набора диапазонов допустимых значений взаимосвязи только при условии, если это расстояние выходит за пределы вышеназванных диапазонов.
7. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам неограниченной неопределенности дополнительно проводят идентификацию пары объектов, имеющих взаимосвязь по признакам неограниченной неопределенности, далее удаляют взаимосвязь с признаками неограниченной неопределенности и после этого адаптируют расстояние между объектами по признакам соответствующих взаимосвязей посредством повторения выделения подгрупп объектов, видоизменения расстояний и нового повторения выделения, с приведением указанного расстояния к значению, обеспечивающему удовлетворительное вложение для известных взаимосвязей.
8. Способ по п.2, отличающийся тем, что видоизменение расстояний осуществляют итеративно в соответствии с уравнением:
где t - номер текущей итерации, xi(t) и xj(t) - текущие координаты i-го и j-го объектов на дисплейной карте, rij - взаимосвязь между i-м и j-м объектами, dij = ||xi(t) - xj(t)|| - расстояние между i-м и j-м объектами и l(t) - переменный или постоянный параметр.
9. Способ по п.8, отличающийся тем, что параметр l задают постоянным в процессе видоизменения расстояний между объектами.
10. Способ по п.8, отличающийся тем, что параметр l задают монотонно убывающим в процессе видоизменения расстояний между объектами.
11. Способ по п.8, отличающийся тем, что параметр l задают переменным в зависимости от i, j и/или rij в процессе видоизменения расстояний между объектами.
12. Способ по п.11, отличающийся тем,что параметр l задают как функцию взаимосвязи между избранной парой объектов rij и определяют, в частности, по формуле
или по формуле
где lmax и lmin - начальное и конечное значения l, причем lmax, lmin О [0,1], T - общее число итераций, t - текущий номер итерации, a - постоянный коэффициент шкалирования.
13. Способ по п.11, отличающийся тем, что параметр l задают как функцию по меньшей мере одного избранного объекта.
14. Способ по п.11, отличающийся тем, что параметр l задают как функцию избранной пары объектов.
15. Способ по п.1, отличающийся тем, что видоизменение расстояний осуществляют посредством метода многомерного шкалирования.
16. Способ по п.1, отличающийся тем, что видоизменение расстояний осуществляют посредством метода нелинейного шкалирования.
17. Способ по п.1, отличающийся тем, что видоизменение расстояний осуществляют посредством получения значения функции ошибки и последующим уточнением расстояния посредством метода градиентного спуска.
18. Способ по п.1, отличающийся тем, что указанные объекты являются нехимическими.
19. Способ воспроизведения данных о сходстве объектов в многомерном пространстве посредством воспроизведения взаимосвязи между объектами в качестве расстояния от одного к другому на дисплейной карте, отличающийся тем, что сначала помещают объекты на дисплейной карте, затем выделяют подгруппу объектов по признакам ассоциированных взаимосвязей между объектами, после чего выделяют в вышеназванной подгруппе пару объектов, имеющих ассоциированную двуточечную взаимосвязь, после этого видоизменяют расстояния между парами объектов на дисплейной карте на основании взаимосвязей между парами объектов и расстояниями, после чего повторяют выделение вышеуказанных пар и видоизменение расстояний, как сказано выше, и получают дополнительные пары объектов из общей группы объектов.
20. Способ по п.19, отличающийся тем, что дополнительно осуществляют выделение второй подгруппы объектов и затем итеративно повторяют выделение пар объектов и видоизменение расстояний во второй выделенной подгруппе объектов.
21. Устройство воспроизведения данных о сходстве объектов в многомерном пространстве посредством воспроизведения взаимосвязи между объектами в качестве расстояния от одного к другому на дисплейной карте, отличающееся тем, что оно снабжено координатным модулем размещения объектов на дисплейной карте, модулем выделения подгруппы объектов и пересмотра расстояний между ними и модулем пересмотра координат и пересмотра расстояний между объектами в выделенной подгруппе на основе разности между расстояниями и соответствующими взаимосвязями, при этом вход модуля выделения подгруппы объектов и пересмотра расстояний между ними связан с выходом координатного модуля размещения объектов на дисплейной карте, выход модуля выделения подгруппы объектов и пересмотра расстояний между ними связан с входом модуля пересмотра коордиэрт и пересмотра расстояний между объектами в выделенной подгруппе, а вход координатного модуля размещения объектов на дисплейной карте связан с выходом модуля пересмотра координат и пересмотра расстояний между объектами в выделенной подгруппе.
22. Устройство по п.21, отличающееся тем, что оно дополнительно содержит модуль выделения подгруппы, выделения пары объектов и пересмотра расстояния между ними.
23. Устройство по п.21, отличающееся тем, что оно дополнительно содержит модуль выделения подгруппы, состоящей по меньшей мере из двух объектов, и пересмотра расстояния между ними, и модуль пересмотра координат и расстояния между объектами в выделенной подгруппе.
24. Устройство по п.23, отличающееся тем, что оно дополнительно содержит модуль пересмотра координат, вычисления значения функции ошибки и пересмотра расстояния посредством метода градиентного спуска.
25. Устройство по п.23, отличающееся тем, что оно дополнительно содержит модуль пересмотра координат и вычисления значения функции ошибки посредством метода многомерного шкалирования.
26. Устройство по п.23, отличающееся тем, что оно дополнительно содержит модуль пересмотра координат и вычисления значения функции ошибки посредством метода нелинейного шкалирования.
Текст
1 Область техники, к которой относится изобретение Настоящее изобретение относится к анализу данных и, в частности, к воспроизведению данных о сходстве в многомерном пространстве. Уровень техники В технике используются методы многомерного шкалирования (MDS) и нелинейная картография (NLM), методы формирования данных, выводимых на экран в виде карты (далее - дисплейная карта), в том числе нелинейной карты, расстояния между объектами на которой представляют собой взаимосвязи между объектами.(Torgerson, Phychometrika, 17:401 (1952), Крускалом (Kruskal, Psychometrika, 29:115 (1964 и Сэммоном (Sammon, IEEE Trans. Comput., C18:401 (1969, как средства формирования узкозонных воспроизведений данных, относящихся к области психологии. Многомерное шкалирование и нелинейное картографирование рассмотрены в работе Шиффмана и др. (Schiffman,Reynolds and Young, Introduction to Multidimensional Scaling, Academic Press, New York (1981,Янга и Хамера (Young and Hamer, "Многомерное Шкалирование: Хронология, Теория и Приложения", Eribaum Associates, Inc., Hillsdale, NJand Statistics, Chapman-Hall (1994. Содержание этих публикаций учитывается далее во всей их полноте.MDS и NLM (это, вообще говоря, одно и то же, далее - MDS) представляет собой набор методов для визуализации признаков сходства объектов по расстояниям между точками в узкозонном Евклидовом пространстве. Средства соизмерения сходства рассмотрены в работе Хартигана (Hartigan, J. Am. Statist. Ass., 62:1140(1967, которая учитывается далее во всей ее полноте. В частности, если задается конечное множество векторных или других выборокA=ai,i=1,k, функция взаимосвязи rij=r(ai,aj),где аi,aj A, которой соизмеряет сходство или несходство между i-м и j-м объектами в А, и набор изображений X = xixk: xiRm из выборки А в m-размерном дисплейном плане(Rm представляет собой пространство всех mразмерных векторов вещественных чисел), то задача заключается в том, чтобы поместить xi на дисплейный план так, чтобы Евклидовы расстояния между ними dih = хi - xj аппроксимировали соответствующие значения rij настолько близко, насколько возможно. Такая проекция,которая во многих случаях может быть получена только приближенно, выполняется итерационно путем минимизации функции ошибки, которая измеряет разность между оригиналом rij и 2 его проекцией dij, матрицами расстояний между наборами исходных векторов и векторов проекций. Предлагается несколько таких функций ошибки, большинство из которых представляют собой функцию наименьших квадратов, к которым также относится "стресс" (термин, взятый из области специализации автора-психологии) Крускала: где dij = xi - xj - Евклидово расстояние между изображениями xi и xj на дисплейном плане. В общем случае, решение может быть получено итерационно путем(1) вычисления или поиска в базе данных взаимосвязи rij;(3) вычисления расстояний изображений dij и значений функции ошибки (например, S, Е или К в уравнении 1-3 выше);(4) вычисления новой конфигурации изображений хi, с использованием метода градиентного спуска, типа линейной регрессии Крускала или подстановки упорядоченных изображений Гутмана и(5) повторения шагов 3 и 4, пока ошибка не будет минимизирована в пределах некоторого заранее определенного допуска. Например, алгоритм Сэммона свертывает уравнение 2 путем итерационного изменения координат хi, с использованием уравнения 4: где m - номер итерации, хpq - q-я координата p-го изображения xр, -коэффициент обучения (известный (заранее заданный) коэффициент), и Вывод данных на экран в виде карты получается несколькими повторяющимися вычислениями уравнения 2 в зависимости видоизменения координат при расчетах уравнений 4 и 5,до тех пор, пока ошибка не будет уменьшена до значения в пределах заранее определенного допуска. Изложенный выше общий пример обработки данных может быть использован для относительно небольших наборов данных, что существенно ограничивает его применение. Для больших наборов данных он не может практически применен. Названное ограничение происходит из того, что вычислительная мощность,необходимая для получения значений градиентов (т.е. шаг (4) выше), оценивается как квадрат объема набора данных. Для относительно больших массивов данных обработка названного квадрата объема данных даже в частичном (в виде определенной выборки) виде становится трудноосуществимой из-за затрат по времени на обработку столь больших объемов работ. Именно поэтому требуется система, способ и средство программного обеспечения компьютера для воспроизведения данных о сходстве в многомерном пространстве, для того чтобы иметь возможность нормально масштабировать в соответствии с числом объектов, для того чтобы их применять как к маленьким, так и к большим массивам данных. Кроме этого, необходимы система, способ и средство программного обеспечения компьютера, которые были бы эффективны в случае пропуска данных и/или в случае данных, содержащих ограниченную или неограниченную неопределенность, помехи от передачи или ошибки. Сущность изобретения Настоящее изобретение представляет собой устройство (систему), способ и в качестве только примера осуществления, представленного только в описании, средство программного обеспечения компьютера для воспроизведения точных или приближенных соизмерений сходства/несходства (взаимосвязей) между объектами, предпочтительно, как расстояний между точками в многомерном пространстве, которое воспроизводит объекты. При выполнении последовательности операций используются принципы автоматизации процесса для итерационного уточнения первоначальной (случайной или частично упорядоченной) конфигурации точек с использованием случайных (стохастических) ошибок взаимосвязи или расстояние. Данные могут быть полными или неполными(т.е. некоторые взаимосвязи между объектами могут быть неизвестными), точными или неточными (т.е. некоторые или все взаимосвязи могут быть заданы в условиях допустимых диапазонов 4 или пределов), симметричными или асимметричными (т. е. взаимосвязь от объекта А и объекта В может отличаться от взаимосвязи от В к А), а также могут содержать систематические или случайные ошибки. Взаимосвязи между объектами могут быть получены непосредственно из наблюдения, измерения, априорного знания, или интуитивно,или могут быть определены косвенно с применением любой подходящей методики для получения данных о сходстве (взаимосвязи). В настоящем изобретении представляется используется итеративный анализ подгруппы объектов с тем, чтобы воспроизвести их в многомерном пространстве и тем самым воспроизвести взаимосвязи между объектами. В одном примере осуществления данного изобретения итеративно анализируются подгруппы объектов с применением методов многомерного шкалирования или нелинейной картографии. В другом примере осуществления настоящего изобретения взаимосвязи уточняются как двуточечные взаимосвязи или двуточечное сходство/несходство между парами объектов,при этом в настоящем изобретении одновременно итерационно анализируется пара объектов, то есть, предпочтение отдается оценке подгрупп попарно, как в двойном вложенном цикле. В последующем описании понятия взаимосвязь, сходство или несходство используются для обозначения связей (соотношений) между парой объектов. Понятие дисплейная карта используется для обозначения набора изображений (образов) в N-мерном пространстве, которое воспроизводят исходные объекты. Понятие расстояние используется для обозначения расстояния между изображениями на дисплейной карте, которые соответствуют объектам. Здесь приводятся приведены примеры осуществления настоящего изобретения, в том числе примеры для данных и взаимосвязей химических соединений. Вместе с тем, необходимо понимать, что настоящее изобретение не ограничено примерами, представленными здесь. Настоящее изобретение может быть реализовано для различных приложений. Например, в случае, если в описанном здесь конкретном воплощении для воспроизведения сходства/различия между объектами применяется расстояние между точками, то изобретение предназначено и адаптировано к применению любых дисплейных (отображаемых) атрибутов, воспроизводящих сходство/несходство между объектами, включая, но не ограничиваясь, шрифт, размер, цвет, шкалу серых тонов,курсив, подчеркивание, выделение полужирным, оконтуривание, обрамление и т. д. Например, сходство/различие между двумя объектами может быть представлено относительными размерами точек, которые воспроизводят объекты. 5 Далее особенности и преимущества настоящего изобретения, равно как структура и функционирование различных вариантов выполнения настоящего изобретения, описаны подробно со ссылками на сопроводительные чертежи. Перечень фигур чертежей Настоящее изобретение будет описано со ссылкой на сопроводительные чертежи, на которых фиг. 1 иллюстрирует структурную схему вычислительной среды согласно варианту выполнения изобретения; фиг. 2 - структурная схема компьютера,который может быть применен для осуществления частей изобретения; фиг. 3 - блок-схема, представляющая функционирование изобретения по визуализации и интерактивной обработке выводимых отображений согласно варианту выполнения изобретения; фиг. 4 - блок-схема, представляющая способ, которым, согласно варианту выполнения изобретения, сгенерировано выводимое отображение; фиг. 5 концептуально иллюстрирует отношения между объектами. Взаимосвязи заданы в пределах некоторых допусков; фиг. 6 - структурная схема системы для воспроизведения взаимосвязей между объектами и фиг. 7 - блок-схема процесса, иллюстрирующая способ воспроизведения взаимосвязей между объектами. На фигурах подобные номера ссылок указывают на идентичные или функционально подобные элементы. Кроме того, крайняя левая цифра (цифры) номеров ссылок обозначают чертежи, на которых были в первый раз введены ассоциированные элементы. Сведения, подтверждающие возможность осуществления изобретенияI. Краткий обзор настоящего изобретения. Настоящее изобретение представляет собой устройство (систему), способ и средство программного обеспечения компьютера для воспроизведения точных или приближенных соизмерений сходства/несходства (взаимосвязей) между объектами, предпочтительно, как расстояния между точками в многомерном пространстве, которые воспроизводят объекты. В последовательности выполнения операций используются принципы автоматизации итерационного уточнения первоначальной (случайной или частичноупорядоченной) конфигурации точек с использованием случайных ошибок взаимоотношение/расстояние. Данные могут быть полными или неполными (т.е. некоторые взаимосвязи между объектами могут быть неизвестными), точными или неточными (т.е. некоторые или все взаимосвязи могут быть заданы в терминах допустимых диапазонов или преде 003796 6 лов), симметричными или асимметричными (т. е. взаимосвязь от объекта А к объекту В может отличаться от взаимосвязи от В к А), а также могут содержать систематические или случайные ошибки. Отношения между объектами могут быть получены непосредственно из наблюдения, измерения, априорного знания, или интуитивно,или могут быть определены косвенно с применением любой подходящей методики для получения данных о сходстве (взаимосвязи). Устройство по настоящему изобретению итеративно анализирует подгруппы (подмножество) объектов с тем, чтобы воспроизвести их в многомерном пространстве и в конечном итоге воспроизвести сами объекты. В предпочтительным варианте выполнения изобретения устройство итеративно анализирует подгруппу объектов с применением методов многомерного шкалирования или нелинейной картографии. В другом предпочтительным варианте выполнения изобретения взаимосвязи определены как двуточечные взаимосвязи или двуточечные сходства/несходства между парами объектов, а настоящее изобретение одновременно итерационно анализирует пару объектов, предпочтительно, дается оценка подгруппам попарно, как в двойном вложенном цикле. В альтернативном варианте выполнения отношения определены как N-мерные взаимосвязи или N-мерные сходства/несходства между разнородными объектами, а устройство по изобретению одновременно итеративно анализирует разнородные объекты, где N, предпочтительно, больше 1. Реализация данного альтернативного варианта будет очевидна тем, кто имеет подготовку в соответствующих областях знаний. Понятие "объект" относится к любому объекту, данным, свойству, атрибуту, компоненту, элементу, ингредиенту, элементу, и т. д.,для которых целесообразно представить сходство/несходство между образцами или любыми различными представителями таких объектов,данных, свойств, атрибутов, компонентов, элементов, ингредиентов, элементов и т. д. Без ограничения и только для иллюстрации, объекты включают, например, химические соединения,процессы, машины, смеси веществ, изделия производства, электрические устройства, механические устройства, финансовые данные, финансовые инструменты, финансовые тренды,ассоциированные финансовые особенности и характеристики, программные изделия, человеческие особенности и характеристики, научные свойства, особенности и характеристики, и т.д. В одном из вариантов выполнения устройство по изобретению оперирует с любым объектом,данными, свойством, атрибутом, компонентом,элементом, ингредиентом, элементом, и т. д., за исключением химических соединений.II. Выделение подгруппы. Посредством настоящего изобретения итерационно анализируются подгруппы объектов для воспроизведения их в многомерном пространстве и воспроизведения взаимосвязей между объектами. В предпочтительном варианте выполнения настоящего изобретения итерационно анализируются подгруппы объектов, используя при этом многомерное шкалирование или нелинейную картографию. В данном варианте выполнения изобретения объекты в выделенной подгруппе анализируются как группы, с использованием традиционного алгоритма, например, такого который был описан выше, но не ограничиваясь таким алгоритмом. В частности,координаты изображений, соответствующих объектам, включающим указанную подгруппу,уточняются с использованием многомерного шкалирования, нелинейного картографии или любого другого подходящего алгоритма, или двуточечного алгоритм уточнения, описанного ниже. В данном варианте выполнения изобретения подгруппы объектов могут быть выбраны случайно, псевдослучайно, систематично, частично систематично, и т. д. Поскольку подгруппы объектов анализируются, и расстояния между ними пересматриваются, группа объектов имеет тенденцию к самоорганизации (автоматизации). Таким образом, к большим наборам данных могут быть теперь применены известные методы многомерного шкалирования или нелинейной картографии. В другом предпочтительном варианте выполнения изобретения взаимосвязи определены как двуточечные взаимосвязи или двуточечные сходства/несходства между парами объектов, а настоящее изобретение одновременно итерационно анализирует два объекта. Пары объектов могут быть выбраны (выделены) случайно,псевдослучайно, систематично, частично систематично и т. д. Новые алгоритмы и методы для двуточечного анализа приведены ниже. Данный вариант выполнения изобретения описан только в качестве иллюстрации и не является ограничивающим. В альтернативном варианте выполнения изобретения взаимосвязи определены как Nмерные отношения или N-мерные сходства/несходства между разнородными объектами,и существующее изобретение одновременно итеративно анализирует разнородные объекты,где N, предпочтительно, больше 1. Реализация данного альтернативного варианта выполнения изобретения будет очевидна специалистам в соответствующих областях знаний.III. Полные матрицы двуточечных отношений без неопределенности. Предпочтительный подход, примененный здесь, состоит в том, чтобы использовать итерационное уточнение, основанное на случайных или мгновенных ошибках. Обсуждение в этом 8 разделе предполагает, что все двуточечные взаимосвязи известны и точны. Как и в традиционном MDS, способ начинает работу с первоначальной конфигурации точек, сгенерированной случайным образом или некоторой другой процедурой (см. ниже). Затем эта первоначальная конфигурация непрерывно уточняется путем повторяющегося выбора двух случайных точек i, j, и изменением их координат на дисплейной карте согласно уравнению 8: где t - номер текущей итерации, xi(t) и xj(t) - текущие координаты i-й и j-й точек на дисплейной карте, xj(t+1) - новые координаты i-й точки на дисплейной карте, а rij - двуточечные взаимосвязи между i-м и j-м объектами, которые мы пытаемся приблизить на дисплейной карте (см. выше).f(.) в уравнении 8 выше может принимать любую функциональную форму. В идеальном случае, эта функция должна минимизировать разность между фактическим и планируемым расстояниями между i-й и j-й точками. Например, f(.) может быть задана уравнением 9:(t) - настраиваемый параметр, именуемый далее как "коэффициент обучения", заимствованный из терминологии нейронных сетей. Данный процесс повторяется постоянное число раз, или до тех пор, пока не будет достигнут минимум некоторого глобального критерия ошибки в пределах некоторого заранее заданного допуска. Для получения статистической точности обычно требуется большое количество итераций. Описанный выше способ напоминает теорию обратного распространения в нейронных сетях (Werbos, Beyond Regression: New Tools forMicrostructure of Cognition. Vol. 1, MIT Press,Cambridge, MA (1986 and Kohonen's selforganizing principle (Kohonen, Biological Cybernetics, 43:59(1982. Коэффициент обученияв уравнении 9 играет ключевую роль в обеспечении сходимости. Еслислишком мало, координаты изменяются незначительно, и сходимость медленная. Если, с другой стороны,слишком велико, скорость обучения может быть увеличена, но выводимое отображение может стать нестабильным. Как правило,выбирается из интервала [0, 2] и может быть фиксировано, илиможет монотонно уменьшаться в течение процесса уточнения. Более того,может также быть функцией от i, j, dij и/или от rij, и может использоваться 9 для установления различных весов некоторым объектам и/или взаимосвязям. Например,может быть вычислено как: где mах и min являются начальными и конечными значениями коэффициента обучения, такими, что mах, min[0, 2], является общим числом шагов уточнения (итерации), t - текущий номер итерации, а является постоянным коэффициентом шкалирования, а rс - заданным пороговым расстоянием. Уравнение 10 дает эффект уменьшения коррекции при больших разносах,что позволяет получать выводимое отображение, которое более точно сохраняет ближние взаимодействия, чем дальние. Подробно введение весовых коэффициентов рассматривается ниже. Уравнение 11 означает, что корректируются только те расстояния, которые меньше заданного порогового значения rс. Это обеспечивает сохранение только местных взаимосвязей, тем самым позволяя раскрывать карту в ее собственной размерности. Одно из главных преимуществ данного подхода состоит в том, что он позволяет осуществлять частичные уточнения. В ряде случаев,для отражения общей структуры и топологии данных, бывает достаточно того, что двуточечные взаимосвязи представлены только приблизительно. В отличие от традиционного MDS,такой подход позволяет осуществлять очень точную регулировку процесса уточнения. Кроме того, поскольку выводимое отображение является самоорганизующимся, двуточечные уточнения становятся совместными, что частично облегчает квадратичный характер проблемы. Описанная выше процедура вложения не гарантирует сходимость к глобальному минимуму (т. е. наиболее точное вложение в смысле наименьших квадратов). Если это необходимо,процесс уточнения может быть повторен несколько раз с различных первоначальных конфигураций и/или начальных чисел случайной последовательности. В общем случае, абсолютные координаты в выводимом отображении не имеют никакого физического смысла. Важны относительные расстояния между точками, и общая структура и топология данных (наличие,плотность и разделение кластеров, и т.д.). Описанный выше способ идеально подходит как для метрического, так и для неметрического шкалирования. Последнее особенно полезно, когда двуточечные взаимосвязи не удовлетворяют аксиомам расстояния, и, в частности,неравенству треугольника. Хотя получение"точной" проекции возможно, только когда матрица двуточечных отношений является положительно определенной, значимые отображения могут быть получены даже тогда, когда этот критерий не удовлетворяется. Как упомянуто выше, общее качество проекции определяется функцией ошибки суммы квадратов, такой, какая показана в уравнениях 1-3. Описанный выше общий алгоритм может также применяться, когда матрица двуточечных отношений неполна, т. е. когда некоторые из двуточечных отношений неизвестны, когда некоторые из двуточечных отношений неточны или искажены, а также в обоих вышеупомянутых случаях. Ниже эти случаи будут рассмотрены отдельно.IV. Разреженные матрицы двуточечных отношений без неопределенности. Описанный выше общий алгоритм может также применяться, когда матрица двуточечных отношений неполна, т. е. когда некоторые из двуточечных отношений неизвестны. В этом случае может использоваться алгоритм, подобный описанному выше, с тем исключением, что выполняются итерации для пар точек, для которых взаимосвязи известны. В таком случае в процессе выполнения алгоритма идентифицируются в пространстве конфигурации, которые удовлетворяют известным двуточечным взаимосвязям; неизвестные двуточечные взаимосвязи адаптируются в процессе уточнения и, в конечном счете, принимают значения, которые позволяют достичь удовлетворительного вложения для известных отношений. В зависимости от количества отсутствующих данных, количество удовлетворительных вложений (отображений) исходной матрицы отношений может быть более одного. В таком случае из различных начальных конфигураций или начальных чисел последовательности случайных чисел могут быть получены различные конфигурации (отображения). В некоторых приложениях, таких как поиск конформационного пространства молекул, это свойство дает существенное преимущество над рядом альтернативных способов. В данном контексте могут использоваться все варианты первоначального алгоритма (см. разделы ниже).V. Матрицы двуточечных отношений с ограниченной неопределенностью. Описанный выше общий алгоритм может также применяться, когда двуточечные взаимосвязи содержат ограниченную неопределенность, т. е. когда про некоторые из двуточечных отношений известны только пределы заданных допусков (например, известно, что взаимосвязи лежат в пределах диапазона или группы с заранее заданными верхней и нижней границами). В таком случае может использоваться алгоритм,подобный одному из алгоритмов, описанных выше, с тем исключением, что расстояния на дисплейной карте корректируются только тогда, 11 когда соответствующие точки лежат вне заранее заданных границ. Например, предположим, что взаимосвязи между двумя объектами i и j заданы в терминах, соответственно, верхней и нижней границ rmax и rmin. Когда в процессе уточнения выбирается эта пара объектов, вычисляется расстояние между соответствующими образами на дисплейной карте, которое обозначается какdij. Если dij больше rmax, координаты образов модифицируются, при этом r берется как планируемое расстояние: Если dij лежит между верхней и нижней границами (т.е. rmindijrmах), модификация не производится. Другими словами, алгоритм стремится удовлетворить ограничению на верхней границе, если текущее расстояние между образами больше чем верхняя граница, или ограничению на нижней границе, если текущее расстояние между образами меньше чем нижняя граница. Если расстояние между образами находится в пределах верхней и нижней границ,модификация не производится. Данный алгоритм может быть дополнен для случая, когда некоторые из двуточечных отношений задаются конечным множеством допустимых дискретных значений, или набором диапазонов значений, или некоторой комбинацией этих вариантов. Ниже, в целях рассмотрения, мы рассмотрим дискретные значения, как диапазоны нулевой ширины (например, дискретное значение 2 может быть представлено как диапазон [2,2]). На фиг. 5 показаны различные возможные варианты для гипотетических одиночных двуточечных отношений и текущее расстояние между соответствующими образами на дисплейной карте. Здесь заштрихованные площади 510,512 и 514 обозначают допустимые диапазоны для данных двуточечных отношений. Расстояния d1-d5 иллюстрируют 5 различных вариантов для текущего расстояния между соответствующими образами на дисплейной карте. Стрелки 516, 518, 520 и 522 указывают направление модификации, которая будет применяться к образам на отображении. Стрелки 518 и 522,направленные налево, указывают, что координаты ассоциированных образов на дисплейной карте должны быть модифицированы так, чтобы образы стали ближе друг к другу. Стрелки 516 и 520, направленные направо, указывают, что координаты ассоциированных образов на дисплейной карте должны быть модифицированы так, чтобы образы стали дальше друг от друга. 12 Как и в случае одного диапазона, если текущее расстояние между выбранной парой образов выводимого отображения находится в пределах любого из заранее заданных диапазонов, модификация координат не производится(т. е. случай d1 на фиг. 5). И наоборот, производится модификация, с использованием самой близкой границы диапазона в качестве планируемого расстояния (т. е. случаи d1-d5 на фиг. 5). Например, если взаимосвязи между данной парой объектов лежат в диапазонах [1,2] [3,5] и[6,7], а текущее расстояние между соответствующими образами равно 2,9 (d5 на фиг. 5),производится модификация с использованием 3 как планируемого расстояния (rij) в уравнении 8. Если, однако, текущее расстояние равно 2,1,координаты модифицируются с использованием 2 как планируемого расстояния rij в уравнении 8. Этот детерминированный критерий может быть заменен стохастическим или вероятностным критерием, в котором планируемое расстояние выбирается либо случайно, либо с вероятностью, которая зависит от разности между текущим расстоянием и двумя самыми близкими границами диапазона. В примере, описанном выше (d5 на фиг. 5), может быть произведен вероятностный выбор между 2 и 3, с вероятностями, например, 0,1 и 0,9, соответственно (т. е. 2 мог быть выбран как требуемое расстояние с вероятностью 0,1, а 3 - с вероятностью 0,9). Может быть использован любой метод получения таких вероятностей. В качестве альтернативы, 2 или 3 могут быть выбраны как требуемое расстояние случайным образом. Например, ограниченную неопределенность в двуточечных взаимосвязях могут представлять случайные или систематические ошибки, или шум, связанный с физическими измерениями. В общем случае, ограниченные неопределенности могут различаться для различных двуточечных взаимосвязей. Типичным примером является Ядерный Эффект Overhauser(NОЕ) в многомерной спектрометрии Ядерного Магнитного Резонанса. Альтернативный алгоритм для случаев с неопределенностью должен уменьшить величину коррекции для пар объектов, для которых считается, что их взаимосвязи являются неопределенными. В такой схеме величина коррекции,как это задано коэффициентом обучения в уравнении 9, может быть, например, уменьшена для двуточечных взаимосвязей, для которых считается, что их взаимосвязи является неопределенными. Величина коррекции может зависеть от степени неопределенности, связанной с соответствующими двуточечными взаимосвязями(например, величина коррекции может быть обратно пропорциональна неопределенности,связанной с соответствующими двуточечными взаимосвязями). Если наличие и/или величина ошибок неизвестны, ошибки могут быть опре 13 делены алгоритмом автоматически (см. разделVI. Матрицы двуточечных взаимосвязей с неограниченной неопределенностью (искаженные данные). Идеи, описанные в предшествующих разделах, могут применяться, когда считается, что некоторые из двуточечных взаимосвязей содержат искаженные данные, т. е. когда некоторые из двуточечных взаимосвязей неверны и, по существу, не имеют никакого взаимосвязи к фактическим величинам. В этом случае в ходе работы алгоритма "проблемные" взаимосвязи могут быть обнаружены и удалены из последующей обработки. Другими словами, цель состоит в том, чтобы идентифицировать искаженные исходные данные и удалить их из матрицы взаимосвязей. Этот процесс позволяет получить разреженную матрицу взаимосвязей, которая может быть уточнена с использованием алгоритма из раздела 1.2 выше.VII. Модификации Основного Алгоритма. Во многих случаях работа описанного выше алгоритма может быть ускорена предварительным упорядочиванием данных с использованием подходящего статистического метода. Например, если сходства получены из данных,доступных в векторной или бинарной форме,первоначальная конфигурация точек на дисплейной карте может быть рассчитана с применением Анализа Главных Компонент. В предпочтительном варианте выполнения первоначальная конфигурация может быть построена из первых 3 главных компонент матрицы свойств(т. е. 3 скрытых переменных, на которые приходится большая часть дисперсии данных). На практике эта методика может давать существенный выигрыш в быстродействии процедуры уточнения. Действительно, если используется случайная начальная конфигурация, существенная часть времени обучения тратится на установление общей структуры и топологии выводимого отображения, что обычно связано с существенной перегруппировкой. Если, с другой стороны, входная конфигурация является частично упорядоченной, значение критерия ошибки может быть относительно быстро уменьшено до приемлемого уровня. Если данные сильно кластеризованы, методика выборочного исследования позволяет уточнять области низкой плотности менее эффективно, чем области высокой плотности. В предпочтительном варианте выполнения изобретения данная тенденция может быть частично компенсирована модификацией исходного алгоритма, которая увеличивает выборочную вероятность в областях низкой плотности. В одном из вариантов выполнения изобретения центр масс выводимого отображения идентифицирован и построены концентрические слои с центрами в данной точке. Выполнено несколько 14 регулярных итераций уточнения, и каждый раз выбирались точки внутри этих оболочек или между ними. Данный процесс был повторен заданное число раз. За этой фазой следовала фаза регулярного уточнения с использованием глобальной выборки, и процесс был повторен. В общем случае, основной алгоритм не различает малые и большие расстояния. Уравнения 10 и 11 описывают способ, который за счет введения весовых коэффициентов, сохраняет малые расстояния более точно, чем большие. Альтернативный (и дополнительный) подход состоит в обеспечении того, что точки, находящиеся на близком расстоянии, подвергаются более расширенной выборке, чем точки на большом расстоянии. Например, может быть использована альтернативная последовательность глобальных и локальных циклов уточнения, аналогичных циклу, описанному выше. В данном воплощении сначала выполнена фаза глобального уточнения, после чего полученное выводимое отображение разделено на части с помощью регулярной сетки. Затем точки (объекты) в каждой ячейке сетки подвергнуты локальному уточнению (т. е. сравниваются и улучшаются только точки из одной ячейки). Предлагается число шагов выборки в каждой ячейке выбирать пропорциональным числу точек, содержащихся в данной ячейке. Этот процесс является высоко параллелизуемым. За указанной фазой локального уточнения следует другая фаза глобального уточнения. Процесс повторяют заранее заданное число раз, или до тех пор, пока ошибка вложения не будет уменьшена до заранее заданного допуска. В качестве альтернативы, сеточный метод может быть заменен другим подходящим методом идентификации ближайших точек, например,типа k-d дерева. Описанные здесь способы могут применяться для последовательного уточнения. Это означает, что, начав с созданного на дисплейной карте набора точек, можно добавить новый набор точек без модификации первоначального отображения. Строго говоря, это статистически корректно в том случае, когда новый набор точек значительно меньше первоначального набора. В предпочтительном варианте выполнения изобретения новый набор точек может быть"внедрен" в существующее отображение с использованием модификации основного алгоритма, описанной выше. В частности, для модификации только входящих точек могут использоваться уравнения 8 и 9. Кроме этого, процедура выборки гарантирует, что выбранные пары содержат по крайней мере одну точку из входного набора. Это означает, что случайным образом выбираются две точки так, что по крайней мере одна из этих точек принадлежит входному набору. В качестве альтернативы, каждая новая точка может быть независимо вне 15 дрена с использованием подхода, описанного выше.VIII. Оценочные свойства (особенности),соизмерение взаимосвязей и расстояний. В предпочтительном варианте выполнения изобретения взаимосвязи между объектами могут быть представлены как сходства/несходства между объектами на дисплейной карте и могут быть получены из свойств или особенностей,связанных с объектами. Для создания выводимого отображения может использоваться любая мера сходства. Свойства или особенности, которые используются для оценки сходства или несходства, иногда вместе называются здесь "оценочными свойствами". Например, если объекты - это химические соединения, сходство между объектами может быть основано на структурном сходстве, химическом сходстве, физическом сходстве, биологическом сходстве, и/или некотором другом типе соизмерения сходства, которая может быть получена из структуры или идентичности соединений. А. Оценочные свойства, имеющие непрерывные или дискретные вещественные значения. Меры сходства могут быть получены из списка оценочных свойств, связанного с набором объектов. Например, если объекты - химические соединения, в качестве оценочных свойств могут выступать физические, химические и/или биологические свойства, связанные с набором химических соединений. В рамках такой формализации объекты могут быть представлены в виде векторов в многомерном пространстве свойств, а их сходство может быть рассчитано через некоторую геометрическую меру расстояния. В предпочтительном варианте выполнения изобретения пространство свойств определяется с использованием одного или более свойств или описателей. В примере с химическим соединением, пространство свойств может быть определено с использованием одного или более молекулярных свойств или описателей. Такие молекулярные свойства могут включать топологические индексы, физико-химические свойства,эксплуатационные электростатические параметры, объем, параметры поверхности и т. д. Эти свойства могут включать, не ограничиваясь,молекулярный объем и площадь поверхности,дипольные моменты, коэффициенты распределения вода-октанол, молярные рефракции, теплоту формирования, значения полной энергии,потенциалы ионизации, молекулярные индексы связности, двумерные и трехмерные векторы автокорреляции, трехмерные структурные и/или фармакологические параметры, электронные поля, и т. д. Нужно обратить внимание, что настоящее изобретение не ограничено данным воплощением. Например, молекулярные свойства могут 16 включать наблюдаемые биологические активности набора соединений, в противоположность набору биологических объектов типа ферментов или рецепторов (также известных как сходство по характерным признакам). Фактически, в настоящем изобретении может использоваться любое векторное представление химических данных. Необходимо также понимать, что настоящее изобретение не ограничено приложением,связанным с объектами типа химических соединений. Помимо указанных объектов, в настоящем изобретении могут быть реализованы любые наборы данных или объекты, включая объекты, которые связаны с оценочными свойствами, которые имеют непрерывные или дискретные значения. 1. Соизмерение взаимосвязи или расстояния, для которых значения оценочных свойств непрерывные или дискретные вещественные значения."Соизмерение расстояния" является некоторым алгоритмом или методикой, применяемой для определения взаимосвязи между объектами, основанного на выбранных оценочных свойствах. Выбор конкретной меры расстояния,используемой в каждом конкретном случае, зависит, по крайней мере частично, от набора значений, которые могут учитываться оценочными свойствами. Например, в случае, когда оценочные свойства в качестве значений могут учитывать вещественные числа, в качестве удобной меры расстояния может использоваться соизмерение Минковского, показанная в уравнении 14 где k используется для нумерации элементов вектора свойств, а r[1, ]. Для r = 1,0 уравнение 14 представляет собой метрику городских кварталов или Манхэттанскую метрику. Для r = 2,0 уравнение 14 - обычное Евклидово расстояние. Для r= уравнение 14 представляет собой максимум расстояний в абсолютных координатах, известное также, как "доминирующая" метрика, "верхняя" метрика, или "ультраметрическое" расстояние. Можно показать, что для любого значения r[1, ] метрика Минковского является правильной метрикой, т. е. что она удовлетворяет условиям аксиом расстояния и, в частности, неравенству треугольника. В. Оценочные свойства, имеющие бинарные значения. В качестве альтернативы, оценочные свойства объектов могут быть представлены в бинарной форме. При таком представлении для указания на присутствие или отсутствие, или потенциальное присутствие или отсутствие свойства или характеристики используются биты. 17 Например, если в качестве объектов выбраны химические соединения, такие объекты могут быть закодированы с использованием ключей основания, когда каждый бит обозначает присутствие или отсутствие в конечной молекуле специфического структурного свойства или шаблона. Такие свойства могут включать,но не ограничиваясь, присутствие, отсутствие или минимальное количество включений отдельного элемента (например, присутствие по крайней мере 1, 2 или 3 атомов азота), необычные или существенные электронные конфигурации и типы атомов (например, азот с двойной связью или ароматический углерод), общие функциональные группы, такие как спирты,амины и т. д., некоторые простые и сложные звенья, пара или тройка фармакологических групп в определенной классификации в 3 мерном пространстве, и "дизъюнкции" необычных свойств, которые являются настолько редкими, что не обозначаются отдельными битами,но чрезвычайно важны, когда все же происходят. Как правило, этим необычным свойствам назначают общий бит, который устанавливается, когда в конечный молекуле присутствует один из шаблонов. При назначении битов, в качестве альтернативы, оценочные свойства соединений могут быть закодированы в форме бинарных характерных признаков, которые не зависят от определенного ранее фрагмента или словаря особенностей. Вместо этого, до некоторого заранее определенного предела каждый шаблон в молекуле систематически пересчитывается и подается на вход алгоритма хеширования, который"переворачивает" некоторое небольшое число битов на псевдослучайных позициях точечного рисунка. Хотя и подразумевается, что две различных молекулы могут иметь совершенно одинаковые наборы характерных признаков,вероятность такого совпадения чрезвычайно мала для всех случаев, кроме самых простых. Накопленный опыт свидетельствует о том, что эти наборы характерных признаков содержат достаточно информации о молекулярных структурах, чтобы обеспечить значимое сравнение сходства. 7. Соизмерение расстояния, для которых значения оценочных свойств - бинарные. Могут использоваться соизмерение взаимосвязей с бинарными описателями (т.е. меры,для которых оценочные свойства - бинарные или бинарные характерные признаки). Наиболее часто используется нормированное расстояние Хемминга: в котором измеряет число битов, различных у х и у; коэффициент Танимото (Tanimoto) или Джаккарда (Jaccard): который является мерой числа оснований, общих для двух молекул, отнесенное к числу оснований, которые они могли бы иметь общими,а также коэффициент Дайса (Dice):AND(x, у) есть пересечение бинарных множеств х и у (биты, которые в обоих множествах равны"1"), IOR (х, у) есть объединение или "включающее или" х и у (биты, которые равны "1" либо в х, либо в у), XOR есть "исключающее или" х и у (биты, которые равны "1" либо в х,либо в у, но не в обоих множествах сразу), х это число битов, которые равны "1" в х, а N длина бинарных множеств, измеренная в битах. Другая популярная метрика - Евклидово расстояние, которое для бинарных множеств может быть преобразовано в следующую форму: где NOT (у) обозначает бинарное дополнение к у. ВыражениеXOR (x, NOT (упредставляет собой число битов, одинаковых в х и у (либо"0", либо "1"). Евклидово расстояние - это хорошее соизмерение сходства в случаях, когда бинарные множества относительно велики, и используется, главным образом, в ситуациях,когда измеряется относительное сходство. В примере с соединениями, расстояние между объектами может быть определено с использованием бинарного или многомерного представления. Настоящее изобретение, однако, не ограничено этим воплощением. Например, сходство между двумя соединениями может быть определено путем сравнения форм молекул с использованием подходящего метода 3-размерной линеаризации. Сходство между двумя соединениями может также быть выведено из модели сходства, определенной согласно заранее заданной процедуре. Примером одной такой модели сходства может служить нейронная сеть, обученная прогнозировать коэффициент сходства по заданным двум соединениям, закодированным соответствующим образом. Такая нейронная сеть может быть обучена по обучающей последовательности пар структур и известному коэффициенту сходства для каждой такой пары, которые, например, могут быть введены пользователем. С. Шкалирование оценочных свойств. В уравнении 14 свойства (т. е. оценочные свойства) могут быть шкалированы по-другому,что позволяет отразить их относительную важность в оценке взаимосвязей между соединениями. Например, свойству А может быть придан вес 2, а свойству В может быть придан вес 19 10. Таким образом, свойство В будет иметь в пять раз большее воздействия при расчете взаимосвязи, чем свойство А. Соответственно, уравнение 14 может быть заменено уравнением 19: где wk - вес k-гo свойства. Примером такого весового множителя может служить коэффициент нормализации. Однако могут также использоваться и другие весовые схемы. Шкалирование (веса) не должно быть обязательно одинаковым для всего отображения, т. е. результирующее отображение не должно быть обязательно изоморфным. В дальнейшем отображения, полученные с применением однородных весов, будут называться глобально взвешенными (изоморфными), тогда как отображения, полученные с применением разнородных весов, будут называться локально взвешенными (неизоморфными). Для локально взвешенных отображений взаимосвязи (или расстояния) на дисплейной карте отражают локальную меру сходства. То, что определяет степень сходства в одном домене выводимого отображения, не обязательно будет определять степень сходства в другом домене выводимого отображения. Например, локально взвешенные отображения могут применяться, чтобы отразить сходства, полученные с помощью локально взвешенного алгоритма изучения на основе случайных чисел. Локально взвешенное самообучение использует данные режима обучения для осреднения, интерполяции внутри, экстраполяции от или иной комбинации данных режима обучения. Большая часть методов самообучения (также упоминаемых как методы моделирования или предсказания) конструируют одиночную модель, удовлетворяющую всем данным режима обучения. С другой стороны, локальные модели пытаются удовлетворять данным режима обучения в локальной области, окружающей запрос. Примерами локальных моделей могут служить ближайшие соседи, взвешенное среднее значение, и локально взвешенная регрессия. Локально взвешенное обучение рассмотрено у Вапника (Vapnik, Advances in Neural Information(1993, все эти публикации включены здесь ссылкой во всей их полноте. Видимые отображения могут также быть построены на основе матрицы взаимосвязей,которая не является строго симметричной, т. е. матрица взаимосвязей такова, что rijrji. Предполагается, что данный подход будет использоваться в ситуациях, когда взаимосвязи (т. е. функция взаимосвязей) определены локально,например, в локально взвешенной модели, в которой используется локальная функция рас 003796 20 стояния на точечной базе. В данном воплощении каждый пункт обучения связан с функцией расстояния и значениями соответствующих параметров. Для того, чтобы создать выводимое отображение, отражающее эти локальные взаимосвязи расстояния, расстояние между двумя точками лучше всего оценивать дважды, используя локальные функции расстояния между соответствующими точками. Полученные расстояния усредняются и подаются на вход алгоритма отображения, описанного выше. Данный подход мог бы потенциально привести к получению значимой проекции в случае, когда локальные функции расстояния на точечной базе непрерывны или полунепрерывны везде в пространстве признаков.IX. Реализация изобретения. А. Общие положения. Изобретение может быть реализовано различными способами, с использованием различных алгоритмов, и может быть внедрено на аппаратных средствах, программном обеспечении,аппаратно-программном обеспечении или любой их комбинации. На фиг. 6 приведен пример структурной схемы, которая иллюстрирует модули и поток данных, которые могут быть включены в устройство (систему) 610 в соответствии с настоящим изобретением. Структурная схема на фиг. 6 приведена для лучшего понимания настоящего изобретения и настоящее изобретение не ограничено примером выполнения,приведенным на фиг. 6 в виде структурной схемы. Устройство 610 включает реляционную базу данных 612, в которой хранятся данные взаимосвязей 630, ассоциированные с объектами. Поскольку настоящее изобретение может быть реализовано с любым типом данных, для которых могут быть определены взаимосвязи, в реляционной базе данных 612 могут быть размещены любые типы данных и ассоциированных взаимосвязей. Данные взаимосвязей 630 могут быть получены из одного или более источников. Например, отношение 630 а может быть получено из внешнего источника 632, отношение 630b может быть получено из других источников 640,а данные взаимосвязей 630n могут быть сгенерированы модулем генератора взаимосвязей 634 на основе оценочных свойств 636, наличие которого необязательно. Для выполнения одного или более алгоритмов, таких как одно или несколько уравнений 14-19, необязательный модуль генератора взаимосвязей 634 может включать аппаратные средства, программное обеспечение, аппаратно-программное обеспечение или любую их комбинацию. Данные взаимосвязей 630 передаются на координатный модуль 616. В предпочтительном варианте выполнения изобретения взаимосвязи 630 передаются на координатный модуль 616 в виде матрицы взаимосвязей 614, которая, пред 21 почтительно, является матрицей, содержащей любой объем данных взаимосвязей 630 из базы данных взаимосвязей 612. Координатный модуль 616 назначает начальные координаты точкам данных или объектам, которые ассоциированы данными взаимосвязей 630. Начальные координаты могут быть назначены случайным образом или посредством любой другой методики. Например, данные могут быть заранее упорядоченными или частично упорядоченными. Координаты включают выводимое отображение. Видимое отображение может представлять собой линейное или развернутое выводимое отображение. Видимое отображение представляет собой N-мерное выводимое отображение. Подгруппа (подмножество) 618 взаимосвязь/координаты и ассоциированные с ними взаимосвязи 620 передаются на модуль пересмотра координат 622. В предпочтительном варианте выполнения изобретения на модуль пересмотра координат 622 каждый раз передается одну из подгрупп взаимосвязь/координаты 618. Можно предусмотреть, чтобы модуль выделения подгруппы 636 выбирал подгруппы взаимосвязь/координаты 618 для их дальнейшей передачи в модуль пересмотра координат 622. Модуль выделения подгруппы 636 может выбирать подгруппы взаимосвязь/координаты 618 случайным образом или с помощью любого другого подходящего метода, включая один метод или более из числа описанных выше. Модуль уточнения координат 622 уточняет положение объектов на дисплейной карте (т. е. уточняет координаты 618) на основе точных или приближенных измерений сходства/несходства(взаимосвязи 620). В частном случае, модуль пересмотра координат 622 измеряет расстояния между объектами на дисплейной карте и сравнивает их с ассоциированными взаимосвязями 620. Затем, на основе сравнения, модуль пересмотра координат 622 уточняет координаты 618. Такие расстояния могут либо использоваться непосредственно, либо могут изменять другие атрибуты изображения. Для реализации одного или более традиционных алгоритмов многомерного шкалирования или алгоритмов нелинейного отображения(как это описано выше), модуль пересмотра координат 622 может включать аппаратные средства, программное обеспечение, аппаратнопрограммное обеспечение или любое их сочетание. Кроме того, или в качестве альтернативы,для реализации одного или более современных алгоритмов двуточечного анализа, таких, например, как одно или несколько уравнений 8-13,или их сочетаний, модуль пересмотра координат 622 может включать аппаратные средства,программное обеспечение, аппаратно-программное обеспечение, или любое их сочетание. Когда модуль пересмотра координат 622 производит описанный выше двуточечный ана 003796 22 лиз, для обеспечения сходимости расстояния между координатами в подгруппах взаимосвязь/координаты 618 и ассоциированным соотношением (взаимосвязями) 620 может применяться коэффициент обучения . Модуль уточнения координат 622 может быть разработан для представления точных или приближенных измерений сходства/несходства (взаимосвязи 620). Например, модуль пересмотра координат 622 может быть запрограммирован на обработку полных двуточечных матриц, которые не содержат неопределенности, разреженных двуточечных матриц, которые не содержат неопределенности, двуточечных матриц, которые содержат ограниченную неопределенность, двуточечных матриц, которые содержат неограниченную неопределенность (т. е. искаженные данные), или любой их комбинации. Модуль уточнения координат 622 может также быть запрограммирован на введение дополнительных объектов или точек данных в группу объектов,как это описано выше. Модуль уточнения координат 622 генерирует исправленные координаты 624, которые возвращаются в координатный модуль 616. Данный процесс повторяется для дополнительных подгрупп координат 618 и ассоциированных взаимосвязей 620, и предпочтительно повторяется на аналогичных подгруппах взаимосвязь/координаты 618 и ассоциированных взаимосвязях 620 до тех пор, пока не будет достигнут заранее заданный интервал или не будет удовлетворен некоторый другой критерий. В варианте выполнения изобретения, если желательно визуализировать взаимосвязи между объектами, координаты 626 могут быть переданы для отображения на необязательный модуль визуализации 628. Уточненные координаты 626 передаются на необязательный модуль визуализации 628 до тех пор, пока не закончится итеративный процесс согласно изобретению. В. Реализация изобретения в виде средства программного обеспечения компьютера. Настоящее изобретение может быть реализовано с использованием одного или нескольких компьютеров. Компьютер 202, приведенный на фиг. 2 в качестве примера, включает один или несколько процессоров, например, таких, как процессор 204. Процессор 204 подключен к каналу связи 206. Различные варианты программного обеспечения описываются в условиях данной компьютерной (вычислительной) системы,приведенной в качестве примера. Из данного описания специалистам в соответствующей области (областях) знаний, станет понятно, как можно воплотить данное изобретение, используя другие вычислительные системы и/или архитектуры вычислительных систем. Компьютер 202 включает также оперативную память 208, предпочтительно запоминающее устройство с произвольным порядком доступа (RAM), и может также включать одно уст 23 ройство внешней памяти 210 или более. Устройства внешней памяти 210 могут включать,например, накопитель на жестком диске 212 и/или накопитель на сменных носителях 214,например, накопитель на гибких дисках, устройство чтения магнитной ленты, накопитель на оптических дисках и т.д. Накопитель на сменных носителях 214 обычным способом читает и/или записывает данные на сменный носитель информации 216. Сменный носитель информации 216 представляет собой гибкий магнитный диск, магнитную ленту, оптический диск и т.д.,информация которых считывается и записывается накопителем на сменных носителях 214. Сменный носитель информации 216 включает носитель данных, который компьютер может использовать для хранения программного обеспечения и/или данных. В альтернативных вариантах выполнения изобретения компьютер 202 может включать другие аналогичные средства, позволяющие загружать компьютерные программы или другие команды в компьютер 202. Такие средства могут включать, например, сменный носитель информации 220 и интерфейс 218. В качестве примера такого оборудования можно указать программный картридж и картридж интерфейса(аналогично тем, что можно найти в устройствах для видеоигр), сменный чип памяти (типаPROM - ППЗУ) и соответствующий разъем, а также другие сменные модулей памяти 220 и интерфейс 218, которые позволяют производить передачу программного обеспечения и данных со сменного модуля памяти 220 на компьютер 202. Компьютер 202 может также включать коммуникационный интерфейс 222. Коммуникационный интерфейс 222 позволяет передавать программное обеспечение и данные между компьютером 202 и внешними устройствами. В качестве примеров коммуникационного интерфейса 222 можно указать, но не ограничиваясь этими примерами, модем, сетевой интерфейс(типа Ethernet карты), коммуникационный порт,слот и карты PCMCIA и т.д. Программное обеспечение и данные передаются через коммуникационный интерфейс 222 в форме сигналов(обычно данные на носителе), который могут представлять собой электронные, электромагнитные, оптические или другие сигналы, которые могут быть приняты коммуникационным интерфейсом 222. В данном описании понятие "средство программного обеспечения компьютера" применяется для общего обозначения носителя,такого как сменные носители информации 216 и 220, жесткие диски 212, которые могут быть удалены из компьютера 202, а также сигналы,несущие программное обеспечение, получаемое коммуникационным интерфейсом 222. Указанные компьютерные программы представляют 24 собой средства для обеспечения компьютера 202 программным обеспечением. Программное обеспечение компьютера(другое название - логика управления ЭВМ) хранится в оперативной памяти и/или на устройствах внешней памяти 210. Программное обеспечение может также быть получено через коммуникационный интерфейс 222. В процессе выполнения такие компьютерные программы позволяют компьютеру 202 реализовать особенности настоящего изобретения, которые были изложены в данном документе. В частности, в процессе своего выполнения компьютерные программы позволяют процессору 204 реализовать особенности настоящего изобретения. Соответственно, такое программное обеспечение представляют собой контроллеры компьютера 202. В варианте выполнения, в котором изобретение реализовано с использованием программного обеспечения, это программное обеспечение может быть сохранено в компьютерной программе и загружено в компьютер 202 с использованием накопителя на сменных носителях 214, жесткого диска 212, и/или коммуникационного интерфейса 222. При выполнении процессором 204 логика управления (программное обеспечение) заставляет процессор 204 реализовывать свойства настоящего изобретения, которые были изложены в данном документе. В другом варианте выполнения часть изобретения, которая автоматизирована, реализуется, в основном, или полностью, с помощью аппаратных средств. Примером таких аппаратных компонент могут служить специализированные интегральные схемы (ASIC). Реализация аппаратно реализованного конечного автомата, который мог бы выполнять функции, изложенные в данном документе, будет очевидна специалистам в соответствующей области (областях) знаний. В еще одном варианте выполнения изобретение реализовано с использованием комбинации аппаратных средств и программного обеспечения. В качестве компьютера 202 может быть выбран любой подходящий компьютер (вычислительная машина), подобный компьютеру, на котором работает операционная система, поддерживающая графический интерфейс пользователя и среду работы с окнами. Подходящими компьютерными системами являются SiliconGraphics, Inc. (SGI) рабочая станция/сервер, рабочая станция/сервер Sun, рабочая станция/сервер DEC, рабочая станция/сервер IBM,IBM совместимый персональный компьютер,Apple Macintosh, или любая другая подходящая компьютерная система, однопользовательская, с одним процессором семейства Intel Pentium,Pentium Pro, или Pentium II или более. Подходящими операционными системами являются(но не ограничиваясь данным перечнем) IRIX, 25Microsoft, Apple Mac OS, или любая другая операционная система. Например, в варианте выполнения программа может быть реализована и работать на рабочей станции Silicon GraphicsOctane под управлением операционной системыIRIX 6.4, и использовать графический интерфейс пользователя Motif, на базе X WindowSystem. С. Функционирование настоящего изобретения. На фиг. 7 показано функционирование настоящего изобретения в виде блок-схемы процесса 700. Функционирование настоящего изобретения показано для общего случая, когда матрица взаимосвязей 614 является полной двуточечной матрицей взаимосвязей без неопределенностей. Основываясь на приведенных выше описаниях и блок-схеме 700, специалисты в соответствующей области (областях) знаний смогут изменить блок-схему 700, приспособив ее к другим ситуациям, когда, например, матрица взаимосвязей 614 - это разреженная n-мерная или двуточечная матрица взаимосвязей без неопределенности; матрица взаимосвязей 614 - этоn-мерная или двуточечная матрица взаимосвязей с ограниченной неопределенностью; где матрица взаимосвязей 614 - это двуточечная матрица взаимосвязей с неограниченной неопределенностью (т. е. искаженные данные); и т.д. Для общего случая, когда матрица взаимосвязей 614 - это полная двуточечная матрица взаимосвязей без неопределенности, процесс начинается на шаге 702, на котором координатный модуль 616 получает из базы данных взаимосвязей 614 матрицу взаимосвязей 612. На шаге 704 координатный модуль 616 назначает начальные координаты объектам, связанным с взаимосвязями в матрице взаимосвязей 614. Назначение начальных координат может быть сделано случайным образом. В качестве альтернативы, начальные координаты могут быть предварительно упорядоченными или частично предварительно упорядоченными. На шаге 706 из матрицы взаимосвязей 614 для уточнения выбирается подгруппа взаимосвязь/координаты 618. Подгруппа 618 может быть выбрана случайно, псевдослучайно, систематично, частично систематично, и т.д. Выделение происходит с помощью модуля выделения подгруппы 638. На шаге 708 выбранное подмножество 618 и ассоциированная взаимосвязь 620 передаются на модуль пересмотра координат 622. Модуль уточнения координат 622 производит уточнение координат в подгруппе взаимосвязь/координаты 618, которое базируется на ассоциированных взаимосвязях 620. На шаге 710 принимается решение о необходимости выбрать другую подгруппу для уточнения координат. Если другая подгруппа взаимосвязь/координаты 618 должно быть уточ 003796 26 нено, процесс обработки возвращается на шаг 706 выбора другой подгруппы взаимосвязь/координаты 618. В противном случае процесс обработки останавливается на шаге 712. В необязательном варианте выполнения изобретения на шаге 714 координаты 626 передаются для отображения на необязательный модуль визуализации 628. Шаг 714 может быть выполнен в любой момент в течение одного или более шагов 706-712. В другом необязательном варианте выполнения изобретения данные взаимосвязей 630 генерируются до шага 702. В этом необязательном варианте выполнения изобретения оценочные свойства 636 получены на шаге 716. На шаге 718 на основе оценочных свойств генератор взаимосвязей 634 генерирует данные взаимосвязей 630. На шаге 720 данные взаимосвязей 630 передаются в базе данных взаимосвязей 612. Обработка продолжается до шага 702, когда данные взаимосвязей 630 в форме матрицы взаимосвязей 614 передаются на координатный модуль.X. Пример использования изобретения. Настоящее изобретение может быть реализовано в ряде приложений и для различных типов данных. В варианте выполнения настоящее изобретение может быть реализовано как система, способ, и/или средство программного обеспечения компьютера для визуализации и интерактивного анализа данных, относящихся к химическим соединениям, где расстояния между объектами в многомерном пространстве представляют собой сходства и/или несходства между соответствующими соединениями (по отношению к выбранным особенностям или свойствам соединений) и могут быть вычислены с помощью некоторого заранее описанного метода. Результирующие отображения могут быть показаны с помощью подходящего графического устройства (такого, например, как графический терминал), и подвергнуты анализу в интерактивном режиме, что позволит выявить взаимосвязи между данными и инициализировать набор задач, связанных с этими соединениями. Пользователь может выбрать для отображения группу соединений, а также методику оценки сходства/несходства между выбранными соединениями. Видимое отображение может быть сгенерировано в соответствии с выбранными соединениями и выбранной методикой. Для каждого из выбранных соединений выводимое отображение имеет точку, в которой расстояние между любыми двумя точками представляет сходство/несходство между соответствующими соединениями. В этом случае отображается часть выводимого отображения. Пользователи получают возможность интерактивно анализировать соединения, представленные на дисплейной карте. В качестве альтернативы,каждая из точек может соответствовать группе соединений или объектов. 27 На фиг. 1 приведена структурная схема вычислительной среды 102 в соответствии с предпочтительным вариантом выполнения настоящего изобретения. Модуль визуализации химических данных и интерактивного анализа 104 включает модуль генерации отображения 106, а также одну или более вспомогательную компоненту интерфейса пользователя 108. Модуль генерации отображения 106 определяет наличие сходства между химическими соединениями относительно одной или более выбранных особенностей или свойств (здесь иногда упоминаемых как оценочные свойства или особенности) соединений. Модуль генерации отображения 106 реализует данную функцию путем восстановления и анализа данных о химических соединениях и реактивах, получаемых из одной базы данных 120 или более. Модуль визуализации химических данных и интерактивного анализа 104 связывается с одной базой данных 120 или более через канал передачи данных 118. Канал передачи данных 118 представляет собой, предпочтительно, любой тип средства передачи данных, например,шину передачи данных, компьютерную сеть и т.д. Модули интерфейса пользователя 108 отображают, предпочтительно, двумерное или трехмерное выводимое отображение на подходящем графическом устройстве. Модули интерфейса пользователя 108 позволяют человекуоператору интерактивно анализировать и обрабатывать информацию выводимого отображения, так, чтобы выявить взаимосвязи между данными и инициализировать список задач, относящихся к соответствующим соединениями. Модули интерфейса пользователя 108 дают пользователям возможность организовать соединения во группу (представляющие, например, комбинаторную библиотеку). Информация,принадлежащая, группам соединений, предпочтительно, хранится в одной или более базах данных 120. Устройство (устройства) ввода данных 114 принимают входную информацию (такую, как данные, команды, запросы, и т.д.) от человекаоператора и через канал передачи данных 118 передают ее, например, на модуль визуализации химических данных и интерактивного анализа 104. В настоящем изобретении может использоваться любое хорошо известное подходящее устройство ввода данных, например, клавиатура,координатно-указательное устройство(мышь, шаровой ролик, шаровой манипулятор,световое перо, и т.д.), сенсорный экран, устройство распознавания речевых команд, и т.д. В случае необходимости, вводимая пользователем информация может также быть сохранена и затем восстановлена из файлов данных/команд. Устройство (устройства) вывода 116 осуществляют вывод информации человеку 003796 28 оператору. В настоящем изобретении может использоваться любое хорошо известное подходящее устройство вывода данных, например,монитор, принтер, накопитель на гибком магнитном диске, или другое запоминающее устройство, речевой синтезатор и т.д. Модуль визуализации химических данных и интерактивного анализа 104 может взаимодействовать с одними или более вычислительными модулями 122 через канал передачи данных 118. Компоненты, показанные в вычислительной среде 102 на фиг. 1 (например, модуль визуализации химических данных и интерактивного анализа 104), могут быть реализованы с применением одного или более компьютеров,таких как компьютер из примера 202, показанный на фиг. 2. А. Функционирование предпочтительного варианта изобретения. Ниже, со ссылкой на блок-схему 302, приведенную на фиг. 3, будет описано функционирование настоящего изобретения в том виде, как оно реализовано для визуализации и интерактивной обработки химических соединений в выводимом отображении. Если не оговорено иначе, описываемое ниже взаимодействие с пользователями происходит при работе модулей интерфейса пользователя 108 (фиг. 1). На шаге 304 пользователь выбирает одно или более соединение для отображения на новом выводимом отображении. Пользователь может выбирать соединения для отображения путем извлечения списка соединений из файла,путем ручного ввода списка соединений и/или с использованием графического интерфейса пользователя (GUI). Изобретение предполагает наличие других средств, позволяющих пользователю указать соединения для отображения на дисплейной карте. На шаге 306 пользователь выбирает метод,используемый для оценки молекулярного сходства или несходства между соединениями, выбранными на шаге 304. В данном варианте выполнения сходство/несходство между соединениями, выбранными на шаге 304, определяется(на шаге 308) исходя из заранее заданного множества оценочных свойств. Как описано выше,оценочными могут быть любые свойства, связанные со структурой, функционированием или идентичностью соединений, выбранных на шаге 304. Оценочные свойства включают, но не ограничиваясь, структурные свойства, функциональные свойства, химические свойства, физические свойства, биологические свойства, и т.д. соединений, выбранных на шаге 304. В одном из вариантов выполнения настоящего изобретения, выбранные оценочные свойства могут быть шкалированы по-другому,что позволяет отразить их относительную важность при оценке схожести (сходства или несходства) двух соединений. Соответственно, как 29 и на шаге 306, для каждого из выбранных оценочных свойств пользователь выбирает коэффициент шкалирования (коэффициент Ламе). Обратите внимание, что такой выбор коэффициентов Ламе является необязательным. Пользователю не нужно выбирать коэффициент Ламе для каждого выбранного оценочного свойства. В случае, когда пользователь не выбрал коэффициент Ламе для данного оценочного свойства, этому оценочному свойству по умолчанию присваивается коэффициент Ламе, равный единице. В качестве альтернативы, на шаге 306 пользователь может по своему выбору получить из источника, например, из базы данных, значения сходства/несходства относящиеся к соединениям, выбранным на шаге 304. Эти значения сходства/несходства, полученные из базы данных, были сгенерированы предварительно. В другом варианте выполнения на шаге 306 пользователь может принять решение о выборе значений сходство/несходство с помощью любой известной методики или процедуры. На шаге 308 модуль генерации отображения 106 генерирует новое выводимое отображение. Это новое выводимое отображение содержит точку для каждого из соединений, выбранных на шаге 304. Кроме того, на этом новом выводимом отображении расстояние между любыми двумя точками является производным от степени сходства/несходства между соответствующими соединениями. Далее, со ссылкой на блок-схему 402, приведенную на фиг. 4, будет описан способ, которым модуль генерации отображения 106 генерирует новое выводимое отображение. На шаге 404 на новом выводимом отображении задаются первоначальные значения координат точек, соответствующих соединениям,выбранным на шаге 304. На шаге 406 выбираются для обработки два соединения i, j, выбранные на шаге 304. На шаге 408 с помощью метода, выбранного пользователем на шаге 306, определяются значения сходство/несходство rij между соединениями i, j. На шаге 410, на основе значения сходство/несходства rij, определенного на шаге 408,рассчитываются координаты точек на дисплейной карте, соответствующих соединениям i, j. На шаге 412 модифицируются параметры обучения. На шаге 414 принимается решение о завершении процесса. Если принято решение в данной точке процесс не завершать, управление передается на шаг 406. В противном случае выполняется шаг 416. На шаге 416 выводимое отображение выводится (т. е. генерация выводимого отображения закончена). Детали, относящиеся к шагам на блоксхеме 402, обсуждались выше. На шаге 312 при 003796 30 веденное на фиг. 3 средство просмотра отображения 112 отображает новое выводимое отображение на устройстве вывода 116 (например,на графическом мониторе компьютера). На шаге 314 модули интерфейса пользователя 108 позволяют операторам интерактивно анализировать и обрабатывать соединения, показанные на отображаемом выводимом отображении. Настоящее изобретение дает возможность пользователям изменять существующие выводимые отображения визуализации соединения(в данном контексте используется понятие "выводимое отображение визуализации соединения", которое относится к ранее представленному выводимому отображению). Например,пользователи могут добавлять в отображение дополнительные соединения, удалять соединения из отображения, выделять соединения на отображении, и т.д. В таких случаях повторяются соответствующие функциональные действия из блок-схемы 302. Например, когда пользователь решит добавить к существующему отображению новые соединения, повторяются шаги 304 (выбор соединения для отображения), 310(генерация выводимого отображения) и 312 (показ отображения). Тем не менее, согласно варианту выполнения изобретения, отображение последовательно уточняется и отображается шагами 310 и 312, когда происходит добавление соединений к существующему выводимому отображению визуализации соединения (это пошаговое увеличение точности описано выше). Упомянутый выше пример химического соединения полезен для визуализации и в интерактивной образа любые объектов, обладающих химическими свойствами, включая, но не ограничиваясь, (но могут использоваться для) небольшие молекулы, полимеры, пептиды, белки,и т.д. Данный пример может также использоваться для отображения различных взаимосвязей сходства между этими соединениями.XI. Выводы. Настоящее изобретение описано выше в виде стандартных функциональных блоков для иллюстрации эффективности указанных функций и взаимосвязей. Границы этих функциональных стандартных блоков были определены в данном документе произвольно, исходя из удобства описания. Альтернативные границы могут быть определены, когда указанные функции и взаимосвязи будут соответствующим образом представлены. Таким образом, любые такие дополнительные границы находятся в пределах объема и относятся к сущности заявленного изобретения, что должно быть понятно специалистам в соответствующей области (областях) знаний. Эти функциональные стандартные блоки могут быть реализованы дискретными компонентами, с помощью специализированных интегральных схем, процессоров, на которых вы 31 полняется соответствующее программное обеспечение и т.п., или любого их сочетания. Специалисту в соответствующей области (областях) знаний, будет вполне по силам разработать соответствующую схему и/или программное обеспечение для реализации этих стандартных функциональных блоков. С помощью приведенных выше описаний и примеров специалисту в соответствующей области (областях) знаний будет не сложно реализовать настоящее изобретение для широкого спектра приложений, каждое из которых попадает в объем данного изобретения. Хотя выше и были описаны различные варианты выполнения настоящего изобретения,необходимо понимать, что они были приведены только в качестве примера, и не являются ограничивающими. Таким образом, объем и сущность настоящего изобретения не должны быть ограничены любым из приведенных выше описаний предпочтительных вариантов выполнения, а должны быть определены только в соответствии со следующими пунктами формулы изобретения и их эквивалентными признаками. ФОРМУЛА ИЗОБРЕТЕНИЯ 1. Способ воспроизведения данных о сходстве объектов в многомерном пространстве посредством воспроизведения взаимосвязи между объектами в качестве расстояния от одного к другому на дисплейной карте, отличающийся тем, что сначала объектам присваивают координаты и помещают объекты на дисплейной карте в соответствии с присвоенными им координатами, затем выделяют подгруппу объектов по признакам ассоциированных взаимосвязей между объектами, после чего, уточняя координаты объектов, видоизменяют расстояния между объектами на дисплейной карте на основании взаимосвязей между объектами и расстояниями между ними и после этого повторяют выделение подгрупп и видоизменение расстояний, как сказано выше, и получают дополнительные подгруппы объектов из общей группы объектов,при этом видоизмененные расстояния между объектами отображают относительные взаимосвязи между объектами. 2. Способ по п.1, отличающийся тем, что выделение подгрупп объектов производят парами объектов по признакам двуточечной ассоциированной взаимосвязи. 3. Способ по п.2, отличающийся тем, что в случае неизвестности взаимосвязей между по меньшей мере одной парой объектов выделение подгрупп объектов, видоизменение расстояний и повторение выделения подгрупп и видоизменение расстояний осуществляют для пар объектов, ассоциированные взаимосвязи между которыми известны, а для пар объектов с неизвестными взаимосвязями расстояния адаптируют с приведением их к значениям, обеспечивающим 32 удовлетворительное вложение для известных взаимосвязей. 4. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам ограниченной неопределенности видоизменение расстояния на дисплейной карте между парой объектов,имеющих взаимосвязь по признаку ограниченной неопределенности, осуществляют по набору допустимых диапазонов значений взаимосвязи только при условии, если это расстояние выходит за пределы вышеназванных диапазонов. 5. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам ограниченной неопределенности видоизменение расстояния на дисплейной карте между парой объектов,имеющих взаимосвязь по признаку ограниченной неопределенности, осуществляют по верхнему пределу допустимого значения взаимосвязи только при условии, если это расстояние по значению близко к вышеназванному верхнему пределу. 6. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам ограниченной неопределенности видоизменение расстояния на дисплейной карте между парой объектов,имеющих взаимосвязь по признаку ограниченной неопределенности, осуществляют по нижнему пределу набора диапазонов допустимых значений взаимосвязи только при условии, если это расстояние выходит за пределы вышеназванных диапазонов. 7. Способ по п.2, отличающийся тем, что в случае взаимосвязей между по меньшей мере одной парой объектов по признакам неограниченной неопределенности дополнительно проводят идентификацию пары объектов, имеющих взаимосвязь по признакам неограниченной неопределенности, далее удаляют взаимосвязь с признаками неограниченной неопределенности и после этого адаптируют расстояние между объектами по признакам соответствующих взаимосвязей посредством повторения выделения подгрупп объектов, видоизменения расстояний и нового повторения выделения, с приведением указанного расстояния к значению,обеспечивающему удовлетворительное вложение для известных взаимосвязей. 8. Способ по п.2, отличающийся тем, что видоизменение расстояний осуществляют итеративно в соответствии с уравнением: где t - номер текущей итерации, xi(t) и xj(t)- текущие координаты i-гo и j-гo объектов на дисплейной карте, rij - взаимосвязь между i-м иj-м объектами, dij = xi(t) - xj(t) - расстояние между i-м и j-м объектами и (t) - переменный или постоянный параметр. 33 9. Способ по п.8, отличающийся тем, что параметрзадают постоянным в процессе видоизменения расстояний между объектами. 10. Способ по п.8, отличающийся тем, что параметрзадают монотонно убывающим в процессе видоизменения расстояний между объектами. 11. Способ по п.8, отличающийся тем, что параметрзадают переменным в зависимости от i, j и/или rij в процессе видоизменения расстояний между объектами. 12. Способ по п.11, отличающийся тем, что параметрзадают как функцию взаимосвязи между избранной парой объектов rij и определяют, в частности, по формуле или по формуле где mах и min - начальное и конечное значения, причем mах, min[0,1], Т - общее число итераций, t - текущий номер итерации, а - постоянный коэффициент шкалирования. 13. Способ по п.11, отличающийся тем, что параметрзадают как функцию по меньшей мере одного избранного объекта. 14. Способ по п.11, отличающийся тем, что параметрзадают как функцию избранной пары объектов. 15. Способ по п.1, отличающийся тем, что видоизменение расстояний осуществляют посредством метода многомерного шкалирования. 16. Способ по п.1, отличающийся тем, что видоизменение расстояний осуществляют посредством метода нелинейного шкалирования. 17. Способ по п.1, отличающийся тем, что видоизменение расстояний осуществляют посредством получения значения функции ошибки и последующим уточнением расстояния посредством метода градиентного спуска. 18. Способ по п.1, отличающийся тем, что указанные объекты являются нехимическими. 19. Способ воспроизведения данных о сходстве объектов в многомерном пространстве посредством воспроизведения взаимосвязи между объектами в качестве расстояния от одного к другому на дисплейной карте, отличающийся тем, что сначала помещают объекты на дисплейной карте, затем выделяют подгруппу объектов по признакам ассоциированных взаимосвязей между объектами, после чего выделяют в вышеназванной подгруппе пару объектов,имеющих ассоциированную двуточечную взаимосвязь, после этого видоизменяют расстояния между парами объектов на дисплейной карте на основании взаимосвязей между парами объектов и расстояниями, после чего повторяют выделение вышеуказанных пар и видоизменение расстояний, как сказано выше, и получают до 003796 34 полнительные пары объектов из общей группы объектов. 20. Способ по п.19, отличающийся тем, что дополнительно осуществляют выделение второй подгруппы объектов и затем итеративно повторяют выделение пар объектов и видоизменение расстояний во второй выделенной подгруппе объектов. 21. Устройство воспроизведения данных о сходстве объектов в многомерном пространстве посредством воспроизведения взаимосвязи между объектами в качестве расстояния от одного к другому на дисплейной карте, отличающееся тем, что оно снабжено координатным модулем размещения объектов на дисплейной карте, модулем выделения подгруппы объектов и пересмотра расстояний между ними и модулем пересмотра координат и пересмотра расстояний между объектами в выделенной подгруппе на основе разности между расстояниями и соответствующими взаимосвязями, при этом вход модуля выделения подгруппы объектов и пересмотра расстояний между ними связан с выходом координатного модуля размещения объектов на дисплейной карте, выход модуля выделения подгруппы объектов и пересмотра расстояний между ними связан с входом модуля пересмотра координат и пересмотра расстояний между объектами в выделенной подгруппе, а вход координатного модуля размещения объектов на дисплейной карте связан с выходом модуля пересмотра координат и пересмотра расстояний между объектами в выделенной подгруппе. 22. Устройство по п.21, отличающееся тем,что оно дополнительно содержит модуль выделения подгруппы, выделения пары объектов и пересмотра расстояния между ними. 23. Устройство по п.21, отличающееся тем,что оно дополнительно содержит модуль выделения подгруппы, состоящей из по меньшей мере двух объектов, и пересмотра расстояния между ними, и модуль пересмотра координат и расстояния между объектами в выделенной подгруппе. 24. Устройство по п.23, отличающееся тем,что оно дополнительно содержит модуль пересмотра координат, вычисления значения функции ошибки и пересмотра расстояния посредством метода градиентного спуска. 25. Устройство по п.23, отличающееся тем,что оно дополнительно содержит модуль пересмотра координат и вычисления значения функции ошибки посредством метода многомерного шкалирования. 26. Устройство по п.23, отличающееся тем,что оно дополнительно содержит модуль пересмотра координат и вычисления значения функции ошибки посредством метода нелинейного шкалирования.
МПК / Метки
МПК: G06T 11/20
Метки: пространстве, способ, многомерном, данных, варианты, сходстве, устройство, воспроизведения, объектов
Код ссылки
<a href="https://eas.patents.su/19-3796-sposob-varianty-i-ustrojjstvo-vosproizvedeniya-dannyh-o-shodstve-obektov-v-mnogomernom-prostranstve.html" rel="bookmark" title="База патентов Евразийского Союза">Способ (варианты) и устройство воспроизведения данных о сходстве объектов в многомерном пространстве</a>
Предыдущий патент: Устройство и способ оптического воспроизведения изображения особенностей на поверхности руки
Следующий патент: Способ и система защиты связи
Случайный патент: Способ получения олефинов