Распознавание по компонентам — теория разработанная профессором когнитивной нейробиологии в Университете Южной Калифорнии Бидерманом (Biederman)[1], согласно которой распознавание объектов происходит посредством наблюдения граней объектов и декомпозиции (разложения) объектов на геоны[неизвестный термин]. Комбинации ограниченного числа геонов могут формировать огромное разнообразие объектов. Геоны обладают свойством элементарности и инвариантности к точке наблюдения, поэтому объекты, распознаваемые посредством декомпозиции на геоны, распознаются хорошо в условиях различной освещённости и зрительного шума, из разной перспективы. Невозможна зрительная идентификация посредством распознавания по компонентам объектов с неопределёнными границами и лица человека.
Теория геонов (geon theory), также известная как теория распознавания по компонентам (Recognition-by-Components, RBC), была сформулирована Ирвингом Бидерманом из Университета Южной Калифорнии в 1987 году.
Представления Бидермана о восприятии формы основаны на понятии геон (сокращение от «геометрические ионы»). Согласно этой концепции, все сложные формы состоят из геонов, и мозг использует ограниченный набор базовых форм (называемых геонами) для интерпретации форм в реальном мире. Это упрощает наше непосредственное восприятие и уменьшает количество деталей в памяти, что позволяет избежать сенсорной перегрузки. Наш мозг упрощает визуальное восприятие форм, превращая их в сборки геонов.
Эта теория является одной из ключевых моделей в когнитивной науке, объясняющей, как люди распознают и идентифицируют трехмерные объекты, основываясь на их компонентных частях.
Исследования в области восприятия объектов начали активно развиваться в середине XX века. Несколько ключевых этапов привели к появлению теории геонов:
В 1987 году Ирвинг Бидерман предложил теорию распознавания по компонентам (RBC), основываясь на следующих наблюдениях и исследованиях:
После публикации теории Бидерманом, она стала объектом интенсивных исследований и дебатов:
Современные исследования продолжают развивать и уточнять теорию геонов:
На сегодняшний день теория геонов продолжает оставаться влиятельной моделью в когнитивной науке и компьютерном зрении. Она находит применение в различных областях, включая робототехнику, искусственный интеллект и нейронауки.
Теория геонов внесла значительный вклад в понимание механизмов визуального восприятия. Она предоставила структурированную модель, объясняющую, как мозг декомпозирует и реинтегрирует визуальную информацию для распознавания объектов. Теория геонов помогла заложить основу для последующих исследований в областях нейронауки и психологии восприятия.
В области компьютерного зрения теория геонов оказалась полезной для разработки алгоритмов распознавания объектов. Модели, основанные на этой теории, демонстрируют высокую устойчивость к вариациям освещения, углов обзора и частичной окклюзии. Такие алгоритмы применяются в робототехнике, системах безопасности и анализе изображений.
В искусственном интеллекте теория геонов способствует разработке систем, способных к автономному восприятию и анализу окружающей среды. Эти системы используют принципы разложения объектов на базовые компоненты для улучшения точности и эффективности распознавания.
Хотя теория геонов получила широкое признание, она также подвергалась критике. Основные замечания включают: