О проекте

omnia in omnibus

Inspert

Руководство пользователя


Цель Inspert – организация упорядоченного сбора тематической информации для научных исследований и образования. Конструктор помогает быстро и легко составлять и отправлять в открытые интернет-ресурсы сложные поисковые запросы, а также промпты для ChatGPT. Тематика конструктора - связь любых понятий в контексте истории или других социальных и гуманитарных наук.

Глобальная задача – демонстрация и продвижение новой концепции расширенного (продвинутого) поиска (advanced search). Предлагаемый сервис - это не просто ещё один интерфейс пользователя, – это воплощение инновационного подхода к планированию научного исследования или индивидуальных траекторий самообразования. Это попытка разработать своеобразную тематическую "дорожную карту" для прокладывания научных направлений или составления образовательных программ. Inspert – это не только инструмент поиска, но также инструмент познания.

Локальная прикладная задача поискового сервиса: создание новых форм интеграции электронных ресурсов Научной библиотеки Томского Государственного Университета (ТГУ) в научно-исследовательские, образовательные и просветительские проекты.

Концепция проекта

Философские истоки

Особенности и возможности

Концепция проекта

В научно-фантастическом романе «Осмотр на месте» (1982) Станислав Лем так описывает цивилизацию, в которой наука достигла критической стадии информационного кризиса: «…Ученые все чаще приходили к убеждению, что исследуемое явление кем-то где-то наверняка подробно исследовано, неизвестно только, как найти это исследование … в университетах остались лишь компьютеры-сыщики, которые будут рыться в микропроцессорах всей планеты, чтобы узнать, ГДЕ, в каком закоулке какой машинной памяти хранятся сведения, имеющие решающее значение для проводимых исследований. … специалистам пришлось бы ждать от пятнадцати до шестнадцати лет, прежде чем несущаяся со скоростью света свора сигналов-ищеек успеет составить полную библиографию для задуманного исследования… началась Эпоха Экспедиций в Глубь Науки. Тех, кто планировал эти экспедиции, называли инспертами… Инсперт – эксперт на стадии заглубления (самокопания) науки…». Stanislaw Lem (pl. «Wizja lokalna», 1982). Можно считать, что во 2-м десятилетии XXI века наука приближается к состоянию, описанному Лемом. Как могут и должны изменяться с учетом этого поисковые сервисы?

Самые популярные современные подходы к усовершенствованию тематического он-лайн поиска связаны концепцией семантической паутины и усложнением языка семантического кодирования сайтов. Является ли путь усложнения единственным решением? В своем проекте конструктора комбинаторных поисковых запросов автор исходил из того, что потенциал уже существующих поисковых технологий не исчерпан полностью и нуждается в простых, но эвристических надстройках.

Техническая реализация конструктора названа Inspert по мотивам С. Лема и осуществлена на языке JavaScript. В первой версии поисковые запросы конструируются пока только на русском языке.

Из меню "Предметная область" можно выбирать любую социогуманитарную дисциплину в качестве предметной области поиска. По умолчанию историческая тематика выбрана в качестве исходной. История одна из универсальных наук, так как своя история есть у всего. Любой источник информации о современности со временем становится историческим источником. При более обобщающем взгляде, любая информация - это информация о прошлом. Сущность любого концепта или объекта познания может быть раскрыта через их связи со всеми другими концептами или объектами. Inspert - это попытка создать инструмент для предварительного изучения возможностей моделирования таких связей.


Особенности и возможности

Клиограммы

В Inspert уже на стадии первичного формулирования запроса визуализируются логические комбинации и связи в интересующей тематической области. Для достижения этой цели используются преимущества диаграмм Венна и Диаграмм сходства (Affinity Diagram). Графические интерфейсные формы для конструирования поисковых запросов названы автором клиограммами (Cliograms). Название составлено из имени Клио (древнегреческая Муза Истории) и слова «диаграмма». В клиограммах много тематических списков для фильтрации и может быть несколько кнопок запуска поиска, при этом каждая кнопка запускает поиск с разными критериями.

Ранжирование результатов поиска по-прежнему управляется поисковой машиной, но уже с учетом персонализированной смысловой комбинаторики запроса, которой управляет сам пользователь.

Подробно все клиограммы описаны в Руководстве пользователя

Решение проблемы неосведомленности пользователей о возможностях языка поисковых запросов

Большинство пользователей не пользуются языком поисковых запросов, а если и пользуются, то не составляют сложных запросов. Практика показывает, что посредством просвещения и обучения пользователей эта проблема не решается. Желание составлять сложные запросы ограничено временем и объемом. Трудоёмко вручную составлять отдельные запросы, каждый из которых состоит более чем из двадцати слов и такого же количества логических символов языка запросов. Гораздо удобнее, если множество синонимов и слов-исключений для фильтрации вводится целиком и автоматически. При этом конкретное содержание списка синонимов и слов-исключений обусловлено специфическими задачами научного тематического поиска.

Решение проблемы: a) максимизация наглядности и компактности составления сложных поисковых запросов; b) использование систематизированных готовых шаблонов синонимических и тематических гипонимических рядов для автоматизированного генерирования запросов.

подробнее см. Компоненты автоматически формируемого поискового запроса.

Проблема «пузыря фильтров»

Понятие «Пузырь фильтров» («Filter bubble») введено Илаем Парайзером (Eli Pariser) и описано в его книге с одноимённым названием. И. Парайзер критикует использование поисковиками алгоритмов выборочного угадывания того, какую информацию пользователь хотел бы увидеть, основываясь на информации об истории его персонального поиска. В результатах поиска показывается только информация, которая согласуется с прошлыми точками зрения данного пользователя. Вся иная информация пользователю не выводится, поэтому он попадает в своеобразный информационный "пузырь".

Появляются поисковики, не использующие для фильтрации историю поиска и регион регистрации IP-адреса пользователя, например сервис duckduckgo.com. Несмотря на это, проблема «пузыря фильтров» остаётся актуальной для любых поисковых систем, так как ранжирование результатов поисковой выдачи (Search engine results page) неизбежно является своеобразным фильтром. Фильтр ранжирования определяет, что попадёт в первые несколько десятков результатов, дальше которых пользователи обычно не идут. Управлять ранжированием пользователи могут только по метаданным описания сайтов (например, по дате создания) без учета смысловых контекстов содержания на сайте.

Проблема информационного "пузыря" имеет более широкий характер и не ограничивается только техническими аспектами поисковиков. Главный «пузырь фильтров» находится в наших умах. Информационная ловушка начинается, когда исследователь ограничивает поиск только узким кругом заранее известных ему параметров и признаков и отказывается от использования новых ключевых понятий, которые он не привык, или его профессиональное сообщество не привыкло включать в какую-то тематику.

Решение проблемы: Фильтрация информации неизбежна и необходима, но пользователь должен иметь возможность управлять ею в соответствии с тематическими смысловыми аспектами интересующей его области знаний. Исследователь не должен зависеть от навязанных ему скрытых информационных фильтров, учитывающих его предыдущие, а не текущие информационные потребности. Например, поисковый сервис должен уметь искать тексты, касающиеся исторического прошлого или исторической науки, игнорируя при этом омонимические варианты слова «история» ("история браузера", "история болезни" и т.п.). Необходимо, чтобы искались только авторские тексты и по возможности исключались вторичные тексты с коммерческой SEO-оптимизацией, которая игнорирует потребности пользователя и манипулирует недостатками поисковых машин.

В Inspert при составлении информационно-поисковых тезаурусов состав синонимических рядов приспосабливается к специфическим дисциплинарным контекстам путем предварительной проверки релевантности поисковой выдачи для каждого понятия.


Преимущества пользовательского поиска в Inspert

Пользовательский поиск (Custom Search) может содержать три опции: 1) составление создателем постоянной закрытой для пользователя подборки сайтов, внутри которой осуществляется поиск; 2) ручной ввод адресов сайтов для текущего поиска. 3) выбор сайтов из списка.

Преимущество пользовательского поиска в Inspert - отправление сконструированных сложных запросов из одного интерфейса в любые открытые интернет-ресурсы (специализированные сервисы Google, электронные библиотеки, порталы СМИ, социальные сети, биржи вакансий). Структурирование поисковой выдачи по адресам ресурсов, а не только по релевантности, упорядочивает процесс поиска тематической информации с учетом того какие сайты уже просмотрены, а какие - нет.
подробнее см. Пользовательский поиск в Inspert


Решение проблемы онтологической и комбинаторной ограниченности в сервисах вертикального поиска и в электронных библиотеках

Inspert позволяет конструировать и отправлять запросы на любые индексируемые в Google сервера. Конструктор запросов может пониматься как внешнее расширение систем как вертикального поиска (по ограниченной группе доменов), так и горизонтального поиска (по всем сайтам).

Системы вертикального поиска с таксономиями и онтологиями для социальных и гуманитарных дисциплин почти не развиваются. Исключением можно было бы считать поиск по словарям и энциклопедиям, но это поиск скорее локальный, а не вертикальный. Иногда на сайтах или в электронных словарях можно встретить локальные списки гипертекстовых тегов, позволяющих искать информацию внутри сайта. Однако подобные списки не позволяют произвольно комбинировать несколько тематических тегов и учитывать пересечения или исключения понятий.

Самой известной системой вертикального поиска по научным текстам стала Google Scholar (Google Академия в русскоязычном варианте). Google Scholar является также системой индексации сводных библиографических каталогов. Поиск осуществляется по разным научным ресурсам, но без спецификации по дисциплинам. Дисциплинарные таксономии и онтологии в Google Scholar не используются. Такая ситуация ограничивает поддержку уникальных пользовательских задач. Понятийно-терминологические фильтры в Inspert решают данную проблему.

В интерфейсах продвинутого (расширенного) поиска научных электронных библиотек обычно имеются только библиографические поля и перечни научных дисциплин, ключевые слова пользователям предлагается вводить самостоятельно. Пользователь не всегда сможет скомбинировать нужные ключевые слова именно так, чтобы не упустить тексты, которые окажутся для него наиболее полезными. Только для научно-медицинских электронных ресурсов в силу их особой актуальности, используются всеобъемлющий отраслевой стандартизированный тезаурус (MeSH - Medical Subject Headings). Для социальных и гуманитарных дисциплин подобных решений пока не предлагалось. Inspert - это попытка автора разработать исторический предметный рубрикатор (Historical Subject Headings - HiSH). Цель HiSH систематизировать терминологию исторических и социальных наук и предоставлять её в удобном виде для выбора пользователем ключевых слов с учётом гипонимии, синонимии и омонимии.


Философские истоки

Предложенные автором решения имеют несколько концептуальных оснований, которые уходят корнями в средневековую философию и доходят до современности. В хронологическом порядке речь пойдёт об использовании концепций нескольких европейских мыслителей: Раймунда Луллия (Ramon Llull), Афанасия Кирхера (Athanasius Kircher), Рене Декарта (Rene Descartes), Артура Лавджоя (Arthur Lovejoy).

В XIII веке Раймунд Луллий (лат. Raymundus Lullius) создал логический механизм в виде бумажных кругов. В своих трактатах об искусстве памяти он использовал комбинаторно-логические графические фигуры в качестве основного познавательного инструмента. Концепция Луллия была удивительной для своего времени попыткой систематизировать все возможное знание, используя строгую вычислительную процедуру. Луллий предполагал, что действительность есть упорядоченное и постепенное усложнение общих понятий через их различные комбинации друг с другом, а потому разум, следя за логическим порядком понятий, может открывать действительную связь вещей. Система Луллия была предназначена для работы с метафизическими универсалиями. Модификация идей Луллия в сервисе Inspert заключается в комбинаций связей между любыми абстрактными и конкретными понятиями из определённой предметной области.

Графическая фигура на логотипе сайта Inspert в виде полного графа с девятью вершинами – это ассоциация со знаменитой фигурой Раймунда Луллия из книги «Ars Brevis». Согласно замыслу Луллия, пользователь его комбинаторных вращающихся фигур должен был при переборе комбинаций понятий находить связи между ними, черпая идеи в собственном интеллекте и памяти. В Inspert для нахождения связей между понятиями используются результаты интеллектуальной деятельности множества людей, чьи тексты размещены в Интернете.

В XVII веке идеи Луллия развивал Афанасий Кирхер. Кирхер изложил комбинаторный подход к познанию в книге «Ars magna sciendi sive combinatoria» (1669). Он описал проект Tabula alphabetorum artis nostrae – алфавитная таблица знаний, откуда комбинаторно можно вывести «всё возможное». Пансофический проект этого великого мыслителя заключался в составлении суммы знания посредством соотнесения определенного числа базовых концептов по принципам комбинации и аналогии.

Родоначальники комбинаторики опирались на положение о том, что всё связано друг с другом (omnia in omnibus). В контексте воплощения принципа «Omnia in omnibus» Inspert может быть использован в качестве инструмента составления комбинаторно-тематических энциклопедий нового типа. Каждая энциклопедическая статья может описывать связь текущего понятия со всеми остальными понятиями из их полного списка. Нахождение двух понятий в контексте одного абзаца или одного раздела в тексте - это индикатор связи понятий. Такая связь одновременно становится одной из характеристик, по которым данные понятия (явления, события, персоналии и т.д.) могут быть описаны, определены или воплощены.

Первым известным призывом к полноте научного исследования можно считать высказывания Рене Декарта в его книге «Рассуждение о методе» (1606 г.) и в книге «Правила для руководства ума» (1629 г.). Именно в этих книгах можно найти многие истоки современной методологии науки. В «Правилах для руководства ума» VII Правило сформулировано так: «Чтобы придать науке полноту, надлежит все, что служит нашей цели, вместе и по отдельности обозреть в последовательном и нигде не прерывающемся движении мысли и охватить достаточной и упорядоченной нумерацией … зачастую благодаря правильно установленному порядку за короткое время и без особого труда доводится до конца многое, казавшееся на первый взгляд необъятным».

Воплотить такое «движение мысли» удобно с помощью специального поискового сервиса для комбинирования и контаминации ключевых понятий в поисковых запросах. В структурно-функциональном анализе любой социальной или культурно-исторической системы стоит помнить, что анализ будет тем полней и результативней, чем больше связей каждого компонента системы с каждым другим компонентом будет изучено. В идеале нужно стремиться к изучению всех возможных связей между всеми изучаемыми компонентами: связей каждого из участников события с каждым другим, связей микрособытия с разными макрособытиями и явлениями, связей каждого признака, описывающего объект, со всеми без исключения остальными признаками. Inspert предоставляет инструмент для упорядоченного перебора таких связей и для раскрытия актуального состояния этих связей в изучаемом дискурсивном поле (массиве текстов).

Следующая важная для проекта Инсперт идея – «великая цепь бытия». Это понятие предложил в XX веке американский философ Артур Лавджой в книге «Великая цепь бытия: История идеи» (1936). Эта концепция об устройстве Вселенной включает три главных принципа, отразившиеся во всей западной философии:
Изобилие (полнота) — вселенная изобильна, проявляя максимальное разнообразие видов существ и сущностей;
Непрерывность (целостность) — вселенная составлена из бесчисленных рядов форм, каждая из которых разделяет с соседней формой в ряду хотя бы один общий признак;
Градация (иерархия) — ряды форм расположены в иерархическом усложняющемся порядке от самой малой частицы до Универсума.

"Полнота" творения - это ускользающая цель любого познания, часть неизвестной реализованной полноты навсегда осталась в прошлом и уже не восстановится, а другая неизвестная часть еще в будущем. Принцип изобилия подразумевает, что каждое звено в цепи бытия существует ради законченности и полноты всей возможной последовательности форм, осуществление которой – главный законом мироздания. Достижение полноты многообразия означает совершенство (законченность) любой системы знания.

В данном контексте Inspert – это инструмент поиска информации для построения системы исторического или социального знания с максимальной информационной полнотой и непрерывностью её отдельных компонентов и элементов.

А. Лавджой писал, что принцип стремления к полноте проявляет себя в жизни неполного и временного существа как постоянное побуждение к изменениям, к обогащению опыта посредством привнесения нового. Одна из главных задач Inspert – это помощь в стремлении к новым, в том числе редким или никогда не используемым связям идей, понятий и фактов.

А. Лавджой отмечал, что часть связей в Великой цепи бытия возникает случайно, часть закономерно, некоторые закономерности мы поймём, некоторые никогда не заметим, часть возможностей будет когда-нибудь реализована, часть - никогда не будет реализована: все эти оппозиции - также воплощение принципов полноты и симметрии в Великой цепи Бытия.

Структурированный тематический поиск связей между понятиями и терминами посредством Inspert показывает, какие связи реализовались с наибольшей частотой, какие с наименьшей, а какие еще не реализовались или уже никогда не реализуются. Выбор исследователя часто обусловлен одновременно и навязанными модными трендами, и традиционными стереотипами. В результате по одним специфическим проблемам выходит избыточное кол-во публикаций, а по другим – очень мало или ничего. Некоторые лакуны познания, логично вытекающие из предметной области и имеющихся данных, так и остаются неосознанными или незаслуженно заброшенными.

Авторская концепция полноты комбинаторного тематического поиска в Inspert основана именно на предположении о симметрии в системе знаний или научной дисциплине. В научно-исследовательских планах сбора информации и поиска взаимосвязей это предположение часто отсутствует. Предположение о симметрии в развитии знаний требует наличия недостающего элемента. Это означает, что связь определенного понятия с любым другим понятием либо уже есть в каких-то текстах, которые можно найти, либо связь может и должна появиться в текстах, которые ещё будут написаны. Вероятность появления текстов, восполняющих недостающие связи понятий, обусловлена именно принципом симметрии в развитии знаний.

Разработка системы Inspert лежит в сфере – инженерии знаний (knowledge engineering). Инженерия знаний – относительно новая область науки, которая изучает методы и средства извлечения, представления, структурирования и использования знаний при разработке компьютерных экспертных систем. Стоит отметить, что в социогуманитарных науках инженерия знаний применяется чрезвычайно редко.


Планируемые модификации и расширения Inspert

Inspert будет развиваться и совершенствоваться. Исходная версия программы зарегестрирована как Inspert 1.0. (декабрь 2014, свидетельство госрегистрации № 2014662752)

В дальнейшем будут добавлены новые клиограммы для более полного раскрытия тематики исторического и социального познания. Планируется добавить Клиограмму социологии, Клиограмму текстологии, Клиограмму этнологии, Клиограмму экономики, Клиограмму периодизации, Клиограмму лингвистики, Клиограмму психологии. Каждая новая клиограмма будет особой графической интерфейсной формой, отличающейся от других клиограмм.

Inspert 2.0.

Сервис станет двуязычным. Будут составлены тезаурусы для англоязычной терминологии.

В настоящий момент Inspert – целиком индивидуальная авторская разработка.



Научная библиотека Томского Государственного университета
 ^