Hypothesis Factory

ИИ-инструмент, который генерирует и ранжирует научные гипотезы для материаловедческих проектов

Загрузите данные и KPI → получите ранжированный список проверяемых гипотез с обоснованием, источниками и планом эксперимента

Как сейчас запускают НИОКР

Гипотезы зависят от памяти одного эксперта

Субъективный отбор: какие идеи эксперт помнит, те и попадают в план

Отчёты копятся в архивах

Десятки отчётов и статей не переиспользуются — знания теряются

Нет единой системы оценки

Нет ответа: что действительно ново, что рискованно, что ценнее

Старт проекта занимает недели вместо дней

От задачи к экспериментам за минуты

Вход

  • KPI / целевое свойство
  • Ограничения
  • Документы, статьи, отчёты

Система

  • Поиск по литературе
  • Построение графа знаний
  • Генерация по 4 стратегиям
  • Оценка и ранжирование

Выход

  • 5–10 гипотез с обоснованием
  • Оценки: новизна, риск, ценность
  • План эксперимента
  • Дорожная карта проверки

Пайплайн: 5 специализированных агентов

Literature Scout

Поиск релевантных статей по Semantic Scholar, arXiv

Ingestion Agent

Индексация в RAG + построение графа знаний (Wikontic + Wikidata)

Analyst

Hybrid search: RAG + граф → матрица покрытия, противоречия

Generator

4 стратегии генерации: Gap · Swanson · Contradiction · Analogy

итеративная доработка

Critic

Скоринг по 6 критериям + ранжирование

4 стратегии — не одна LLM, а системный поиск

Gap Analysis

Матрица покрытия: какие комбинации (материал × режим) ещё не исследованы

Swanson (LBD)

A связан с B, B связан с C, но A→C не проверяли. Классика hypothesis generation с 1986 г.

Contradiction Mining

Похожие условия, разные результаты = нерешённый вопрос = гипотеза для разрешения конфликта

Cross-domain Analogy

Если зависимость X→Y работает для сплава A, сработает ли для сплава B?

Каждая стратегия работает независимо → результаты объединяются и ранжируются

Два «глаза» системы: структура + семантика

Граф знаний (Wikontic)

Точные факты

«при 1400°C с 2% Y₂O₃ получили K_IC = 8.5 MPa·m½»

  • Матрица покрытия
  • Белые пятна
  • Противоречия
  • Цепочки Свансона

Векторный поиск (RAG)

Семантический контекст

«механизмы упрочнения в керамиках...»

  • Неявные аналогии
  • Контекст
  • Что не сработало

Evidence Bundle → в Generator

Каждая гипотеза — готова к лаборатории

#1

Гипотеза H-001

Добавление 0.3% Nb в сплав X при отжиге Y повысит жаропрочность за счёт NbC

Новизна
0.71
Обоснованность
0.85
Реализуемость
0.90
Эффект
0.78
Риски
0.35
📄 3 источника🧪 12 образцов, 3 недели✗ Опровергается если: прирост <5%
НовизнаОбоснованностьРеализуемостьЭффект

Не «попробуйте ниобий», а конкретный эксперимент с критерием опровержения

Прозрачность на каждом шаге

Report 2024-031

«NbC стабильны до 1100°C»

conf: 0.89

H-001: Добавка 0.3% Nb

arXiv 2025.xxxxx

найдена автоматически

«дисперсные карбиды повышают...»

conf: 0.91

Эксперт видит всю цепочку: документ → извлечённый факт → стратегия генерации → гипотеза → оценка. Может скорректировать на любом этапе.

От гипотезы к эксперименту: дорожная карта проверки

Неделя:
123456
H-001: Добавка Nb
Подготовка
Отжиг
Испытания
Решение
H-003: Новый режим
Подготовка
Тестирование
Решение
Ресурсы
Вак. печь
⚠️ Конфликт ресурсов нед. 1–2

Система учитывает зависимости между гипотезами и общие ресурсы

Технологический стек

LLM

GigaChat-2 / GigaChat-2-Max

Wikontic

Онтологии + Wikidata (AAAI'26)

RAG

BM25 + Vector + Reranker

Литература

Semantic Scholar, arXiv, OpenAlex, CrossRef, патенты

UI

React / Next.js

Экспорт

PDF / DOCX / JSON / CSV

  • Мультиязычность: RU / EN / ZH
  • Мультипровайдерность: GigaChat, NeuralDeep, OpenAI
  • Масштабируемость на новые домены

Как это работает

Загрузка документов15 PDF + KPI
Поиск литературы→ 47 статей
Граф знаний→ 312 узлов
Генерация гипотез→ 4 стратегии
Ранжирование→ 8 гипотез