GRAFO DI CONOSCENZA · ANATOMIA DEL MOTORE

Una rappresentazione deterministica dell'impresa.

NODI

38.412

ARCHI

218.490

ENTITÀ-CLASSI

LATENZA-QUERY

< 200ms

Non un modello probabilistico generico, ma un grafo di entità e relazioni — costruito mentre l'impresa lavora, citato a ogni risposta, salvato sui server dell'azienda.

Questa pagina spiega Lemnia su due piani. Il primo è in italiano piano, leggibile da chi non ha background tecnico. Il secondo, espandibile a richiesta sotto a ogni paragrafo, contiene il dettaglio architetturale per CTO, DPO, commercialisti e consulenti.

§ 01ESPLORATORE INTERATTIVO

DATI DEMO · CLIENTE BIANCHI

Un click su un nodo apre le citazioni di provenienza. Il trascinamento riposiziona; la rotellina del mouse zooma. Il dataset è dimostrativo — il grafo reale di un'azienda viene costruito sui dati che l'impresa sceglie di collegare.

ARCHITETTURA DELL'ESPLORATORE

Rendering via @xyflow/react 12.10 con layout statico precomputato (mulberry32 seed deterministico per riproducibilità tra reload). Il dataset di esempio è statico e annotato a mano. Nel prodotto reale, il grafo è popolato dal motore di ingestione e la navigazione consulta direttamente lo storage SQLite + sqlite-vec via gRPC mTLS LAN.

§ 02PIPELINE · SEI FASI

DAL CONNETTORE ALLA CITAZIONE

FASE 01

Connessione

Lemnia legge i sistemi presenti in azienda — gestionali, ecommerce, posta, calendario, supporto — usando solo le credenziali necessarie per leggere. Mai per scrivere senza un consenso esplicito dell'amministratore.

APPROFONDIMENTO TECNICO

Connettori firmati conformi ai protocolli pubblicati dei sistemi origine (OAuth2 per Microsoft 365 / Google Workspace, API REST per Zucchetti TeamSystem SAP B1, WhatsApp Business Cloud API, IMAP IDLE per posta). Ogni connettore eredita le ACL del sistema d'origine: Lemnia non vede mai dati che l'utente sorgente non vedrebbe.

Le credenziali sono custodite in keychain di sistema (Keychain Access su macOS, Credential Manager su Windows). Mai persistite in chiaro su disco applicativo. Refresh token ruotati ogni 24h. CST.375

FASE 02

Estrazione

Lettura periodica o on-demand. Documenti, righe di registro, messaggi, ordini. Tutto pseudonimizzato in transito e cifrato in archiviazione.

APPROFONDIMENTO TECNICO

Ingestione streaming per i sistemi che supportano webhook + IMAP IDLE; batch polling per gli altri (intervallo configurabile, default 5 min). Sub-5min p95 dal segnale alla visibilità nel dossier. CST.269

Cifratura at-rest AES-256-GCM con DEK per-tenant, KEK custodito da Keychain. Pseudonimizzazione opzionale dei PII durante l'ingestione per categorie configurate dal DPO.

FASE 03

Comprensione

Modelli locali italiani identificano entità — clienti, fornitori, prodotti, pratiche, documenti — e le relazioni tra loro (fattura → ordine → cliente). Disambiguazione assistita sui casi limite.

APPROFONDIMENTO TECNICO

NER + RE addestrati su corpus italiano (medico + business + tributario). Backbone Qwen3.5-4B Q4 per intent comprehension, mDeBERTa-v3-base-italian-NLI per consistency check. CST.333

Disambiguazione via embedding Qwen3-Embedding-0.6B su contesto locale, con fallback su HITL (human-in-the-loop) modal per i casi con confidence < 0.7. Le decisioni di disambiguazione diventano dati di training continuo per il tenant.

Riferimenti SOTA: LightRAG (HKU EMNLP 2025) per estrazione duale entità+relazione su KG locale; HippoRAG 2 per ranking via PageRank personalizzato sul grafo.

FASE 04

Memorizzazione

Grafo locale firmato. Ogni nodo, ogni arco, ogni proprietà conserva una citazione di provenienza — da quale documento, quale riga, quale timestamp viene questo fatto.

APPROFONDIMENTO TECNICO

Schema dual-node: Entity (cliente, fornitore, prodotto, pratica) + Source (documento, email, riga di registro). Ogni arco di tipo SUPPORTS collega un fact a una source con range char-level (offset_start, offset_end) e hash BLAKE3 del contenuto sorgente. CST.30

Storage backend: SQLite con sqlite-vec 0.1.9 per embeddings, rusqlite per tabelle relazionali, RocksDB per il blob store dei documenti originali. Append-only log con sigillo BLAKE3 per ogni transazione, esportabile come prova per audit Art. 30 GDPR.

Community detection: algoritmo Leiden per cluster analysis su entità frequentemente co-occorrenti. Refresh PageRank batched, configurabile per dimensione del grafo. CST.129

FASE 05

Recupero

Quando interrogato, Lemnia percorre il grafo per un massimo di 3 passi e 8 secondi. Il recupero è deterministico — niente agente che si auto-organizza, niente comportamento imprevedibile.

APPROFONDIMENTO TECNICO

Pipeline ibrida BM25 + densi: query parsing → seed nodes via embedding similarity → multi-hop traversal con PPR weighting → cross-encoder reranking (mDeBERTa). Cap di profondità: 3 hop default biz, 2 medico. Cap di tempo: 8s totali, fallback a top-3 evidence se timeout.CST.389

Multi-entity seed weighting: ogni seed pesato per (confidence, PageRank_prior, freshness). La query passa per un classifier deterministico di route (FetchTimeline | FetchMultiHopChain | FetchAggregate | FetchSummary). Nessuna agentic loop sul modello locale.

Riferimento SOTA: PathRAG (AAAI 2026, arXiv 2502.14902) per path-pruning relazionale. Lemnia adotta il prune-flow ma mantiene la generazione deterministica vincolata al cite-or-refuse.

FASE 06

Citazione

La risposta viene generata con ogni frase agganciata a un passaggio di documento sorgente. Se la fonte non esiste, Lemnia lo dichiara e rifiuta di inventare.

APPROFONDIMENTO TECNICO

Cite-or-refuse pipeline a 5 step: (1) decomposizione della risposta in claim atomici; (2) substring match contro evidence set; (3) mDeBERTa-NLI per entailment verification; (4) KG-consistency check via traversal; (5) strip-and-replace per i claim non entailed. CST.82

Whitelist hedging per pack: verosimilmente, presumibilmente, si stima, pare — esenti dalla verifica entailment ma comunque limitati a paragrafi marcati come dossier hedged. Sezioni strict (dunning, preventivo, supplier-risk) non ammettono hedging.

Registro di elaborazione firmato BLAKE3 per ogni risposta. Esportabile come prova in giudizio o per il DPO. Ancoraggio normativo: Trib. Siracusa 338/2026 Art. 96 c.p.c.

§ 03ITALIANO → GRAFO → CITAZIONE

NESSUN LINGUAGGIO DA IMPARARE

IT  cosa è successo con il cliente Bianchi quest'anno?
──────────────────────────────────────────────────────
DSL
    MATCH (c:Cliente {nome: "Bianchi"})
          -[r:HA_GENERATO|HA_RICEVUTO|HA_INVIATO]-(e)
    WHERE r.timestamp >= "2026-01-01"
    RETURN e ORDERED BY r.timestamp
    LIMIT 50
──────────────────────────────────────────────────────
RISPOSTA CITATA
    «Nel 2026 il cliente Bianchi ha ricevuto 3 ordini
     (12 feb, 4 mag, 8 ago), tutti pagati. L'ultima
     fattura è del 12 nov [F-2026-247].»

Lemnia non richiede di imparare un linguaggio nuovo. L'utente scrive in italiano; Lemnia traduce in una query strutturata sul grafo, la esegue, e restituisce una risposta citata.

Il modello che effettua la traduzione gira sull'hardware dell'azienda. Niente lascia la LAN al momento dell'esecuzione.

DAL NATURAL LANGUAGE AL DSL

Il parser IT→DSL è un classifier deterministico che mappa la query in una delle 4 forme di retrieval (Timeline, MultiHopChain, Aggregate, Summary). Backbone Qwen3.5-4B Q4 per intent + slot filling, validatori algoritmici per scadenze (cf, p.iva, IBAN), fallback HITL su confidence < 0.7.

Nessuna esecuzione di codice generato dall'LLM. Il DSL intermedio è semplicemente un AST tipizzato che il graph engine esegue. L'LLM non ha accesso al disco né alla rete.

§ 04SCHEMA E-R · QUATTORDICI ENTITÀ

ONTOLOGIA GENERICA · ADATTABILE PER NICHE

Cliente

Fornitore

Prodotto

Ordine

Fattura

DDT

Pratica

Documento

Messaggio

Ticket

Dipendente

Decisione

Sede

Quattordici classi-entità di base. Ogni verticale (micro-impresa, multi-canale, studio professionale, PMI) eredita queste classi e ne aggiunge altre specifiche. Le relazioni canoniche sono circa 28; ogni arco è annotato con metadata di provenienza e cardinalità.

ESTENSIONE DELL'ONTOLOGIA PER NICHE

Lo schema base risiede in crates/lemnia-pack-business come Rust types. Ogni niche (T1-T4) può aggiungere classi via feature flag Cargo: per esempio T2 multi-canale aggiunge SkuVariante, RecensioneEsterna, Reso; T3 studio professionale aggiunge Pratica, Atto, UdienzaCalendario.

Le 28 relazioni canoniche includono GENERATA_DA, RICEVE, INVIA, MENZIONA, RISPONDE_A, CONTIENE, FATTURA_PER, COLLEGA_A. Ogni relazione carica metadata di confidenza (0-1), cardinalità (1-1, 1-N, N-N) e una citazione di provenienza puntando al source che l'ha generata.

§ 05TRE TOPOLOGIE DI INSTALLAZIONE

LOCAL-FIRST · SEMPRE

Solo

Lemnia desktop sul portatile del titolare. Modello Qwen3.5-4B in locale, ~5 GB di footprint, zero traffico in uscita al momento della ricerca. Adatto a micro-imprese, botteghe, artigiani.

APPROFONDIMENTO TECNICO

Stack: Tauri V2 + Rust workspace, llama.cpp per inferenza Qwen3.5-4B Q4_K_XL (~2.8 GB), sqlite-vec per embeddings locali. Single-user, single-tenant. Ingestion via webhook locale o polling. CST.333

Studio

Mac mini o NUC con il servizio Lemnia headless sulla LAN. Tutti i collaboratori vedono lo stesso dossier dai loro client. Le query restano sempre locali. Adatto a studi professionali e ecommerce multi-canale.

APPROFONDIMENTO TECNICO

Architettura T2: lemnia-server(binario gRPC mTLS) + desktop client tauri-business + mobile-business. Pairing iniziale via QR code, certificati tenant-scoped, ruoli RBAC eredati dal sistema d'origine. Multi-seat (default 3-10 utenti). CST.403

Sync intra-LAN, mai cloud. La modalità Pro (cloud-burst ingest) richiede consenso esplicito per batch e mantiene un audit log firmato.

PMI Sovereign

Apparecchio GPU dedicato in sede dell'azienda. L'intero stack gira sull'hardware dell'impresa. Utenti illimitati. Adatto a PMI €5-50M, 50-249 dipendenti, contesti regolamentati.

APPROFONDIMENTO TECNICO

T3 mono-tenant on-prem: server x86_64 con NVIDIA RTX 6000 Ada o equivalente, vLLM 0.19+ per modello Qwen3.6-35B-A3B-FP8 locale + DFlash drafter (2.5-2.9× speedup), Linux SEV-SNP per attestazione hardware.CST.335

Conformità: registro AVR (Authorized Vendor Register), DPIA pre-firmata per niche, esportazione automatica artefatti GDPR Art. 30. NIS2 ready: log accessi, gestione patch, separation of duties, esercizio BCP/DR.

§ 06FONDAMENTA TECNICHE

LA LETTERATURA CHE LEMNIA RIASSORBE

Lemnia non inventa una nuova metodologia. Lemnia integra il meglio della ricerca pubblicata su KG-RAG, recupero deterministico e cite-or-refuse, ottimizzandolo per il caso italiano (italiano-nativo, local-first, conforme).

RIFERIMENTI BIBLIOGRAFICI

LIGHTRAG · EMNLP 2025 · HKUDS
Doppio retrieval entità-level + relazione-level su KG locale. Lemnia adotta lo split duale ma sostituisce la generazione con cite-or-refuse 5-step.
HIPPORAG 2 · NEURIPS 2024 + ICLR 2025 · OSU-NLP
Memoria associativa con PageRank personalizzato sul KG. Lemnia riprende il PPR weighting come ranker tra hop; scarta l'agenticità.
PATHRAG · AAAI 2026 · ARXIV 2502.14902
Pruning relazionale flow-based, riduzione contesto -44% a parità di accuracy. Lemnia adotta il prune ma mantiene la generazione deterministica vincolata al cite-or-refuse.
MICROSOFT GRAPHRAG · 2024 · MSR
Comunità gerarchiche via Leiden + summarizzazione per cluster. Lemnia adotta Leiden per cluster analysis ma esclude la generazione di summary cloud-side.

CIÒ CHE LEMNIA AGGIUNGE

Italiano nativo
NER, RE e parsing addestrati su corpus italiano (business + tributario + medico). Mai inglese-via-traduzione.
Citazione obbligatoria
Pipeline a 5 passaggi: decomposizione → substring match → entailment NLI → coerenza sul grafo → strip-and-replace. Whitelist di hedging per pacchetto. Allucinazioni mai tollerate.
Locale al momento della ricerca
Cloud-burst opzionale solo per ingest pesante e generazione lunga. Ricerca query-time sempre on-prem.
Conformità incorporata
Registro firmato BLAKE3 per ogni interrogazione. DPIA pre-firmata per niche. Allegato V iperammortamento 2026 eligibile.

AI ACT ART. 50 · GDPR · NIS2 · GARANTE PROVV. 474/2025 · UE HOSTED

Richiedi un pilot →← Torna alla panoramica

PROGRAMMA FONDATORI · POSTI LIMITATI

Lemnia in funzione sui dati di un'azienda reale.

Una dimostrazione di trenta minuti, calibrata sul settore della vostra azienda. Lemnia compone la scheda di un cliente reale, cita le fonti riga per riga e presenta il registro firmato pronto per il DPO.

Richiedete un pilot→Scaricate il dossier tecnico