Harvesting vs Scraping

Harvesting vs Scraping: Costruire Entrambi i Lati in Rust con Ares e Ceres

Due progetti Rust, una divisione concettuale. Ares recupera pagine web arbitrarie e usa LLM per estrarre dati strutturati; Ceres raccoglie metadati da portali CKAN e li indicizza semanticamente. Insieme mostrano il passaggio da script di scraping a pipeline dati production-ready.

20 febbraio 2026 · 15 minuti · 3004 parole · Andrea Bozzo
Ceres Logo

Ceres: Semantic Search per i Dati Aperti

Ceres è un motore di ricerca semantico per portali CKAN. Costruito in Rust con Tokio e PostgreSQL+pgvector, affronta il gap tra come le persone cercano e come le PA nominano i dataset.

20 dicembre 2025 · 7 minuti · 1472 parole · Andrea Bozzo