From 8fa70d13005d86aec916acbd40c1dab9ec186fe8 Mon Sep 17 00:00:00 2001 From: Nulo Date: Mon, 1 Jan 2024 02:14:17 -0300 Subject: [PATCH] readme: documentar warcificator --- readme.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/readme.md b/readme.md index a27552d..4154afe 100644 --- a/readme.md +++ b/readme.md @@ -8,7 +8,7 @@ scrapeo "masivo" de precios y datos en supermercados argentinos (no hace falta correrlos porque ya hay listas armadas en [data/](./data/)) -- se usa wget (potencialmente reemplazado por algo custom en el futuro) que genera un archivo [WARC](https://iipc.github.io/warc-specifications/specifications/warc-format/warc-1.0/) con todas las paginas de productos +- [warcificator](./warcificator/) descarga las paginas de productos y genera un archivo [WARC](https://iipc.github.io/warc-specifications/specifications/warc-format/warc-1.0/) con ellas - el [scraper](./scraper/) procesa estos WARCs, extrayendo varios datos y guardandolos en una base de datos SQLite (definida en [db-datos](./db-datos/schema.ts)) - el [sitio](./sitio/) renderiza páginas a partir de la base de datos y hace gráficos lindos