preciazo/readme.md

# preciazo

scrapeo "masivo" de precios y datos en supermercados argentinos

## componentes (en orden de proceso)

- los link scrapers ([link-scrapers/](./link-scrapers/)) crean listas de links a productos para scrapear

  (no hace falta correrlos porque ya hay listas armadas en [data/](./data/))

- el [scraper](./scraper/) descarga todos los links, extrayendo varios datos y guardandolos en una base de datos SQLite (definida en [db-datos](./db-datos/schema.ts))
- el [sitio](./sitio/) renderiza páginas a partir de la base de datos y hace gráficos lindos

## setup

hay que instalar [Bun](https://bun.sh/), que lo estoy usando porque hacía que el scraper corra más rápido. quizás en el futuro lo reemplace con good old Node.js.

después, escrapea un sample de productos de Carrefour a una BD:

```
cd scraper/
bun install
bun cli.ts scrap ./data/samples/Carrefour.50.txt
```

ahora miralo en el sitio:

```
cd sitio/
bun install
bun dev
```
documentación básica fixes #4 2023-12-27 22:55:08 +00:00			`# preciazo`

			`scrapeo "masivo" de precios y datos en supermercados argentinos`

			`## componentes (en orden de proceso)`

scraper: reordenar codigo - borrar código viejo - centralizar scrapers de links 2024-01-04 21:10:02 +00:00			`- los link scrapers ([link-scrapers/](./link-scrapers/)) crean listas de links a productos para scrapear`
documentación básica fixes #4 2023-12-27 22:55:08 +00:00
			`(no hace falta correrlos porque ya hay listas armadas en [data/](./data/))`

RIP WARC 2024-01-02 03:21:21 +00:00			`- el [scraper](./scraper/) descarga todos los links, extrayendo varios datos y guardandolos en una base de datos SQLite (definida en [db-datos](./db-datos/schema.ts))`
documentación básica fixes #4 2023-12-27 22:55:08 +00:00			`- el [sitio](./sitio/) renderiza páginas a partir de la base de datos y hace gráficos lindos`

			`## setup`

			`hay que instalar [Bun](https://bun.sh/), que lo estoy usando porque hacía que el scraper corra más rápido. quizás en el futuro lo reemplace con good old Node.js.`

RIP WARC 2024-01-02 03:21:21 +00:00			`después, escrapea un sample de productos de Carrefour a una BD:`
documentación básica fixes #4 2023-12-27 22:55:08 +00:00
			```
			`cd scraper/`
			`bun install`
RIP WARC 2024-01-02 03:21:21 +00:00			`bun cli.ts scrap ./data/samples/Carrefour.50.txt`
documentación básica fixes #4 2023-12-27 22:55:08 +00:00			```

			`ahora miralo en el sitio:`

			```
			`cd sitio/`
			`bun install`
chore: no usar bun para sitio 2023-12-30 14:28:14 +00:00			`bun dev`
documentación básica fixes #4 2023-12-27 22:55:08 +00:00			```